北京大学开放2200余部数字古籍,读者可免费在线阅读
北京日报
2024-01-11 16:51:54

原标题:北京大学开放2200余部数字古籍,读者可免费在线阅读

北京日报客户端 | 记者 何蕊

进入文本阅读平台,古籍原本影像和数字化文本相互对照,点击生僻词句还能查看出处和翻译。记者从北京大学获悉,由该校主建的古籍数字化平台“识典古籍”正在进行资源更新扩充工作,目前该平台已汇集2200余部古籍,免费为读者提供在线检索和阅读古籍服务。

“平台古籍资源的更新扩充,就是把一本古籍从纸页‘搬’到网页的过程,分图像化和文本化两步走。”“识典古籍”项目负责人、北大数字人文研究中心主任王军介绍,团队与海内外古籍收藏单位合作,广泛收集古籍数字化图像资料,再利用人工智能技术对古籍文字进行识别、排序、校对、结构整理等工作,对内容作精细化处理。

目前,平台已收录《周易》《左传》《礼记》等2200余部古籍的数字化资源。这些古籍陈列在“识典古籍”平台首页上,随意点开一本,章节目录位居左侧,正文在右侧,排版形式既顺应现代人的阅读习惯,又还原了古籍纸张的阅读美感。其中,《永乐大典》是备受关注的“大部头”。它是我国古代规模最大的类书,汇集先秦至明初各类典籍,但几经散佚,副本存世不及原书的4%。如今,《永乐大典》高清影像数据库(第一辑)已经在“识典古籍”平台上线,读者足不出户就能阅读到珍贵文献。

“‘识典古籍’还增加了简繁体转换、底本影像对照、全文检索等便捷功能。”王军说,平台主要应用了文字识别、自动标点和命名实体识别这3种技术,不仅能将影印本上的文字提取整理,还能通过序列标注识别文本中的人名、地名等信息,准确率超96%。下一步,“识典古籍”将陆续完成一万部古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍。

相关内容

热门资讯

未来三年销售目标突破千亿元!京... 上证报中国证券网讯(记者 刘暄)京东与荣耀4月2日签署战略合作协议,明确未来三年荣耀在京东全渠道销售...
我国科研人员发现99个新物种 我国科研人员发现99个昆虫新物种 为青藏高原生物多样性再添新证 4月1日,我国科研人员在国际动物分类...
兴源自动化取得电芯高效测漏设备... 国家知识产权局信息显示,惠州市兴源自动化设备有限公司取得一项名为“一种电芯高效测漏设备”的专利,授权...
量旋科技完成6亿元C+轮融资 ... 本报讯 (记者张敏)4月3日,深圳量旋科技有限公司(以下简称“量旋科技”)宣布完成6亿元C+轮融资。...
李云泽:推动构建与未来产业全生... 上证报中国证券网讯 据金融监管总局4月3日消息,4月1日,金融监管总局举办党委理论学习中心组集体(扩...