XunziALLM:为响应古籍活化利用号召,推动大语言模型与古籍处理深度融合,以古籍智能化的研究为目的,南京农业大学国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”课题组与中华书局古联公司推出了一系列古籍处理领域大语言模型:荀子古籍大语言模型。

荀子系列专为古籍智能处理而设计,这一系列模型的推出将推动古籍研究与保护工作的新发展,提高中华传统文化传承的效率与质量。

模型亮点:
古籍智能标引,荀子模型具备强大的古籍文献标引能力,能够对古籍中的内容进行高质量主题标引,帮助研究人员快速了解文章主题。

古籍信息抽取,荀子模型能够自动从古籍中抽取关键信息,如人物、事件、地点等,大大节省了研究人员的信息整理时间。

诗歌生成:荀子模型还具备诗歌生成的能力,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感。

古籍高质量翻译:对于那些难以理解的古籍文献,荀子模型能够提供高质量的翻译服务,帮助研究人员更好地理解原文含义。

阅读理解:荀子模型能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读。

词法分析:荀子模型可以完成古籍文本的自动分词和词性标注,能够有效提升语言学工作者的研究效率。

自动标点:荀子大模型可以快速完成古籍文本的断句和标点,提升研究者以及业余爱好者对古籍文本的阅读体验。

用户也可以根据自己的需求,使用本地的训练语料微调荀子基座模型,使得其能够在古籍下游处理任务上取得更佳的处理性能。| #古籍
发布国家图书馆藏善本和普通古籍、法国国家图书馆藏敦煌遗书、天津图书馆藏普通古籍、日本永青文库捐赠汉籍、云南省图书馆善本古籍、芷兰斋藏稿抄校本等古籍影像资源,总量超过3.3万部。

中华古籍保护网 | #古籍
唐河图书馆典藏古籍 | #古籍

分享国家、河南省珍贵古籍。还有部分古籍修复,可用手机扫码在线观看。
在线阅读典籍并对应翻译,目前有《史记》、《资治通鉴》、《三国志》、《战国策》等等,可标记书签、评价和单字单词解释

读典籍 | #古籍 #电子书
文言文(古文)-现代文平行语料, 国内一位开发者在 GitHub 上开源的,基本涵盖了大部分经典 #古籍 著作。

原始爬取的数据是篇章级对齐,经过脚本分句以及人工校对,形成共计约 96 万句对,source 下为文言文,target 下为现代文,文件内容按行对齐。

其中,短篇章中包括了《论语》、《孟子》、《左传》等篇幅较短的古籍,已和《资治通鉴》合并。
“吾与点”古籍自动整理平台是由北京大学数字人文研究中心与中文在线集团元引公司联合开发的智能化 #古籍 整理平台。该平台将提供图片文字识别、自动句读、命名实体识别三项基本古籍整理功能。目前提供公开测试的是自动句读功能,自动标点、图片文字识别、命名实体识别功能将会陆续开放测试。

用户可以直接将要处理古文本粘贴到左侧的待处理文本框中,也可以直接上传待处理的文本文件(txt格式)。处理结果直接显示在右侧的结果页面,也可以将处理结果下载到本地保存。目前测试版限定粘贴的文本字数不超过8000字,上传文件大小不超过2万字。

文本上传完成后,点击“运行”按钮,几秒钟即可看见自动处理的结果。若有多个用户同时使用系统,系统会将当前用户提交的任务放入待处理队列中。用户可对自动句读的结果进行修改,修改之后的句读标识为红色。
中华经典古籍库(镜像版)是专业、权威的大型古籍整理本全文 #数据库 ,由中华书局负责建设和开发。通过服务器镜像安装的形式为用户提供服务,主要面向机构进行销售,目标用户群体为中国传统文化领域的专业研究者。

为向党的百年华诞献礼,中华经典古籍库将通过“百佳数字出版精品项目献礼建党百年专栏”,精选300种优秀 #古籍 整理成果组成专库,面向公众限时免费开放
江西省图书馆古籍库注册账号即可浏览,有不少珍贵 #古籍 ,宋元本都有 #图书馆
由韩国国立中央图书馆(NLK)与日本国立国会图书馆(NDL)联合建构的东亚数字图书馆(East Asia Digital Library,EADL)于12月17日开放使用。本资料库现有两馆收藏的古书典籍共8000件,可透过书名、关键词、作者、主题等方式检索。除日、韩两国的资料外,今后也将预计整合东北亚如中国大陆、蒙古的藏品,并邀请藏有东北亚资料的欧、美图书馆共襄盛举。 #古籍
全宋文》esne #电子书
共360册,全书收文17万余篇,作者近万人,是迄今篇幅最大字数最多的宋代文章总集,也是规模最大的 #古籍 整理项目
 
 
Back to Top