当前栏目:首页> 学术园地
中国古籍
 

荀子古籍大语言模型发布会举办

 

       近日,南京农业大学国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”课题组的荀子古籍大语言模型发布会暨古籍智能化研究与产业应用研讨会,在古联(北京)数字传媒科技有限公司举办。

       荀子古籍大语言模型是由南京农业大学王东波教授为首席专家的国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”,课题组联合中华书局古联公司,为时数月研究推出了荀子古籍大语言模型,该模型是一款专门用于古籍信息处理的基座模型、对话模型与智能代理为主要目标的开源的、公益的古籍大语言模型。

       王东波认为,尽管目前已有200多个通用模型在各领域得到应用,但古籍领域仍缺乏专业的大语言模型。他提出需要构建一个支持二次开发的基础大模型,同时构建专门针对古籍领域的对话大模型,以应对这一挑战。他简要介绍了荀子古籍大语言模型评测主流大语言模型古籍处理能力,构造模型训练数据,以及古籍大模型训练过程和表现效果。他认为,模型的构建受算力、场景应用等多方影响,精准度较高的优质数据是最为关键的,在这方面借助南农的学术能力与古联进行深度合作,可以推动大模型的研发与应用。

       中华书局古联公司总经理洪涛分享了在古籍智能化领域的探索历程,介绍了古联公司的多方经验,对于利用古籍大模型进行辨残补缺优化OCR、自动标点、自动翻译、自动注释、自动生成主题词与摘要、自动构建古籍知识库等系统能力做了分析。除了在专业领域推动古籍整理、古籍数字化、古籍利用与传播,洪涛也分析了大模型在大众领域的应用前景,比如通过实现基于“中华经典古籍库”的语义检索和回答,让大众用户能够顺畅地利用古籍的内容。古籍大模型还可以用于AI写作、AI教学、数字文娱等。

       随后,来自高校、出版界和互联网头部企业的与会专家学者分别立足于各自领域,围绕大模型在古籍整理、研究和普及等方面展开了热烈的探讨,就大模型在古籍整理、传统文化传承、数字化转型和技术挑战等方面进行了深入探讨。

       目前,作为开源的、公益的研究成果的荀子古籍大语言模型已在GitHub、ModelScope等网站开源,用户可自行下载使用。此次会议,是南京农业大学古籍大语言模型研发团队和中华书局古联公司合作探索古籍大语言模型的第一步。未来,古联公司将基于百亿级古籍大数据,着手研发下新一版商用古籍大模型,为古籍智能整理、大众传播的产业应用提供强大的技术支持,推动古籍事业的新发展。

来源:央广网
(如本站发布的文章涉及版权等知识产权问题,请致电010-6303 6548或136 8150 6222,我们将尽快删除,坚决维护您的合法权益。)
 
copyright © 中国收藏家协会 协会网站:京ICP备09066346号 京公网安备110108006117号

制作单位:中国收藏家协会书报刊分会