语言文学学术全文本大语言模型发布-新华网
新华网 > > 正文
2024 06/27 18:31:32
来源:新华网

语言文学学术全文本大语言模型发布

字体:

  近日,第六届中国高校外语慕课联盟大会在北京举行。大会上发布了语言文学学术全文本大语言模型。该模型是由南京理工大学经济管理学院信息管理系沈思副教授团队与外研社期刊出版分社社长孙凤兰编审团队共同研发,以学术研究和教学为目的,针对外语教学与研究过程中的重点、难点,结合大语言模型技术而推出的。

  在语言文学领域,高质量和大体量的专业数据是成功训练模型的前提,如何获取并处理这些数据,不仅要求技术的精确性,还要求对领域知识具有深刻理解。为了确保大语言模型能够精准地理解和生成语言文学领域的内容,研究团队从全球顶尖期刊和重要图书中收集数据,经过筛选和处理,这些数据不仅涵盖了语言学、文学、翻译等多个子领域,还包含了案例研究和实证分析,为模型提供了丰富的学习材料。

  在大量开源语言模型中,选择一个合适的基座模型至关重要。研究团队建立了一个评价体系,专门针对语言文学领域的需求,通过评估多个开源模型的表现,最终选择了Qwen大模型作为基座模型。基于基座模型,研究团队进一步开发了对话模型,旨在使技术更加贴近用户需求。这个模型能够处理包括文本翻译、术语解释、知识问答等在内的多种语言文学领域任务。

  面向语言文学领域的大语言模型构建是人工智能时代语言文学领域与人工智能技术深度融合的基础工程,是推动外语教学、研究工作从数字化向智能化转型的必要条件。未来研究团队,一方面将持续对现有模型进行迭代更新,提升模型性能,对模型目前仍然存在的幻觉问题、资源消耗问题进行深入探讨和解决;另一方面,将深入挖掘外语教学与科研过程中的现实问题与解决措施,通过结合RAG(检索增强)、AIAgent(人工智能助理)等技术,切实解决外语教学与科研过程中的重要问题,实现人工智能技术在外语教学与科研工作中的全面落地。

  语言文学领域大语言模型不仅代表了人工智能与语言文学的深度融合,还标志着外语教学和学术研究向智能化的转变。通过持续优化模型并探索新的技术解决方案,期待在未来进一步提升外语教学的效率和质量,同时,也希望能够解决更多科研过程中遇到的实际问题,真正实现人工智能技术在教学和研究中的广泛应用。(外语教学与研究出版社张小玉)

【纠错】 【责任编辑:刘勉】