头条广大

当前位置: 首页 · 头条广大 · 正文

头条广大

教育部发布会聚焦推进语言文字信息化发展 我校语言文字信息化科研工作获肯定
来源: 作者: 编辑:梁钰铃 审核:吴谦 发布日期:2025/04/01

3月31日,教育部召开新闻发布会,介绍深入贯彻落实《教育强国建设规划纲要(2024—2035年)》、推进语言文字信息化发展情况。发布会上,广东省教育厅副厅长朱建华介绍了广东省以数字化注入新动力全面赋能强省建设的举措和成效。其中,广州大学若干工作获得肯定,一是坚持国家重大需求牵引广州大学国家语言服务与粤港澳大湾区语言研究中心承建国家语言资源服务平台;二是坚持释放语言文字数据要素价值在广州大学设立粤语语料库建设与大模型评测重点实验室。

为贯彻落实《教育强国建设规划纲要(2024—2035年)》,近日教育部、国家语委、中央网信办共同印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,部署应用关键新技术,构建资源数据新体系,实施赋能全局新行动,全力服务教育强国、科技强国和文化强国建设,为以中国式现代化全面推进强国建设、民族复兴伟业贡献力量。发布会上,教育部语信司司长刘培俊介绍推进语言文字信息化发展和数字中文建设有关情况,语用司副司长王晖介绍了数智赋能语言文字高质量发展有关情况,广东省教育厅、北京师范大学、北京大学分别介绍了各自的工作经验。

   广州大学:“国家平台+前沿技术+区域深耕+文化传承”四维发力    构建语言文字信息化工作大格局

长期以来,党中央高度重视语言文字工作。习近平总书记指出,“语言是人类交流思想的工具、传承文明的载体、增进理解的桥梁。中文承载着中华民族数千年的文明智慧,是中国贡献给世界的重要公共文化产品。”当前,语言文字作为教育资源、科技资源、文化资源、经济资源、安全资源和战略资源的功能作用更加突出,语言文字服务经济社会发展的数据要素价值更加显著,语言文字事业的基础性、全局性、社会性和全民性特点更加鲜明。

我校高度重视语言文字信息化工作,主动融入国家语言文字事业格局中,发挥了积极作用。近年来,依托国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心,在教育部语言文字信息管理司、省教育厅等上级部门的领导和指导下,广州大学以服务国家大局、聚焦科技前沿、面向区域发展为根本宗旨,从“国家平台+前沿技术+区域深耕+文化传承”四维发力,初步构建了集平台、语料库、大模型、在线系统于一体的语言文字信息化工作建设格局。

一、服务国家大局,建设国家语言资源服务平台

服务教育数字化战略行动,助力教育强国建设,受教育部语言文字信息管理司委托,广州大学与华中师范大学、国家开放大学共同承担国家语言资源服务平台维和管理任务。平台以推动语言文字信息化发展为目标,按照“应用为王、服务至上、示范引领、安全运行”的工作要求和思路,面向教育教学、科学研究、文化传承、社会应用中急需的语言文字需求,坚持“开放、共享、智能、服务”建设理念,整合优质语言资源和数字化语言服务,面向社会提供数字化规范化高质量的语言服务,旨在打造国内汇聚最多语言资源的权威网站、国家语言服务能力建设的示范平台。

目前国家语言资源服务平台汇聚了300余项优质资源,涵盖公共语言资源、语言教育资源、语言文化资源、语言数据资源、语言技术工具、语言知识资源、语言翻译资源、语言书刊资源等8大类,32小类的数字语言资源;建设了24个语言服务,包括语言规范、语言翻译、汉字信息、应急语言、精品字库、手语盲文、语言教育、普通话测试、中华优秀语言文化、中华思想文化术语、汉字简繁转换、冬奥系列语言服务等多种类型。平台将通过组织开发、征集遴选、集成汇聚等方式,多渠道建设多模态的优质语言资源,促进多元融合与共建共享。国家语言资源平台建设实现了数字化语言资源和语言服务从“分散供给”到“系统化赋能”的跃升,成为国家语言治理现代化的重要抓手。平台入选2024年度“国家语言文字科研成果转化优秀案例”。

立足区域特色,建设粤语语料库建设与大模型评测重点实验室

广州市社科联、广州大学牵头建设粤语语料库建设与大模型评测重点实验室。重点实验室的核心任务是建设面向全球、体现粤语文化特色、大规模、多模态、高质量标注、安全可信、人工智能友好的新型通用粤语语料库,即国家倡导的新型语料库。

重点实验室将致力于建成面向人工智能应用的粤语文化数据资源基础设施以及面向人工智能粤语服务的内容安全合规评测中心,为粤语的数据化、资源化、服务化和产业化助力。依托新型粤语语料库可为粤语语言研究、语言教学、语言智能应用等多种用途领域提供坚实的数据支撑。重点实验室将对粤语文化精神标识体系研究,通用粤语语料库建设,大模型粤语交互质量评测,大模型粤语言语交互质量提升研究四个方向开展重点研究。

聚焦科技前沿,研发国家语言服务大模型

广州大学团队参与了依托香港科技大学(广州承担的国家语委重大科研项目“基于国家语言服务大模型的国家语言资源服务一体化平台建设”,香港科技大学(广州)、广州大学和华中师范大学等广东省高校,致力于探索人工智能与语言文化融合,结合技术发展与社会需要,汇聚以语言大模型为载体的新型语言技术工具,联合训练国家语言服务大模型。

目前国家语言服务大模型部署在香港科技大学(广州)服务器上,采用混合专家模型策略与架构,融合了包括 Deepseek-R1(671B)、通义千问、llama3等在内的各类大模型底座。该大模型架构集成了国家语言资源服务平台的各类资源和知识源,能够实现服务资源的跨平台联动,自动针对不同的服务请求进行智能路由,精准定位语言服务与数据源,并能对模型输出进行推理与溯源,确保回答准确性与专业性。此项工作作为深化语言文字与信息技术融合的典型案例,也在发布会上受到肯定。

数字赋能文化传承,建设“语文教材中华优秀传统文化元素标注系统”

依托广州大学承担的教育部哲学社会科学研究重大课题攻关项目“中华优秀传统文化在语文教材中的传承研究与数据库建设”,初步建成“语文教材中华优秀传统文化元素标注系统”。

系统从教材语料、表现属性、文化元素、载体形式等维度对中小学语文教材进行元素标注,通过语言模型智能检索、提取信息的功能与教材研究有机结合,为更好综合运用中小学语文教材中的中华优秀传统文化元素,更有效促进中华优秀传统文化传承与发展提供了有力支撑。

下一步,广州大学将充分借助大模型与跨学科融合,持续深化“政产学研用”协同创新,在上述四个方面继续深耕,致力于打造语言信息化领域的“湾区样板”,助力教育强国与数字中国建设。



上一条:校党委理论学习中心组(扩大)学习会召开 专题学习习近平总书记系列重要论述
下一条:利物浦大学代表团来访我校

广州大学版权所有  COPYRIGHT©1999-2016,   GUANGZHOU  UNIVERSITY   -联系我们-网站地图  粤ICP备 05008855号