智达藏语大模型及系列应用产品在北京正式发布 以数字智能赋能民族语文事业高质量发展
4月22日上午,藏语智能全国重点实验室自主研发的智达藏语大模型及系列应用产品在北京正式发布。该模型基于全面国产基础架构优化,适配国产AI芯片与分布式推理架构,实现核心环节自主可控。
“智达AI”以多语种大模型为统一底座,系统整合2024年发布的6款基础应用与全新智能模块,构建“1个核心大模型+8大场景应用”协同软件矩阵,涵盖智达翻译、语音翻译、文字识别、智能图译、AI词典、文献检索、有声听书、智能藏医辅助等功能,同步推出面向媒体、政务领域的数字播报、字幕转写等行业应用产品。大模型突破跨模态深层感知技术,打通图、文、音多模态壁垒,支持三大藏语方言自动识别和无缝交互,可精准解析多语混排复杂文档。
针对藏语低资源、多方言数据处理难题,研发团队搭建汉藏英多语种大模型底座,建成150GB高质量藏文文本语料库、8700万句对多语言平行语料库、3万小时多方言语音数据集,创新实现跨语言知识双向迁移,打破传统机器翻译单向对齐的局限,推动现代科学与民族优秀传统文化深度交融。
藏语承载着中华民族宝贵的文化遗产,是藏族群众生产生活交流的重要工具。长期以来,藏语智能化发展中面临“数据少、算力弱、人才缺”的瓶颈制约,一定程度上影响了涉藏地区的数字化、智能化进程。智达藏语大模型具备强大的藏语语义理解与生成能力,同时支持中、英等多语言交互,可实现藏语与其他语言的实时翻译、语音转写、智能问答等功能,为涉藏地区政务、教育、医疗、文化等领域的智能化转型提供坚实技术支撑。
此次发布的智达藏语大模型,是青海师范大学、西藏大学、南京邮电大学联合共建的藏语智能全国重点实验室在大模型领域创新成果的集中体现。目前,智达藏语大模型核心引擎智达大模型已通过国家网信办《生成式人工智能服务管理暂行办法》备案,标志着青海省首个大模型正式进入公开测试与场景试点阶段。
随着模型的持续优化和推广应用,它将成为连接民族地区与外界的“智能桥梁”,为我国涉藏地区长治久安和高质量发展注入强劲数字功能。
(省少数民族语言文字工作中心)