千亿级参数藏语基座大模型“阳光清言”研发成果在拉萨发布|天码AV无码一区二区三区四区
中新社拉萨11月19日电 (记者 贡桑拉姆)“阳光清言”藏语大模型研发成果19日在西藏拉萨市正式发布。目前,研究团队已按照国家相关法规推进模型备案工作,待完成后将正式上线面向社会服务。
“‘阳光清言’藏语大模型V1.0是一个千亿参数级的藏语大模型。”中国工程院院士、西藏大学教授尼玛扎西介绍,此款藏语大模型的训练数据使用了约288亿token高质量藏语数据,包括大规模句子级和篇章级的藏语单语数据、汉藏和藏英平行语料、汉藏双语辞典条目等,内容涵盖新闻、法律、医学、哲学、教育、文化和科学技术等多个领域。
尼玛扎西说,这款模型能够处理复杂的语言结构和多领域知识,具备深度的藏语语义理解与生成能力,问答自然流畅、生成明晰准确,在藏语智能问答、文本生成、机器翻译等领域有着优异的表现。
“‘阳光清言’藏语大模型除了具有藏语能力,还有更为强大的汉语能力。”西藏大学信息科学技术学院副教授、尼玛扎西院士团队成员洛桑嘎登称,作为基座模型,“阳光清言”藏语大模型可以广泛应用于边疆治理大模型、西藏文旅大模型、西藏绿色能源大模型、西藏农牧科研大模型、西藏教育大模型、西藏文化大模型和藏医药与高原健康大模型等研发。
他说,该模型重点解决边疆数智治理过程中的语言技术支撑能力、基于大模型的市域和区域治理能力、基于大模型的民生服务能力、AI赋能文化旅游产业能力、AI赋能高原科学技术研究、清洁能源开发利用智能化等关键技术。
据悉,西藏大学尼玛扎西院士团队与北京智谱华章科技有限公司联合开展了藏语大模型研发工作,旨在推动藏语智能技术的国际话语权,同时为西藏的长治久安和高质量发展提供技术支持。(完)
yixianxianyangjichangweili,kuojianhouyongyou4zuohangzhanlou,hangzhanloumianjigaojuguoneiqian5。danxianxianyangjichangqunianlvketuntuliangpaizaiquanguodi11wei,xianqunianGDPjinpaizaiquanguodi21wei。以(yi)西(xi)安(an)咸(xian)阳(yang)机(ji)场(chang)为(wei)例(li),(,)扩(kuo)建(jian)后(hou)拥(yong)有(you)4(4)座(zuo)航(hang)站(zhan)楼(lou),(,)航(hang)站(zhan)楼(lou)面(mian)积(ji)高(gao)居(ju)国(guo)内(nei)前(qian)5(5)。(。)但(dan)西(xi)安(an)咸(xian)阳(yang)机(ji)场(chang)去(qu)年(nian)旅(lv)客(ke)吞(tun)吐(tu)量(liang)排(pai)在(zai)全(quan)国(guo)第(di)1(1)1(1)位(wei),(,)西(xi)安(an)去(qu)年(nian)G(G)D(D)P(P)仅(jin)排(pai)在(zai)全(quan)国(guo)第(di)2(2)1(1)位(wei)。(。)