千亿参数!藏语基座大模型“阳光清言”拉萨发布|小s货边洗澡边c你
11月19日,千亿参数级藏语基座大模型“阳光清言”V1.0 研发成果在西藏拉萨发布。该模型的训练数据使用了约288亿token高质量藏语数据,包括藏语单语数据、汉藏及藏英平行语料、汉藏双语辞典条目等,内容涵盖新闻、法律、医学、哲学、教育、文化和科学技术等多个领域。
据悉,该款模型能够处理复杂的语言结构和多领域知识,具备深度的藏语语义理解与生成能力,问答自然流畅、生成明晰准确,在藏语智能问答、文本生成、机器翻译等领域有着优异的表现。可广泛应用于边疆治理、文旅、绿色能源、农牧科研、教育、文化、藏医药与高原健康等领域相关大模型研发,将为边疆数智治理、民生服务、产业赋能等关键技术突破提供支撑。(记者 贡桑拉姆)
xianxianyangjichangT5,yubeijingdaxingjichang、chengdoutianfujichanghangzhanloumianjixiangdang。sanzuojichangzhongguimozuixiaodelanzhouzhongchuanjichangT3,mianjiyexiangdangyushanghaihongqiaojichangliangzuohangzhanlouzhihe。西(xi)安(an)咸(xian)阳(yang)机(ji)场(chang)T(T)5(5),(,)与(yu)北(bei)京(jing)大(da)兴(xing)机(ji)场(chang)、(、)成(cheng)都(dou)天(tian)府(fu)机(ji)场(chang)航(hang)站(zhan)楼(lou)面(mian)积(ji)相(xiang)当(dang)。(。)三(san)座(zuo)机(ji)场(chang)中(zhong)规(gui)模(mo)最(zui)小(xiao)的(de)兰(lan)州(zhou)中(zhong)川(chuan)机(ji)场(chang)T(T)3(3),(,)面(mian)积(ji)也(ye)相(xiang)当(dang)于(yu)上(shang)海(hai)虹(hong)桥(qiao)机(ji)场(chang)两(liang)座(zuo)航(hang)站(zhan)楼(lou)之(zhi)和(he)。(。)