• 最近访问:
发表于 2025-07-29 13:42:00 股吧网页版
小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!
来源:第一财经 作者:钱童心

  “巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

  翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

  在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

  专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

  塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Deli教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

  “语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Deli表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

  匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,是构建可信大语言模型的关键。他希望能与中国AI同行合作,构建语言模型的评估框架,实现从训练、语料建设到实际应用的完整闭环。

  以色列人类语言技术协会(IAHLT)创始人兼董事Avner Algom以希伯来语为例称,希伯来语虽是世界上唯一被成功复兴为现代口语的古老语言,但在自然语言处理领域仍属低资源语言。

  Algom强调:“语言服务不能只为大语种设计,小语种也应拥有技术平权。”IAHLT基于开源模型,已训练出双语大模型(希伯来语+英语),并部署于教育、客服、医疗等场景。通过政府财政激励机制,联合产业界解决数据获取合法性、训练成本和落地门槛问题。

  科大讯飞研究院院长刘聪在研讨会上表示,科大讯飞最新升级的星火大模型X1已经可以支持超过130语种,希望与来自全球的机构合作,构建全方位的多语言大模型和应用,为世界提供“中国方案”,破解全球多语言大模型技术难题。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500