在中国多语言环境中,方言的保护和智能识别技术的发展成为了社会关注的焦点。近期,中国电信人工智能研究院领先业界,推出了支持30多种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。这一技术的发布,不仅为方言使用者提供了更加便捷的智能服务,也为方言的保护和传承开辟了新途径。
方言,作为地域文化的重要组成部分,承载了丰富的历史与文化价值。随着社会经济的快速发展,许多地方语言正面临着消亡的风险。中国电信人工智能研究院的这项创新不仅解决了方言用户在智能服务中的障碍,还有助于方言的数字化保护和传播。
据了解,传统的方言研究往往依赖于人力资源进行调查和标注,这不仅工作量巨大,而且难以实现系统化的整理归纳。AI技术的介入使得方言的采集、记录和归纳工作变得更加高效和系统化。中国电信人工智能研究院所构建的超30种,超30万小时的高质量方言数据库,不仅在丰富性上位居业内前列,更在质量上有了保障。
星辰语音大模型的研发团队在李学龙院长的带领下,自主创新,开发了支持30种方言混说的语音识别技术。这一技术的推出,意味着用户无需切换至普通话,便能与智能系统自然沟通。此外,该团队还首创了“蒸馏+膨胀”联合训练算法,解决了在大规模数据集和参数条件下,模型训练难题,实现了模型稳定训练。
在国际领域,星辰语音识别大模型的表现也可圈可点。在INTERSPEECH2024离散语音单元建模挑战赛中,TeleAI的语音团队凭借其领先技术获得了语音识别赛道的冠军。在多方言语音识别数据集KeSpeech任务上,星辰语音大模型的字准确率达到了92.97%,刷新了业内最优结果。
中国电信作为央企,秉承责任,将AI技术应用于服务用户,尤其是老少边穷地区及很多老人,让他们也能享受AI时代带来的便利。星辰语音大模型的应用落地已经成为现实,它已经在中国电信万号智能客服试点运行,有效提高了服务效率。此外,智能客服翼声平台和多地市的12345平台也接入了星辰大模型,让客服人员能够秒懂30种方言,提升了服务水平。
星辰语音大模型还在中国国际大数据产业博览会上大放异彩,其技术让数字人“数数”能够自然流畅地进行中英文交流对话,深受好评。值得一提的是,该模型现已对外开源,意味着更多的合作伙伴和个人开发者可以共同参与到方言保护和语言文化传承的事业中。
中国电信人工智能研究院未来的计划是持续深耕研发创新,扩大支持方言的数量和准确度,并计划建成首个覆盖全国333个地市方言和主要少数民族语言的语音识别大模型。这不仅是对方言用户的服务升级,也是对中国语言多样性保护的有力支撑。
总结来说,星辰语音大模型的发布,标志着方言智能识别技术的一大进步,也是对我国语言文化多样性的一种保护和推广。随着AI技术的不断进步,未来方言用户将更加便捷地享受到智能化服务,而方言作为文化遗产的保护也将得到切实有效的加强。