新京报贝壳财经讯(记者罗亦丹)1月15日,贝壳财经记者获悉,逻辑智能发布了AudioX-Thai语音大模型。


据了解,受限于泰语独特的规则,有关泰语的语音模型工作一直进展缓慢,泰语语音合成难度较大。目前市面上的泰语语音模型技术,大多缺乏感情与表现力,且均不支持声音克隆,难以满足日益增长的市场需求。


在这样的情况下,AudioX-Thai语音大模型在10万小时的泰语语音数据集上进行训练,具有高情感表现力,仅需要10秒的参考音频,就可以克隆参考音频音色,为泰语语音合成领域带来了新的突破。


泰国是东南亚AI领域 “桥头堡”,根据该国制定的《国家人工智能发展战略》,其目标是到2027年发展成为东南亚人工智能中心。英伟达、谷歌、亚马逊等AI巨头也宣布将在泰国投资。


而AudioX-Thai具有支持泰英混读的能力,即使文本中包含英语,也能够流畅合成,这无疑为各类AI应用软硬件在东南亚多语言环境下的拓展提供了更广阔的空间。


目前,登录逻辑智能官网:https://luoji.cn/,点击泰语男声,即可试用生成效果。


校对 柳宝庆