新京报贝壳财经讯(记者覃澈)12月25日,贝壳财经记者从巨人网络处获悉,日前计算机国际声学、语音与信号处理会议ICASSP 2025公布论文录用名单,其中,由巨人网络AI实验室与浙江大学合作的语音研究成果入选ICASSP 2025。该成果提出了一种精准提升音频语言模型性能的创新方法,在实验结果中达到该领域最优效果。
公开资料显示,音频语言模型是结合音频处理与自然语言理解的前沿技术,旨在让机器更好地理解和生成与音频相关的内容,在智能音效生成、语音交互、语音翻译等领域具有广泛应用。
贝壳财经记者了解到,巨人网络AI实验室与浙江大学研究团队在合作论文中,提出了一种无需标注标签的多重引导提示学习方法,提升了音频分类零样本学习上的效果,为后续在视频配音任务上提供精准支持。据实验结果显示,该方法与最先进的模型相比平均准确率相对提升了4.41%,在12个任务的跨领域测试中,平均准确率也相对提升了5.33%,无论是针对域内数据的效果还是跨域的稳定性,都达到了该领域的最优效果。
编辑 李铮
校对 杨利
封图 IC photo