北京智源人工智能研究院院长王仲远
新京报贝壳财经讯(记者陈维城)7月3日下午,在2024新京报贝壳财经年会“‘通’往未来,向新有AI”论坛上,北京智源人工智能研究院院长王仲远介绍,以2023年作为新的拐点,大模型从实验室走向产业为标志,有可能推动人工智能向通用人工智能方向演进。
“以2023年为界,过去的人工智能发展历程可以称之为弱人工智能,即人工智能只能针对特定场景,特定任务解决问题,如AlphaGo战胜世界围棋冠军,但不能解决医疗问题和自动驾驶问题。”王仲远解释。
王仲远表示,2023年之后,以大模型进入产业落地为标志,有可能推动人工智能向通用人工智能方向演进。在过去七八十年人工智能发展的历程中,可以看到每一次人工智能新浪潮的产生,都是以模型参数量、训练样本量和算力跃升带来的人工智能重大发展。
王仲远提到,过去几年,大模型的参数量迅速增长, 2020年ChatGPT3是1750亿参数,与人脑神经突触差1000倍;去年的ChatGPT4已经缩小到100倍。 大模型参数越来越接近人脑参数(神经突触)规模。
面向未来,大模型技术持续迭代演进。王仲远介绍,除了文本数据之外,视频、图像、音频可能是文本数据的十倍百倍,意味着大模型的发展远没到尽头。
针对语言大模型幻觉问题,智源研究院自主研发了通用语义向量模型BGE系列,基于检索增强RAG技术,实现数据之间精准的语义匹配,支持大模型调用外部知识的调用。
“面向未来,视觉和多模态大模型亟待突破。为了实现多模态、统一、端到端的下一代大模型,智源研究院推出了Emu3原生多模态世界模型。Emu3采用智源自研的多模态自回归技术路径,在图像、视频、文字上联合训练,使模型具备原生多模态能力,实现了图像、视频、文字的统一输入和输出。”王仲远介绍。
校对 柳宝庆