北京时间9月14日,知名人工智能华裔科学家,斯坦福大学教授李飞飞决定走出学术界的“象牙塔”,创办AI公司“World Labs(世界实验室)”。2007年,李飞飞在不被看好的情况下领导了图像标记数据集Image Net项目,并举办了大规模视觉识别挑战赛,深度学习算法从中脱颖而出,一举改变了人工智能研究的方向。也正是从ImageNet数据集起,高质量数据集对AI性能的影响开始被重视,因此,李飞飞也被誉为“AI教母”。


创办“世界实验室”后,李飞飞表示Image Net项目所聚焦的图像是二维的,而人工智能技术往后发展需要聚焦三维,因此新公司将致力于研究空间智能,她表示,这是自己“一生事业的延续”。而该公司成立后也立即受到了AMD、英特尔、英伟达三家芯片巨头旗下基金的投资,人工智能领域的一些知名人士如谷歌DeepMind首席科学家Jeff Dean和前谷歌人工智能研究员Geoffrey Hinton等的投资。


世界实验室初创团队,右一为李飞飞。(图片来源:李飞飞个人社交平台)


为什么选择空间智能?致力于解决大自然五亿年才解决的超级难题


贝壳财经记者了解到,深度学习算法的前身——卷积神经网络算法的崛起来自于2012年该算法在Image Net大规模视觉识别挑战赛中的优异表现,也正是从那时起,计算机视觉在应用端上得到了长足的进步,当前车站、机场以及手机APP上的人脸识别也正是得益于计算机视觉技术的进步。


而创立“世界实验室”则意味着李飞飞将目光投向了更长远的未来,她在社交平台写道,“在AI中,真正难以解决的问题是什么?我自己的答案是空间智能——这项技术可以赋能和实现创作、设计、学习、AR/VR、机器人等领域的无数可能用例。我和我的联合创始人以及一支由世界级图形人才组成的强大团队一起创办了世界实验室,致力于解决大自然花了五亿年才解决的这个超级难题,这真是莫大的荣幸。”


实际上,李飞飞此前就曾在斯坦福计算机视觉公开课上分析视觉简史时表示,5.4亿年前,寒武纪的物种大爆发就极有可能和当时的生物进化出了眼睛有关,“一旦你能够看到,就会变得更加积极主动,因此视觉让动物的进化加速。”


因此,“世界实验室”有着超出同类AI初创公司的野心。该公司在官网简介中写道:图像和视频模型与大型语言模型的出现预示着AI在视觉领域的潜力,但它们只是触及了可能性的皮毛,当前只是生成式AI的“第一章”。为了超越当今模型的能力,我们需要空间智能的AI,它可以对世界进行建模,并推理3D空间和时间中的对象、地点和交互。


世界实验室在成立宣言中写道:我们的目标是将AI模型从像素的2D平面提升到完整的3D世界,包括虚拟和现实,赋予它们与我们一样丰富的空间智能。人类的空间智能经过数千年的进化,但在这个非凡进步的时代,我们看到了在短期内为AI注入这种能力的机会。


贝壳财经记者注意到,该公司表示将开发空间智能大型世界模型(LWM),该模型可以从图像和其他模态中理解和推理3D世界,并“生成无限制的3D世界,创建和编辑具有物理、语义和控制的虚拟空间,它将允许任何人想象和创建自己的世界。”如果这一愿景成为现实,那实际上就是以较低的成本建设出了元宇宙。


已募资2.3亿美元 预计2025年准备好第一款产品


李飞飞是《时代》杂志2023年人工智能领域最具影响力100人之一,除斯坦福的教职之外,她还曾在谷歌云领导人工智能工作、在推特董事会任职,并曾任白宫政策顾问。


李飞飞在接受采访时表示,Image Net做的是识别物体,而世界实验室是对早期计算机视觉工作的智力延续,现在是时候进入真正困难的空间智能了,“我感觉这是我一生事业的延续,并将其扩大了一个层次。”她认为,目前为止生成式AI模型的图像和视频并没有对3D世界是如何构建的理解足够多,空间智能能力对AI解锁更广泛的推理能力至关重要,这将避免图像出现幻觉,例如错误数量的手指。


根据世界实验室官网,该公司的创立者除李飞飞外,还包括世界知名的计算机视觉和图形技术专家Justin Johnson、Christoph Lassner和Ben Mildenhall。和此前李飞飞多从学界筹集资金不同,“下海”后,迄今为止该公司已经筹集了超过2.3亿美元资金,领投方恩颐投资历史悠久,是全球风险投资行业的领袖公司之一;Andreessen Horowitz是一家位于硅谷的风险投资机构,支持大胆的企业家通过技术建设未来;Radical Ventures是加拿大风险投资机构,是一家关注AI、深度学习的早期投资机构。其他投资者则包括AI业界大咖、英伟达等芯片公司旗下的风投资金等。


“许多投资人是我多年的同事和朋友,还有我的学生,我相信他们和我有同样的想法,认为空间只能是一个大问题,需要真正有实力、有信念的人来解决,我想这就是他们支持我的原因。”李飞飞说。


据外媒报道,世界实验室希望在2025年准备好其第一款产品——能够理解3D世界并与之交互的AI模型,可以供艺术家、设计师、开发人员和工程师等专业人士使用。Andreessen Horowitz合伙人Martin Casado称,世界实验室的客户可能包括游戏公司或电影制片厂。


“我们相信现在是一个独特的时刻,快速的科学进步已经缩小了研究和应用之间的障碍。我们的目标是抓住这个机会,专注于从研究到工程到产品的整个过程。我们相信人类是好奇的和有创造力的,科学和技术都是这些冲动的表现和驱动力。利用空间智能推动AI向前发展,也将推动个人和整个人类向前发展。”世界实验室表示。


记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹

编辑 杨娟娟 校对 赵琳