首页 > 科技

新京报贝壳财经发布中国AI大模型测评报告宣布成立AI研究院

2024-07-03 23:11:17 记者：韦英姿罗亦丹白金蕾陈维城孙文轩编辑：王进雨

9款大模型助手在文本生成、事实核查与价值观判断、媒体信息检索、翻译四个维度的功能均处于“及格线”以上，而长文本和“大海捞针”（在长文本中寻找关键点）能力仍不理想。

贝壳财经联合北京智源研究院、中国经济传媒协会共同发布了行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》

这个夏季，新京报贝壳财经年会如约而至。

7月3日，第五届新京报贝壳财经年会“‘通’往未来向新有AI”主题论坛在北京正大中心举行。新京报社党委书记、社长汤一原，北京智源人工智能研究院院长王仲远，面壁智能联合创始人、首席科学家、清华大学计算机系长聘副教授刘知远等人出席并发言。

会上，贝壳财经联合北京智源研究院、中国经济传媒协会共同发布了行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》（以下称报告），并由汤一原宣布新京报成立人工智能研究院。

报告包含针对公众及传媒行业的调查问卷，同时从文本生成、事实核查与价值观判断、媒体信息检索等五个维度综合测评了9款大模型助手的传媒方向能力，并最终形成排名。

大模型发展远没到尽头，多模态、端侧等关键词被多次提及

“2023年之后，以大模型进入产业落地为标志，有可能推动人工智能向通用人工智能方向演进。”王仲远在主旨演讲中表示，在过去七八十年人工智能发展的历程中，可以看到每一次人工智能新浪潮的产生，都是以模型参数量、训练样本量和算力跃升带来的人工智能重大发展。

面向未来，大模型技术持续迭代演进。王仲远介绍，除了文本数据之外，视频、图像、音频可能是文本数据的十倍百倍，意味着大模型的发展远没到尽头。“视觉和多模态大模型亟待突破。”

对于大模型未来发展，刘知远则提出三大主战场。具体而言，人工智能科学化将为能力涌现等关键机制建立科学理论，科学解释人工智能形成的原理；计算系统智能化指大模型与底层芯片、操作系统、数据管理、编程开发、网络通信深度融合；领域应用广谱化指将大模型应用于高精尖制造、科学发现等高度专业化场景中。

如何发展AGI（通用人工智能）？中国人工智能学会心智计算专委会副主任委员、武汉大学教授蔡恒进在特别分享环节表示，要真正做到AGI，可能需要对大模型进行分层，每一层都由模块构成，而且模块之间满足一定的因果规律，不同模块之间也可以对齐。他还认为，AGI一定要有持续学习、举一反三的能力。

当前，北京在推动人工智能技术方面也走在全国的前列，先后设立多个人工智能产业园区和创新基地，吸引大量国内外顶尖AI企业和研究机构入驻。数据显示，北京人工智能相关企业数量约2200家，全国40%人工智能企业聚集于此。2023年，人工智能领域融资总额约223亿元，约占全国四分之一。

在圆桌讨论环节，中关村创业大街总经理聂丽霞，北京亦庄智能城市研究院集团有限公司党委副书记、总经理颜敏，北京大学人工智能研究院王选计算机研究所研究员、博士生导师赵东岩，百度智能云政务业务部副总经理梅岭，以“AI在北京”为题展开讨论，并针对人工智能在北京发展的政策、产学研优势，及未来趋势等问题提出各自的见解。

其中，对于如何更好利用AI技术服务于社会、经济以及文化发展，颜敏提到：“第一是踏踏实实找到高质量的数据；第二是踏踏实实挖掘真正的需求并且标准化；第三是踏踏实实把应用做好。”

作为大模型企业代表，商汤科技数字文娱事业部副总裁李星治也持有相似观点。他在特别分享环节谈及了大模型挖掘端侧应用的意义，并认为“端侧大有可为”。

“将模型能力移植到端侧应用，几B的模型代替上百B的，将产生更快速度等意义。”李星治说。以商汤日日新大模型为例，其功能移植到秒画APP（AI内容创作社区平台）后，生成一张512K图片仅需2秒。

如何发展端侧应用？李星治建议：兼顾更多国内主流互联网应用，上下兼容更多手机机型，对模型生产厂商来说，则是在算力平台的兼容性上向下兼容。

报告：大模型“长文本”和“捞针”能力仍不理想

活动过程中，北京智源人工智能研究院智能评测产品负责人郑靖舒，中国经济传媒协会驻会副会长、经济参考报原总编辑杜跃进，新京报贝壳财经资深记者罗亦丹共同发布了《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》。

根据报告，在总体得分上，通义千问、腾讯元宝、讯飞星火夺得前三名，其中通义千问在事实核查与价值观判断、长文本能力上均排名榜首，而讯飞星火在翻译能力上排名第一，且综合能力最强。

总体来看，9款大模型助手在文本生成、事实核查与价值观判断、媒体信息检索、翻译四个维度的功能均处于“及格线”以上，而长文本和“大海捞针”（在长文本中寻找关键点）能力仍不理想。

报告还显示，超七成传媒行业受访者在工作中使用过大模型，但仍停留在提供、梳理相关资料，查找、翻译外文资料等较为初级的工作内容。58.4%的公众受访者使用过大模型，其中，使用大模型来辅助文案生成、日程安排、邮件生成等职场技能的占比最高，超过六成。

在人工智能浪潮中，新京报社作为媒体行业的一员，始终走在前沿。媒体不仅是信息的传播者，更是时代的见证者和记录者。近年来，新京报社在人工智能领域进行了大量报道，《AI时代百模大战》《问答2023 AI十人谈》等专题均向公众传递了最新的AI动态和技术前沿。

同时，新京报社也积极探索人工智能技术在媒体行业的应用。2023年7月和2024年1月，新京报先后上线两款以记者形象作为蓝本的AI数字人——“AI小贝”和“AI小慧”，并推出《贝壳财经早报》以及《新闻8点见》数字人新闻栏目。此外，在短视频即时生成、直播间的互动交流中也开始应用AI技术。如，《动新闻》目前正在探索的AI资讯生成产品、AI媒体资源库等，以及即将投入使用的ESG垂直行业模型。

正如汤一原在致辞中表示：“（人工智能）这些技术的进步，不仅推动了百业千行的智能化转型，更逐渐成为经济高质量发展的强大增量。”

新京报宣布成立的人工智能研究院，除了日常以新闻消息、深度专题、高端访谈和监督报道持续关注国内外人工智能领域技术进程、产品模式、人事变动和商业经验外，还将联合国内外顶级智库、一线专家组成“AI30人论坛”针对人工智能领域基础理论、核心技术和行业应用展开研讨，传递行业大事与大势。同时，还将整合内部网资源持续推出产品测评、行业指数和研学课程等研究型产品。

该论坛是贝壳财经年会主题论坛之一，本届年会以“中国经济向新而行”为主题。贝壳财经年会自2020年起已经连续举办四届，每届年会都围绕经济领域的重大热点主题，邀请众多政府领导、国内外顶尖专家学者、行业领袖等为中国经济发展建言献策。从2020年到2023年，四届年会累计邀请了近300位国内外大咖，举办了49场主题论坛，微博话题阅读量10亿+，直播全平台观看量过亿，短视频播放量累计2.47亿+，图文报道阅读量累计2.08亿+。

贝壳财经是新京报旗下独立财经品牌，于2020年8月正式推出，目前贝壳财经已经形成全媒体、立体式、多元化、多平台共享分发的传播格局，拥有图文、视频、音频、数据等多类产品，全网矩阵覆盖1.8亿人次。

新京报贝壳财经记者韦英姿罗亦丹白金蕾陈维城孙文轩

编辑王进雨

校对杨许丽

143 +1

微信