2023年下半年以来,国内大模型的竞争由比拼技术参数到比拼应用落地。“百模大战”进入第二幕,应用为王成为行业共识,落地才是赛点,本次“双十一”也成为了大模型商业化落地的试金石。
在大模型商业化落地后的首个双十一,科大讯飞率先交卷,据科大讯飞双十一战报显示,讯飞AI硬件销售额同比增长126%。同时,在星火认知大模型的加持下,智能办公本、翻译机、录音笔、学习机、智能助听器等产品继续保持高质增长,并拿下京东&天猫7个品类销售冠军。
科大讯飞双十一官方数据
这也是继科大讯飞发布星火大模型V3.0后,向大众交出的一份大模型落地战绩答卷,星火大模型落地能力凸显,正在加速“人人都有AI助手”时代的到来。
这也成为今年双十一的新看点:大模型加持的智能硬件也正在成为C端爆款。
大模型加持,讯飞AI硬件同比增长126%
今年科大讯飞在布局星火大模型的同时,不断将大模型落地到智能办公本、AI学习机等产品中,以此来提升用户的产品体验,获得了用户的认可。这也体现在此次双十一大促中。
科大讯飞AI办公产品
具体来看,AI办公产品领域,智能办公本连续3年获得京东&天猫全周期销售额冠军;翻译机连续7年获得京东&天猫全周期销售额冠军;AI学习产品领域,AI学习机获得京东&天猫全周期销售额冠军;AI医疗领域,智能助听器获得京东&天猫全周期销售额冠军。
销量快速增长及多品类销冠印证了在星火大模型加持下,讯飞AI硬件产品焕发出的产品力和生产力。
以讯飞智能办公本为例,今年8月9日,搭载了星火认知大模型的智能办公本X3全新发布,在硬件、语音转写、AI大模型应用、个人日程管理等多个方面均实现了重大升级。
据了解,有了星火大模型的能力加持,X3不仅支持语篇规整,对口语化文本进行书面化规整,还能够根据会议转写文本及手写内容生成会议纪要,大大提高办公效率。星火大模型V3.0的开放式对话问答能力,也在智能办公本X3上得到了深度应用:用户能够以手写或语音输入的方式与星火大模型进行问答,根据用户需求,星火大模型可以自动生成相关文本,帮助用户高效获取信息、知识及灵感,成为职场人省心且好用的AI助手。
另一王牌产品讯飞翻译机也因星火大模型的加持焕发生产力:讯飞翻译机新增AI口语功能,可实现AI一对一口语对话,得益于讯飞星火V3.0在语言理解、知识问答及多模态能力等方面的持续提升,翻译机可提供73个场景话题涵盖日常生活、求职面试、商务交流等方方面面;翻译机不仅是你的“翻译官”,还是你的“口语老师”,真切提升产品的价值。
正是智能AI硬件+星火大模型的黄金组合,让以讯飞智能办公本及翻译机等为代表的AI产品在战况激烈的双十一大促中杀出重围,夺得多品类销量冠军。讯飞AI智能产品持续受用户追捧,C端消费者用户开始为“大模型”买单。
C端用户开始为大模型买单 大模型商业化落地打响
当前,业界认为大模型达到ChatGPT的能力时就具备商业化能力,而本次双十一,星火大模型加持的产品受到了用户青睐,或许就是这一观点的佐证。
对于星火大模型的能力,今年8月,讯飞星火认知大模型参与中国信通院组织的可信AI大模型标准符合性验证,顺利完成模型开发和模型能力两大模块验证,并获得当前模块4+级最高评分。
而今年10月24日,科大讯飞正式发布星火大模型V3.0,进一步升级了主动式对话、AI人设等功能,意图打造每个人的AI助手。据国务院发展研究中心国研经济研究院评测报告显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平,在医疗、法律、教育行业的表现格外突出。
据了解,此次测评选取星火大模型3.0版、ChatGPT、GPT-4和国内某大模型为测评对象进行对比,测评行业方面选择了知识密集型的生产性服务业(法律服务与工业设计)、个性化需求高的生活性服务业(医疗、教育与零售)以及部分制造业(汽车工程、计算机),并基于临床执业医师资格考试、中医执业医师资格考试、国家统一法律职业资格考试、机动车检测维修专业技术人员执业资格、全国计算机技术与软件专业技术资格等权威职业资格考试构建了测评题目,以评估大模型在行业知识、技能掌握水平、生产经营场景理解能力等维度的表现。
从测评结果来看,星火大模型的综合能力达到国际一流水平,所有7个测评行业中表现均大幅超越ChatGPT,并在部分行业优于GPT-4,在与国内某大模型的比较中也表现优异。星火大模型3.0版在医学、法律、教育、零售、汽车工程、计算机和工业设计的综合准确率分别达到69.3%、71.4%、82.2%、61.2%、78.4%、76.9%和66.4%,平均准确率达72.3%,在所有测评行业中表现均优于GPT3.5版,并且与GPT4.0各有优劣,且相对落后项的差距也均在10%以内。星火大模型3.0版的知识储备与语言理解能力已具备独立完成部分行业任务和辅助人类完成复杂任务的能力。
从当前行业评价来看,星火大模型已处在国内第一梯队。正是得益于星火大模型领先的技术优势,科大讯飞的C端产品进一步提升了产品体验,获得了更多用户的青睐,在双十一大促的催化下,释放了126%的销售额同比增长。
C端用户开始为大模型产品买单,可以说科大讯飞率先迈出了一步,率先实现大模型在C端智能硬件的商业化落地。
而在To B 领域,星火大模型也已落地生花。为了进一步加速大模型行业落地,10月24日,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律、科研文献、传媒、政务、文旅、水利行业大模型,加速产业升级。
此外,双十一前夕,12个行业大模型之一的金融大模型也传来落地新消息:讯飞星火金融大模型落地中国人保,人保大模型正式发布。据悉,中国人保“数智灵犀-人保大模型”是基于星火金融大模型底座,经过私有化训练调优形成的中国人保专属企业大模型,也是星火金融大模型首个落地的企业级大模型。
从10月24日发布星火大模型v3.0到金融大模型率先落地,不到一个月的时间里,星火大模型在to B端的商业化落地能力也初步显现。在当前国产大模型“烧钱快、落地难”的普遍质疑下, 科大讯飞大模型应用落地的进展无疑给市场注入一针强心剂,也打响了大模型落地应用的步伐。
值得注意的是,科大讯飞董事长刘庆峰在10月24日公布了星火大模型继续升级的时间表:对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4,“大模型时代的大幕才刚刚揭开,让我们一起共创、共享、共进化。”
可以预见,行业会有越来越多的大模型应用落地,越来越多的商业化进展,明年或将成为大模型商业化落地百舸争流的一年。
文/罗亦丹
编辑 宋钰婷
校对 王心