当前位置:首页 > 财经聚焦 > 百度CTO王海峰:文心一言用户规模、日均调用量均已达2亿 

百度CTO王海峰:文心一言用户规模、日均调用量均已达2亿 

2024年04月16日76411

  4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心举办。

百度CTO王海峰:文心一言用户规模、日均调用量均已达2亿 
图片来源于网络,如有侵权,请联系删除

  自去年3月16日发布知识增强大语言模型文心一言以来,百度不断迭代升级文心大模型,技术创新不断,从知识增强、检索增强,进一步发展出知识点增强;基于更大的算力、更多的数据和更强的算法,依托飞桨平台,从文心3.0、3.5,到4.0,文心大模型能力愈加强大,效果和性能全面提升。

百度CTO王海峰:文心一言用户规模、日均调用量均已达2亿 
图片来源于网络,如有侵权,请联系删除

  百度首席技术官王海峰表示,智能体是重要的发展方向,会带来更多的应用爆发。智能体是在基础模型上,进一步进行思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。智能体的思考模型像人一样,会阅读说明书,学习工具的使用方法,还可以调用工具来完成任务。

  从万亿级训练数据中,文心大模型既学到了自然语言的能力,也学到了代码能力,打通从思考到执行的过程。基于文心大模型的这两种能力,百度开发了代码智能体和智能代码助手。王海峰表示:“代码智能体,让大家都能做之前只有程序员才能做的事,人人都可以成为程序员;智能代码助手,则帮助专业的程序员更高效地写出更好的代码,可以说是程序员的AI同侪。”

  代码智能体是在“用模型写代码让复杂的任务变简单”,思考模型加上代码解释器,构成了代码智能体。首先,思考模型理解用户需求,经过思考,把完成任务的指令和相关信息整合成提示,输入给代码解释器;然后,代码解释器根据提示,把自然语言表达的用户需求翻译成代码并执行,得到执行结果或者调试信息;接着,思考模型对代码解释器的执行结果进行反思确认,如果正确,就把结果返回给用户,不正确就继续进行自主迭代更新。

  大会现场,王海峰进一步透露,在模型效果不断提升的基础上,百度进一步构建了上下文增强、私域知识增强、流程无缝集成等能力。目前智能代码助手Comate整体采纳率达到了46%,新增代码中生成的比例已经达到了27%。Comate把代码理解、生成、优化等能力无缝集成到研发流程的各个环节,就像助理一样,帮助提升代码开发质量和效率。

  王海峰现场还分享了多模型技术。他表示,在大模型应用落地过程中,效果,效率和成本都很重要。在实际应用中,需要从场景需求出发,选择最适合的模型。一方面,是高效低成本的模型生产;另一方面,是多模型推理。高效低成本模型生产方面,百度研制了大小模型协同的训练机制,可以有效进行知识继承,高效生产高质量小模型,也可以利用小模型实现对比增强,帮助大模型的训练。同时,建设了种子模型矩阵,数据提质与增强机制,以及从预训练、精调对齐、模型压缩到推理部署的配套工具链。高效低成本模型生产机制,助力应用速度更快、成本更低、效果更好。多模型推理方面,百度研制了基于反馈学习的端到端多模型推理技术,构建了智能路由模型,进行端到端反馈学习,充分发挥不同模型处理不同任务的能力,达到效果、效率和成本的最佳平衡。

  除了智能体、代码和多模型技术,文心大模型在其他方面也持续创新,包括基于模型反馈闭环的数据体系、基于自反馈增强的大模型对齐技术,以及多模态技术等。王海峰现场公布,文心大模型4.0的效果持续提升,发布后的半年时间,又提升了52.5%。

  文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%,相比一年前文心一言发布时,训练效率提升到当时的5.1倍,推理105倍。截至目前,飞桨文心生态已凝聚1295万开发者,服务24.4万家企事业单位,基于飞桨和文心创建89.5万个模型。

  王海峰表示,文心一言累计用户规模已达2亿,日均调用量也达到了2亿,高效满足了用户工作、生活和学习需求。

  最后,王海峰介绍了百度AI人才计划的最新进展,百度在2020年提出了5年为全社会培养500万AI人才,目前这一目标已提前达成。他表示,“未来,我们将继续投身人才培养,让人才的点点星光,汇成璀璨星河。智能时代,人人都是开发者,人人都是创造者,让我们一起,创造美好未来。”

【责任编辑:周靖杰】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由发布,如需转载请注明出处。

              “百度CTO王海峰:文心一言用户规模、日均调用量均已达2亿 ” 的相关文章

              十大考古新发现探秘之十丨这个水下考古项目,绝无仅有!

              十大考古新发现探秘之十丨这个水下考古项目,绝无仅有!

                中国南海,碧波荡漾。一次没有先例可循的考古调查,打开了埋藏在千米深海、尘封500多年的“时光宝盒”。日前,2023年度全国十大考古新发现公布,南海西北陆坡一号、二号沉船遗址入选。图片来源于网络,如有侵权,请联系删除  遗址位于海南岛与西沙群岛之间的南海海底,西北距离三亚约150公里。两处遗址是我...

              新华社权威快报|捕捉宇宙“焰火” 爱因斯坦探针卫星首批在轨科学探测图像发布

              新华社权威快报|捕捉宇宙“焰火” 爱因斯坦探针卫星首批在轨科学探测图像发布

                4月27日,爱因斯坦探针卫星首批在轨科学探测图像在京发布。图片来源于网络,如有侵权,请联系删除  爱因斯坦探针卫星是中国科学院牵头研制的一颗空间科学卫星,于2024年1月发射升空,主要用于观测宇宙中的剧烈爆发现象,捕捉这些转瞬即逝的宇宙“焰火”,因主要科学目标涉及黑洞、引力波等爱因斯坦相对论的重...

              新AI模型或更准确预测气象灾害

              新AI模型或更准确预测气象灾害

                谷歌公司最近发布了一款新的生成式人工智能(AI)模型——可扩展集成包络扩散采样器(SEEDS)。该公司称,SEEDS能提供更准确的天气预报信息,比传统方法成本更低,而且能检测到难以发现的极端天气事件。相关论文发表于最新一期《科学进展》杂志。图片来源于网络,如有侵权,请联系删除与传统模型相比,SE...

              华泰证券:预计联储将在5月会议上宣布放缓缩表速度

              华泰证券:预计联储将在5月会议上宣布放缓缩表速度

                研报指出,北京时间5月2日(周四)凌晨美联储将公布5月议息会议,预计联储将维持数据依赖的前瞻指引,降息时点仍需观察,通胀下行遇到波折但仍难确定趋势逆转等——考虑到市场降息预期已明显调整,而联储仍然希望今年可以开启降息周期,5月FOMC比市场预期更鹰派的可能性较低。此外,预计联储将在5月会议上宣布...

              2024运动健康高峰论坛暨北健新品发布会在京举行

              2024运动健康高峰论坛暨北健新品发布会在京举行

                近日,2024运动健康高峰论坛暨北健新品发布会在京举行。此次论坛以“运康研产协同 共促健康中国”为主题,邀请来自国内运动医学及运动康复行业的专家学者、抖音达人等嘉宾参与,旨在共同探讨运动健康行业的发展趋势,为促进健康中国建设,贡献“北健”力量。图片来源于网络,如有侵权,请联系删除  北健品牌代表...

              星空有约丨月亮的暗面为啥也能看见了?

              星空有约丨月亮的暗面为啥也能看见了?

                5月9日至11日日落后,公众可以看到一弯细细的新月悬挂于西边天空。仔细看你会发现,月亮未被太阳照亮的暗面,被地球反射的太阳光照亮,发出淡淡的光,这种有趣的现象被称为地照。图片来源于网络,如有侵权,请联系删除  中国科学院紫金山天文台科普主管王科超说,地照也常被浪漫地称为“新月抱旧月”,是指由于地...