时间定了,就在3月16日。
2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5。百度官方介绍,文心大模型4.5在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。
在几天前的百度2024年Q4及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,4.5将是百度有史以来最强大的大模型,并且文心大模型4.5将开源。
“开源4.5系列的决策源自于对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力。”李彦宏说道。
DeepSeek给国内外带来的震动还在持续,百度也适时调整在大模型战斗中的战略,在春节后接连打出了“开源、免费”的组合拳。
在2月13日,百度宣布文心一言将于4月1日0时起全面免费,同时上线深度搜索功能。即将上新的文心大模型4.5系列,并从6月30日正式开源。 另外,其实还可以看到,百度还在积极的接入DeepSeek,增强产品的能力。例如,2月16日晚,百度搜索和文心智能体平台宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能 搜索用户可免费使用DeepSeek和文心大模型深度搜索功能,文心智能体平台的开发者也将能随时调用DeepSeek模型创建并调优智能体。百度首页上线DeepSeek满血版入口后,其中PC端开放仅1小时就有超千万人使用。对比其他接入DeepSeek产品,百度搜索在首页搜索框下方点击“AI搜索DeepSeek满血版”即可体验。截至目前,百度系的多款产品,包括百度营销、百度文库、百度网盘都全量接入了DeepSeek- R1满血版。例如在百度网盘中,只需在智能助理“云一朵”中点亮“DeepSeek-R1满血版”,即可深度理解用户意图,更加便捷地进行文件、照片等搜索、整理及总结,帮助用户更好地进行个人知识管理,轻松搭建个人知识库。虽然百度旗下多项业务都在积极接入DeepSeek,但百度仍持续投入研究文心大模型。例如在百度搜索时,用户既可以调用DeepSeek进行深度搜索,也可以调用百度文心大模型进行深度搜索。毕竟自研大模型是才是各家最有底气的竞争力,用户对比后也会用实际行动作出自己的选择,对于自研大模型的研发来说,接入DeepSeek也是给产品一个重要的对标对象。 文心大模型4.5的发布标志着百度从闭源走向开源。有观点认为,百度文心大模型的开源是一次战略级尝试,既是对其技术自信的展现,也是对大模型生态话语权的争夺。不过,如李彦宏强调的“无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值”。 在路上的文心大模型 4.5,哪些能力值得期待?
DeepSeek的出现,首先让各大模型都在追逐深度思考的能力。近期文心一言已经上线了“深度搜索”功能,具备专家级问答能力,RAG(搜索增强生成)能力突出,尤其是专业领域问答幻觉率低。从文心一言发布之初,百度就强调检索增强。百度研发的“理解-检索-生成”协同优化的检索增强技术,显著提升了大模型技术及应用的效果——理解阶段,基于大模型理解用户需求,对知识点进行拆解;检索阶段,面向大模型进行搜索排序优化,并将搜索返回的异构信息统一表示,送给大模型;生成阶段,综合不同来源的信息做出判断,并基于大模型逻辑推理能力,解决信息冲突等问题,从而生成准确率高、时效性好的答案。即将发布的文心大模型4.5,毫无疑问会具备深度思考能力,另外的一个重点能力可能就是原生多模态能力。这背后技术就包括百度自研的iRAG(image based RAG),检索增强的文生图技术。iRAG能够将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了AI味儿,而且成本很低。当然,这些都只是目前的一些猜测,文心大模型4.5究竟能呈现怎样的多模态能力?以及可以在哪些场景下落地应用?这些都是值得关注的地方。产品能力之外,价格也是大家关注的焦点,尤其是B端用户。李彦宏曾说:“今天,当我们谈论大型语言模型时,12个月内推理成本基本上可以降低90%以上成本。近期,DeepSeeK已经掀起了一波大模型降价潮。李彦宏也曾在2024年初透露,自发布以来,百度不断降低文心大模型的推理成本,已降低至一年前的1%。对于企业和开发者来说,基于文心大模型开发原生应用、做二次开发,都能够拥有更低的推理成本和更高的训练效率。此前百度已宣布文心一言自4月1日起免费,即将发布的文心大模型4.5届时也会对C端用户免费使用。此外其在API接口价格上会给企业和开发者带来怎样的惊喜?同样值得期待。