百度公司(Baidu Inc.)计划在今年晚些时候开源其文心(Ernie)系列大语言模型(LLM)。
该公司是中国最受欢迎的搜索引擎运营商,今天宣布了这一计划。据路透社报道,该计划的核心是一系列即将发布的文心模型,被称为文心 4.5 系列(Ernie 4.5)。百度将在未来几个月内向用户推出这一 LLM 系列,并计划在6 月 30 日开源其代码。
百度使用文心大模型来驱动类似 ChatGPT 的聊天机器人服务——文心一言(Ernie Bot)。该服务可以生成文本、解决数学问题并执行其他任务。据报道,截至 11 月,文心一言的用户数量已达到4.3 亿,相比 4 月的 2 亿用户大幅增长。
百度于 2023 年 3 月发布了文心一言的首个版本。当时,该服务基于百度自 2019 年开始研发的 LLM——文心 3.0。该模型拥有100 亿参数,并在4TB 数据集上进行了训练。
当前版本的 LLM——文心 4.0,被百度描述为“全面升级,性能大幅提升”。除了生成文本外,它还可以生成图片和视频。此外,该模型在推理能力方面有所增强,使其在解决几何问题等任务上表现更优。
即将开源的文心 4.5版本之后,百度计划推出更强大的迭代版本——文心 5(Ernie 5)。据一位消息人士向路透社透露,该公司计划在2025 年下半年发布该模型。目前尚不清楚文心 5 具体具备哪些新功能,以及是否也会以开源形式提供。
百度人工智能战略的这一变化发生在DeepSeek-R1发布几周后。DeepSeek-R1 是由中国 AI 研究实验室 DeepSeek 开发的开源 LLM,其在多个任务上优于 OpenAI的 o1 级推理模型。该模型的发布甚至导致英伟达(Nvidia)股价短暂下跌。
在 DeepSeek-R1 发布后,百度并不是唯一一个加大对开源 LLM 关注的公司。1 月 31 日,在 Reddit 论坛的一次讨论中,**OpenAI 首席执行官萨姆·奥特曼(Sam Altman)**表示,该公司“需要探索不同的开源策略”。但他补充说,“并非 OpenAI 的所有人员都持这一观点,同时这也不是公司目前的最高优先级。”
OpenAI 早已开源了多个 AI 模型,包括其旗舰 GPT系列 LLM 的前两个算法。此外,该公司的 GitHub页面上还托管了多个内部开发的编程工具,这些工具可以简化机器人 AI 软件训练等任务。