百度副总裁王颖:大模型时代的操作系统要解决端到端的问题 ...

2025-4-25 20:01| 发布者: 仟茂传媒| 查看: 95| 评论: 0|来自: 每日经济新闻

摘要: 每经记者 可杨每经编辑 张益铭 在4月25日的百度Create大会现场,百度创始人李彦宏带来百度文库、百度网盘联合推出的全球首个内容领域操作系统沧舟OS。 依托沧舟OS,百度网盘和百度文库联合推出AI笔记,用户在网盘 ...

每经记者 可杨    每经编辑 张益铭

在4月25日的百度Create大会现场,百度创始人李彦宏带来百度文库、百度网盘联合推出的全球首个内容领域操作系统——沧舟OS。

依托沧舟OS,百度网盘和百度文库联合推出“AI笔记”,用户在网盘内观看学习视频时,可一键生成AI笔记,还能生成AI思维导图、基于视频内容AI出题,实现视频和笔记在同界面的流畅联动。

百度创始人李彦宏曾将百度文库称为“百度AI重构最彻底的一款产品”。百度副总裁,文库事业部、网盘事业部负责人王颖在接受包括《每日经济新闻》记者在内的媒体采访时指出,整个行业的发展趋势都是通过能力的组合与对Agent的调用,逐步实现对用户完整需求的交付。

MCP(Model Context Protocol,模型上下文协议)是AI领域最新热议的焦点,值得注意的是,不久前的4月15日,支付宝联合魔搭社区,在国内推出“支付MCP Server”服务。王颖认为,作为一种协议,MCP已经初步具备了承载体系化协同的基础条件。

AI的未来:无所不能、无处不在

“‘无所不能、无处不在’是我们希望AI未来能达成的愿景和目标,”百度副总裁,文库事业部、网盘事业部负责人王颖在采访中表示,好的AI应该像人一样思考,像人一样工作。

基于这种愿景,百度文库和网盘联合推出了“沧舟OS”操作系统,构建了以多Agent智能体协同为核心的平台,希望在文库、网盘等产品之上,融合输入、处理与输出三大能力,以期在任何场景下都能为用户提供端到端的深度交付。

在百度内部,构建这样一套系统并非一蹴而就。王颖坦言,之所以没有早点推出,是因为它需要长时间的能力沉淀——从文库、网盘的AI重构开始,百度文库、网盘就在系统性地积累大模型赋能下的多模态输入、输出、信息处理等能力,并通过Agent协作机制将这些能力整合成能够深度交付的工作流。这源于技术能力的长期积累,也是在行业演进中不断适配、串联能力的结果。

基于此,王颖介绍,“沧舟OS”系统的构建除了在横向上围绕输入、处理、输出建立工作流,同时在纵向架构上也遵循了MCP Server(模型上下文协议服务器)、MCP Client(应用服务层)、MCP Host(面向用户的终端层)三层结构。

其中,MCP Server包括底座基建和中枢系统:底层基建包含工具框架和知识化框架,沉淀了丰富的公域知识库、私域知识库,以及用户记忆库“三大库”和用于调用的工具能力;中枢系统包括融合编辑器、阅读器、播放器“三大器”,以及调度中枢,结合用户记忆和画像数据,通过模型理解用户意图,高效分配调度Agent。MCP Client是应用服务层,聚合了文库、网盘等自研Agent以及专业的第三方Agent,构成核心中枢。MCP Host则是面向用户的终端层,涵盖企业用户、开发者、智能体应用等各场景和终端。

王颖表示,从早期的Chatbot(聊天机器人),到后来的Agent(智能体),再到多智能体协同,以及当前广受关注的MCP概念,整个行业的发展趋势都是通过能力的组合与对Agent的调用,逐步实现对用户完整需求的深度交付。王颖认为,作为一种协议,MCP已经初步具备了承载这一体系化协同的基础条件。

面对“沧舟OS”系统落地过程中的技术难题,王颖坦言:“几乎每一步都是挑战。”

王颖指出,首先是多模态内容的理解层面,包括模型如何应用、文件怎么解析、解析后如何变成同样的向量,以完成进一步的推理,这是工程团队和大模型团队从去年就开始做,直到没有问题才集成到系统上的。

其次是用户意图的理解与澄清,王颖认为,这是降低用户操作门槛的关键。

此外,王颖还提到多模态的输入和输出,“我们希望多模态是一个完整的交付,从输入开始就应该是多模态,拍照、语音、文字都可以作为任务起点”。

为了实现规模化应用与商业可持续,王颖强调控制成本与提升调用效率的重要性。“现在爆火的智能体都是不可持续的,每个人都要搞一遍,它的成本是很难控制的。”王颖认为,通过多任务智能体调用的方式,能够把每一次调用的成本摊薄,才有机会让AI实现真正可用、可规模化使用。

从深度思考,到深度交付

“这套系统应该长成什么样子?应该根据用户的需求来看。”当被问及如何理解沧舟OS系统时,王颖表示。

在王颖看来,大模型时代的操作系统将与传统PC时代完全不同。从PC时代的Windows系统到今天的AI原生平台,最大的区别在于是否能够端到端地解决问题。

过去,Windows以窗口式界面为统一形态,基于Windows之上的各种应用程序完全不同。“因为它受限于技术不能够端到端解决问题,所以导致底座是底座,通用程序是通用程序。”王颖表示。

在大模型驱动下,情况发生了变化,王颖认为,大模型时代的操作系统最后要解决端到端的问题。AI不再只是工具,而成为“任务解决者”。王颖认为,真正的AI操作系统,最终目标是实现从需求理解到任务完成的全链路闭环,端到端地实现从深度思考到深度交付。

“沧是沧海的意思。我们的系统就像水一样,放在圆的容器里就是圆的,放在方的容器里就是方的。”也正因如此,沧舟OS的具体形态因任务而异:在自由创作场景中,它表现为“自由画布”;在学习场景中,在网盘里可以呈现为“AI学习笔记”;在视频场景中,系统又会自动唤起视频理解、知识提炼等多模态能力。

王颖表示,当前,行业的共识是:靠单个Agent解决不了复杂问题,必须靠多Agent协同。王颖指出,如何搭建一套好的工作流,然后解决完整的任务,是大家都去追求的目标。

王颖强调,不可能有一个通用的WorkFlow(工作流)能解决所有问题,而是应该随着用户的操作路径,实时构建出最合适的流程。在沧舟OS中,这样的“流程生成”也是由系统自动完成的。“你觉得下一步是什么,我给你的就是什么”,这是沧舟OS区别于传统操作系统的根本所在。

“从第一天开始希望我们解决问题的能力是,让AI聪明又能干。”王颖表示,生成只是第一步,生成完了能够真正可用,才是最重要的。

因此,在当前阶段,王颖强调的是更实用的工程路线:以多模型组合、多Agent协同,再加上完整的产品工程体系,分阶段推进AI的落地能力。

“以前连这个都不具备,因为以前的大模型没有这种通用的能力,都是专用的能力,是解决不了的。”王颖表示,通过深度思考、深度交付、公私域知识库和MCP体系,四者协同发力,才能在多元场景中真正满足用户需求。

封面图片来源:每日经济新闻 资料图


鲜花

握手

雷人

路过

鸡蛋

相关分类