就在刚过去的一周,腾讯正式官宣了旗下操作系统层级 AI 助手"马维斯"(Marvis)的上线。没有 PPT 发布会,没有邀请码壁垒,Windows、Mac、安卓三端直接开放下载。腾讯公关总监张军亲自站台,语气干脆——"把整台电脑变成可对话的对象"。
优惠的服务器→ 雨云服务器 优惠码:hinoishi
我们见过太多 AI 聊天工具了,但马维斯把战场搬到了一个更底层的位置:操作系统和你之间的 AI 中间层。如果把 ChatGPT 比作一个随时待命的参谋,那马维斯更像是直接把你的整台电脑变成一个可以随意使唤的搭档。

"AI 牛马"开工:六个 Agent 的团队作业
马维斯出道最让人眼前一亮的,并不是某项炫技的单点功能,而是它出厂就自带了一支"AI 团队"——六个分工明确的 Agent 协同工作。
主 Agent 担任项目经理角色,负责理解你的意图、拆解复杂任务、派发指令;五个专项 Agent 各司其职:File Agent 管文件,Computer Agent 管系统设置,App Agent 操作各类软件,Browser Agent 接管网页,Search Agent 负责联网搜索和信息聚合。

这个团队不是摆设。你试着跟它说一句"找出最近一个季度的发票,按时间排序,去重后合并成 PDF",界面右侧就会出现清晰的任务拆解过程:File Agent 去检索发票文件,Search Agent 联网确认日期范围,Browser Agent 打开相关网页,任务走完直接生成一份合并好的 PDF,重复发票还被自动识别剔除。整个过程,你感觉自己在给一个 AI 团队派活,而不是在和一个聊天机器人对话。
更直击打工人痛点的是系统运维能力。你不需要再翻三层菜单去找某个系统设置——直接说"电脑开机太慢了,帮我看看哪些不必要的自启动程序,没用的都关掉""我要打黑悟空,把电源计划调成高性能",马维斯会直接定位到对应设置并给出一键调整入口。本质上,它是把系统设置的交互门槛降到了"会说话就能操作"。
这种能力来自腾讯应用宝团队 14 年在 PC 和移动端底层生态的积累。用产品经理的话说:"2024 年从文件解析、格式转换、本地搜索开始做,最脏最累的底层工具活,到 2025 年底才搭 Agent 框架。自底向上。"这也解释了为什么马维斯能在系统层面做到如此深入的操控。
隐私模式:可以拔网线的 AI
隐私是马维斯架构设计中最值得深入讨论的一环。它提供了两种运行模式:效率模式下,理解与规划由云端大模型(混元和 DeepSeek V4)完成,执行环节留在本地;隐私模式下,所有数据处理、图片识别与对话均在本地完成,搭载阿里 Qwen 端侧模型,数据完全不上云,断网照用不误。

这对财务、法务、HR 等岗位来说意义不小——很多公司当下最大的阻碍不是 AI 好不好用,而是文件到底能不能上传。马维斯用"端侧运行"回答了这个问题,并承诺用户数据仅用于当下推理计算、绝不用于模型训练,用户还可以自定义索引范围,随时屏蔽不希望被索引的内容。
在安全机制上,马维斯设置了 L2 级兜底策略:涉及资金交易、核心系统配置修改、批量删除文件等敏感操作时,强制触发"硬垂询"——必须用户主动点击确认方可执行,AI 不会在这类事情上自作主张。
跨端操控:手机变成电脑的"云监工"
另一个让人印象深刻的能力是跨端可视化操控。你在手机上打开马维斯,能看到电脑桌面的实时画面,直接操作。甚至在 PC 锁屏状态下,手机还能远程输入密码解锁。这个场景戳中了很多打工人的日常痛点:下班路上突然想起公司电脑里有个文件没发,掏出手机就能搞定;游戏更新、软件下载这种耗时任务,完全可以在手机上远程安排,电脑自己跑。
马维斯内嵌了 PC 版应用宝,依托与微软 Store 的合作,可以在电脑端直接调度手机 App,实现跨端应用操控。横跨 Windows 和安卓两个生态的调度能力,目前在国内产品中比较稀缺。
横向看看:同类产品都走到哪了?
市面上确实没有和它完全一模一样的产品,但有几个方向值得对照来看。
微软 Copilot 走的是"深度绑定 Office"的路线,优势在于跟 Word、Excel、PowerPoint 等办公套件的天然融合——无需额外打开任何软件,AI 就藏在每一个你常用的按钮里。但 2026 年微软在 Windows 系统层面的 AI 布局实际上在收缩,"通知中心 Copilot 建议"等功能被搁置甚至流产,Copilot 已经不再被定位为贯穿整个系统的全域 AI 助手。
苹果 Apple Intelligence 走的是端侧隐私优先路线,强调本地处理、数据不出设备。但苹果计划在 2026 年秋季才开始允许用户自主选择第三方 AI 模型来驱动 Siri 等系统级功能,整体 AI 能力释放节奏偏慢。更重要的是,微软 Copilot 进不来、Apple Intelligence 落不了地——这个市场空白对腾讯来说是一个窗口期。
联想天禧(原联想小天) 是目前国产 PC 端比较成熟的个人智能体,定位"业内首款 AI PC 个人智能体",具备端侧推理、复杂任务分解和跨设备协同能力,但仅限联想 AI 元启机型预装使用,开放性有限。
字节跳动的豆包 和 阿里通义千问 从聊天框出发,生态丰富、用户量大,但在系统底层的深度操控能力上定位不同——它们更偏向"通用 AI 能力平台",而非操作系统的深度集成层。
在海外产品方面,Anthropic 的 Computer Use 和 OpenAI 的 Operator/Codex 走的是视觉识别操作界面路线——AI 通过看屏幕截图来推断界面元素位置,模拟鼠标点击。好处是通用性强,任何有界面的软件都能操作;缺点是精确度有限,且数据要上传云端。OpenAI 的 Operator 在 OSWorld 基准测试中得分仅 38.1%,而人类得分是 72.4%。这条路径本质上和马维斯不一样:一个是在应用层通过"看屏幕"来模拟人的操作,另一个是穿透操作系统抽象层直接与系统 API 对话。
OpenClaw 则是另一种存在——开源、多模型支持、完全本地部署,36 万+ GitHub 星标的现象级产品,开发者社区活跃。但它的上手门槛高得惊人:需要安装 Node.js、配置 API key、搭环境,本质上是给极客和开发者用的工具箱,而不是给普通办公人群的开箱即用助手。
谁该装?谁该等?
马维斯不是没有短板。它目前最明显的不足在于与钉钉、飞书这类企业协同平台的生态打通还不够深。如果你所在的团队已经深度使用钉钉或飞书的智能伙伴,它们的优势在于天生自带企业内部文档、审批、日程的上下文,不需要额外授权就能处理工作流内的任务——这点马维斯目前还做不到。
另外,马维斯对硬件有一定要求,因为它预装了很多本地模型。Windows 端的最低门槛是 8 核 CPU、16GB 内存加固态硬盘。
对于个人用户、中小团队、自由职业者,尤其是那些桌面常年乱成一团、系统设置从不点开、对隐私有要求的用户来说,马维斯的开箱即用和本地隐私保护是实打实的加分项。如果你的工作涉及大量本地文件管理、跨应用操作,或者经常需要在手机和电脑之间"接力"干活,它的匹配度会很高。
马维斯的故事不像"AI 又变聪明了"这样的大模型军备竞赛。它更像是在人工智能与操作系统深度耦合的产业趋势下,找到了一条更务实、更融入日常使用习惯的路径——不是让 AI 变得更会聊天,而是让 AI 真正把手伸进系统,帮你把活干了。
它的产品经理曾说了一句挺实在的话:"用户和操作系统之间,终归需要一层新东西,这个位置是空的。"从目前来看,马维斯未必是那个最终答案,但它正站在那个最有想象空间的位置上。