Skip to content

R#040 锐评 manus

Posted on:2025-03-09 20:00:00

事件

  1. manus 发布。AI 火了之后带了一股营销风,突然就冒出来 manus。用了 manus,一般,总的来说,manus 是一个 AI agent 的概念性 demo,时机取巧。

agent

manus 的核心功能是帮你拆解成多个步骤,并且去收集信息(deepsearch)、实现文本(LLM)、部署代码(operator)。

收集信息,是联网功能;

实现文本,是 LLM 基本能力;

部署代码,是类似 bolt.new, v0.dev 之类已经比较成熟的方案,再扩展到键鼠操作、API 操作之类。

它的亮点在于,展示了一个任务的「执行逻辑」,也就是展示了「Thinking 过程」,甚至让你看到它用浏览器访问网页,配合多模态去理解屏幕内容,鼠标点击等等。当然,这里我不觉得 system 提示词、拆分任务、调用 function call 是个亮点,这更像是使用 AI 的基本功。

概念 demo

虽然 manus 看似实现了 agent,但是和几年前的 autogpt 没有太大的区别,更多是向用户展现了基于 AI/Agent 的想象空间。

从现在 AI 发展看,国外比较倾向于商定协议,比如 MCP,规定 AI 能控制什么、如何控制等交互,也正因为标准协议还没发展起来,缺少一个 AI 与 APP 厂商之间的利益平衡方,manus 采取了很取巧的做法——也就是让用户并去操作浏览器、终端,基于鼠标键盘的模拟操作。

从用户角度看,我倒是支持这个做法的,甚至,这种有点绑架用户心智,让大家对未来 agent 充满幻想的做法,能加速各个厂商卷现在 AI 应用,尤其是大厂。

现在谁都知道要做 personal agent,去吃制定标准、抢产品形态定义的螃蟹流量,manus 就干了这个事情。

现在我觉得 pc personal agent 是个伪概念,应该做场景化的比如 dev personal agent,想一口吃成通用化是不可能的,因为 LLM 是个语言学概率模型,通用化就意味着不专业,要从下向上做通用,教 AI 也是教用户模型擅长什么、不擅长什么。

后来我觉得得吃平台优势,结合自己产品搞 agent 化,比如企业微信/钉钉/飞书提供一个用户侧的 agent 助手作为秘书,而不是现在 xjb 搞的群聊总结,用户能收到看到的所有信息就是 agent 的输入,用户自己跟 agent 交互就行了

但是做产品无非就是形态定义权,别人想抄还是能抄的,所以,我觉得借着市场上国民级应用的垄断级优势去跟国家制定 MCP,做 MCP 的 SDK 供应商,才是要冲的玩法。

时机取巧

deepseek 热度还没散去,趁着全民都对 deepseek 有认知,不需要教用户什么是 AI,也不需要告诉用户 AI 有那么多幻觉、错误和门槛,赶紧把「第一」这个概念在国内抢了。

不过 manus 只是个第四方平台,没做标准的能力,不得已,吃一口流量抢占产品形态。

可能是想提高被收购的价值吧。

跑了几个案例,全都失败了。

第一个案例只说了一次提示词,跑了 2h,就触发了 token 上限(所以说 manus 出的时机太早了,模型水平还没跟上…),更别提 debug 了:

后续基本上也是类似的问题,如果你的需求足够简单,那有更好的工具比如 Claude,如果你的功能很复杂,manus 的上下文也支持不了。这就是第四方通用平台的困境,看着花哨,上限很不稳定。

但话又说回来了,确实有相当多的简单工作可以在这轮迭代里被干掉,比如写个简单的 ppt、报告啥的,确实降低了 prompt 的编写门槛(其实是平台帮你写了 prompt,也就是所谓的智能体、流程),挺好的,厂商越卷,我(用户)越开心。

信息

灵感

  1. 大胆预测一下,下一个 AI 转折点应该是无限 Token

系统

  1. 上周用了片假名终结者这个插件,不过汉字还是需要注音,于是有找了个插件注音假名生成器

Other

  1. 拿到了离开深圳的倒数第二张门票,职级过了,还是挺开心的。
  2. 下周该分享了,这次分享宏观经济和投资,赶紧去准备一下 PPT。