Blade Agent · 40 天演进复盘
一个 AI 智能体产品的真实演进路径
每上一层,解决的问题就不同
让工作可以被持续调度、验证和积累
谁来发现任务?谁来启动?谁判断结果?失败记在哪?明天从哪继续?
让智能体能动手干活
有沙盒、有工具、有技能、有规划——智能体不只是聊天,它能真正执行
让模型少猜
给模型准备背景资料、项目规则、历史记忆
让你说清楚意图
靠表达能力赢——谁更会拆任务、写约束、追问、纠错
Blade Agent 从第一天起就在第三层。
过去 40 天做的所有事,都是在往第四层走。
✓
?
工作台解决的是单次执行。
流水线解决的是持续闭环。
从工作台到流水线,我们做了什么
先定义什么叫「完成」
以前
用户和智能体聊天,做完就做完了。智能体只知道「用户不说话了」,不知道「事情做完了」
现在
引入任务看板——每个任务有明确的阶段。对话绑定到任务上,智能体知道自己在做什么
让智能体能「接着干」
以前
每次对话都是一个「失忆」的智能体面对一个全新的环境。昨天做过的事,今天不记得
现在
工作区持久化——文件还在、装过的工具还在、记忆还在。智能体今天能从昨天停下的地方继续
文件还在
工具还在
记忆还在
智能体不再需要人坐在屏幕前
以前
智能体每一步都等人确认。如果每步都问人,「自动化」就只是个笑话
现在
「无人值守」模式——程序可以直接调用智能体,下达指令、拿到结构化结果,中间不需要人。沙盒隔离保证安全
一套工作系统,而不是一个万能助手
以前
一个智能体干所有的事。写需求、写代码、做设计、做测试,全靠一个角色
现在
一个项目里有多个角色——产品经理、开发、设计、测试,各司其职,共享同一个工作区
在同一个项目里协作,共享文件和进度
技能是流水线里真正的资产
以前
领域知识塞在对话里,每次都要重新理解项目、重新猜规则、重新摸索做法——每轮都在交同一笔学费
现在
技能变成独立的、可搜索、可调用的资产。智能体每次运行都能读到同一套经验,而不是重新推导
技能才是流水线里的资产,
流水线本身只是管道。
一条流水线需要五个零件,我们怎么实现的
完成标准
什么叫做完了
任务看板的状态流转——从「进行中」到「待审核」到「完成」
自动组装
每轮自动准备好背景
工作系统自动配置角色、技能和工具——不用每次从头说起
执行并记录
做了什么、结果如何
无人值守模式——自动执行、结构化输出,做完就交卷
失败可复用
这次的失败变成下次的经验
工作区持久化 + 跨会话记忆——上次哪里出错了,智能体还记得
刹车机制
什么时候必须停下来
预算上限 + 最大轮次 + 关键节点人工审核——不会失控
验证信号是模糊的,所以人不能离开
验证信号很明确:
可以做到高度自动化
验证信号很模糊:
关键节点必须有人审核
我们的选择:有人在环的流水线
智能体干活,人在关键节点拍板。
任务看板就是流水线的可视化——用户看到的不是对话流,而是工作进度。
流水线不会取代人,它只是把人的判断放到了更高的位置。
诚实比好看重要
自动触发
目前还是用户手动发起任务,还没做到事件驱动或定时启动
自动分配与负载均衡
多个角色的智能体还不能根据任务量自动调度,需要人来分配工作
独立的验收角色
目前做事和检查是同一个智能体,还没有让「质检员」和「工人」分开
「自动触发」应该最后才加。
完成标准、状态记录、失败反馈这些基础没做好之前,
自动触发只会把不可靠的执行变成不可靠的定期执行。
从工作台到流水线,不是一个大决策,
而是一连串小选择的累积——
任务、状态、编排、技能资产,
每一个单独看都不起眼,
拼起来才构成闭环。