Blade Agent · 40 天演进复盘

工作台
流水线

一个 AI 智能体产品的真实演进路径

1100+ 次提交 40 天 2025 年 5 月 — 6 月

AI 使用的四层楼

每上一层,解决的问题就不同

4F

流水线

让工作可以被持续调度、验证和积累

谁来发现任务?谁来启动?谁判断结果?失败记在哪?明天从哪继续?

← 我们在往这走
3F

工作台

让智能体能动手干活

有沙盒、有工具、有技能、有规划——智能体不只是聊天,它能真正执行

← 我们的起点
2F

上下文

让模型少猜

给模型准备背景资料、项目规则、历史记忆

1F

提示词

让你说清楚意图

靠表达能力赢——谁更会拆任务、写约束、追问、纠错

Blade Agent 从第一天起就在第三层
过去 40 天做的所有事,都是在往第四层走

工作台很好,但不够

工作台已经能回答

  • 智能体能不能拿到正确的背景?
  • 能不能调用工具?
  • 能不能跑测试?
  • 能不能交付一个结果?

?

但回答不了这些

  • 谁来发现下一个任务?
  • 谁来判断结果能不能用?
  • 失败了记在哪里?
  • 明天从哪里继续?

工作台解决的是单次执行
流水线解决的是持续闭环

五个关键转变

从工作台到流水线,我们做了什么

1

从「对话」到「任务」

先定义什么叫「完成」

以前

用户和智能体聊天,做完就做完了。智能体只知道「用户不说话了」,不知道「事情做完了」

现在

引入任务看板——每个任务有明确的阶段。对话绑定到任务上,智能体知道自己在做什么

待开始 进行中 待审核 完成
2

从「用完即走」到「持久记忆」

让智能体能「接着干」

以前

每次对话都是一个「失忆」的智能体面对一个全新的环境。昨天做过的事,今天不记得

现在

工作区持久化——文件还在、装过的工具还在、记忆还在。智能体今天能从昨天停下的地方继续

📄

文件还在

🔧

工具还在

🧠

记忆还在

3

从「人盯着干」到「能自己跑」

智能体不再需要人坐在屏幕前

以前

智能体每一步都等人确认。如果每步都问人,「自动化」就只是个笑话

现在

「无人值守」模式——程序可以直接调用智能体,下达指令、拿到结构化结果,中间不需要人。沙盒隔离保证安全

4

从「一个人」到「一个团队」

一套工作系统,而不是一个万能助手

以前

一个智能体干所有的事。写需求、写代码、做设计、做测试,全靠一个角色

现在

一个项目里有多个角色——产品经理、开发、设计、测试,各司其职,共享同一个工作区

产品经理
开发
设计
测试

在同一个项目里协作,共享文件和进度

5

从「一次性知识」到「可复用的技能」

技能是流水线里真正的资产

以前

领域知识塞在对话里,每次都要重新理解项目、重新猜规则、重新摸索做法——每轮都在交同一笔学费

现在

技能变成独立的、可搜索、可调用的资产。智能体每次运行都能读到同一套经验,而不是重新推导

技能才是流水线里的资产
流水线本身只是管道

拼起来看

一条流水线需要五个零件,我们怎么实现的

完成标准

什么叫做完了

任务看板的状态流转——从「进行中」到「待审核」到「完成」

自动组装

每轮自动准备好背景

工作系统自动配置角色、技能和工具——不用每次从头说起

执行并记录

做了什么、结果如何

无人值守模式——自动执行、结构化输出,做完就交卷

失败可复用

这次的失败变成下次的经验

工作区持久化 + 跨会话记忆——上次哪里出错了,智能体还记得

刹车机制

什么时候必须停下来

预算上限 + 最大轮次 + 关键节点人工审核——不会失控

非技术用户的流水线,和开发者的不一样

验证信号是模糊的,所以人不能离开

开发者的流水线

验证信号很明确:

  • 测试通过了
  • 构建成功了
  • 代码审查过了

可以做到高度自动化

非技术用户的流水线

验证信号很模糊:

  • ? 这份文档写得好不好?
  • ? 这个分析靠不靠谱?
  • ? 这个方案可不可行?

关键节点必须有人审核

我们的选择:有人在环的流水线

智能体干活,人在关键节点拍板。
任务看板就是流水线的可视化——用户看到的不是对话流,而是工作进度。

流水线不会取代人,它只是把人的判断放到了更高的位置。

还没做到的

诚实比好看重要

自动触发

目前还是用户手动发起任务,还没做到事件驱动或定时启动

自动分配与负载均衡

多个角色的智能体还不能根据任务量自动调度,需要人来分配工作

独立的验收角色

目前做事和检查是同一个智能体,还没有让「质检员」和「工人」分开

「自动触发」应该最后才加。
完成标准、状态记录、失败反馈这些基础没做好之前,
自动触发只会把不可靠的执行变成不可靠的定期执行。

流水线的关键词
不是自动化
而是闭环

从工作台到流水线,不是一个大决策,
而是一连串小选择的累积——
任务、状态、编排、技能资产,
每一个单独看都不起眼,
拼起来才构成闭环。

提示词 · 解决表达 上下文 · 解决背景 工作台 · 解决执行 流水线 · 解决闭环