主题
06-01 · 无人监管流水体系(Unattended Pipelines)
最高境界:你在睡觉,你的 Agent 在替你赚钱、替你交付。
这一节给你一份从 Demo → MVP → 产品 → 无人流水 的完整路径图,并把公司当前在跑的几条流水拆给你看。
一、四阶进化模型
| 阶段 | 形态 | 人工占比 | 例子 |
|---|---|---|---|
| L0 Demo | 一次性脚本 | 100% | "我让 Claude 帮我抓了一次新闻" |
| L1 工作流 | 半自动,人触发 | 50% | "我每天早上跑 cron,给老板发日报" |
| L2 半托管 | 自动跑,异常时人接手 | 20% | "客户线索挖掘 Agent,每周看一次质量" |
| L3 无人监管 | 全自动,人只看结果 | <5% | "内容生产 Agent,自己选题/写/发,按效果优化" |
公司绝大多数项目要做到 L2 才能交付。L3 是终极目标。
二、L3 流水线必备的 6 大组件
┌─────────────────────────────────────────────────────────────┐
│ 1. 输入源(Trigger) │
│ - 定时(cron)/ 事件(webhook)/ 信号(监听数据源) │
└────────────────┬────────────────────────────────────────────┘
│
┌────────────────┴────────────────────────────────────────────┐
│ 2. 输入归一化(Normalize) │
│ - 把任何形态的输入转成结构化的 task │
└────────────────┬────────────────────────────────────────────┘
│
┌────────────────┴────────────────────────────────────────────┐
│ 3. Agent 集群(Workers) │
│ - 多 Agent 协作完成任务 │
│ - 内含 Skills + MCP │
└────────────────┬────────────────────────────────────────────┘
│
┌────────────────┴────────────────────────────────────────────┐
│ 4. 质量门槛(Quality Gate) │
│ - 自动评估输出质量,不达标自动重试 / 升级模型 │
└────────────────┬────────────────────────────────────────────┘
│
┌────────────────┴────────────────────────────────────────────┐
│ 5. 交付通道(Delivery) │
│ - 写库 / 推送 / 邮件 / 飞书 / API │
└────────────────┬────────────────────────────────────────────┘
│
┌────────────────┴────────────────────────────────────────────┐
│ 6. 可观测性(Observability) │
│ - 日志 / 成本 / 错误率 / 人工反馈回流 │
└─────────────────────────────────────────────────────────────┘做不到 6 大组件齐全 = 流水线不算成熟。刚入职的股东最常缺第 4 和第 6 项。
三、公司当前在跑的几条流水线(参考)
3.1 Lead Generation Agent(客户线索挖掘)
- 输入:ICP 配置(行业 / 地区 / 规模 / 信号词)
- 流水:
- 自动发现公司池(ENScan_GO API + 关键词搜索)
- 多源富化(官网、招聘、企查查、舆情)
- 抽取关键属性 + 信号打分
- 入库 + 推送给销售
- 现状:L2,每周抽样人工 review 10%
3.2 Future Opportunity Agent(未来机会探索)
- 输入:客户的产业 brief(如"中高端智能沙发")
- 流水:
- 联网研究(CES、Deloitte、Apple visionOS、Matter…)
- 趋势 / 场景 / Persona / 访谈 / 技术 / 机会六阶段生成
- 专家 review
- 输出战略报告 (json + markdown)
- 现状:L1-L2
3.3 Course Site Builder(课程站点构建)
- 输入:原始教程仓库 / VitePress / MkDocs / 原始 markdown
- 流水:
- 自动识别站点类型
- 智能裁剪 + 汇编
- 路径规整 + 跨链接修复
- 部署
- 现状:L2
学习方式:上面三条流水的代码 / 配置都在公司内部仓库。未来股东入职第一个月的任务之一:读一遍其中任一条流水的源码 + 写一份学习笔记到 Vault。
四、设计你的第一条流水线(实战作业)
Step 1:找一个"你自己每周都重复做的事"
例如:
- 每周一早上读 5 个 newsletter,整理成一份摘要
- 每周给老板发周报(数据 + 进展 + 风险)
- 每天早上看招聘网站,抓潜在候选人简历
Step 2:拆成 6 大组件
| 组件 | 你的设计 |
|---|---|
| Trigger | 周一 8:00 cron |
| Normalize | 把订阅源转成 article list |
| Workers | Agent 1:分类;Agent 2:摘要;Agent 3:写综述 |
| Quality Gate | 字数 / 重复度 / 来源数量 |
| Delivery | 推送到飞书 + 写入 Obsidian |
| Observability | 写日志 + 失败时短信 |
Step 3:用公司 starter 起项目
bash
cp -r ~/projects/_starters/agent-product-starter ~/projects/my-pipeline
cd ~/projects/my-pipelineStep 4:让它先跑起来(L1 即可)
不要追求一步到位 L3。先 L1 跑一周 → 收集失败案例 → 升级到 L2。
五、何时升级到 L3
只有满足以下条件,才考虑升级到 L3:
- [ ] 连续 4 周 L2 运行,人工干预 < 20%
- [ ] 有明确的错误重试 / 升级模型策略
- [ ] 有完整的可观测性(每条任务都能被追踪到)
- [ ] 输出有自动评分机制(不是人评,是 LLM-as-Judge 评)
- [ ] 成本可控(单条任务 Token 成本 < 收益的 30%)
强行 L3 = 风险翻倍但效果未必好。忍住。
六、避坑指南(公司踩过的坑)
| 坑 | 解法 |
|---|---|
| Agent 卡在某一步无限循环 | 设硬性 step 上限(≤ 30)+ 超时 |
| 一个任务 Token 飙到几十块 | 加成本上限保险丝 + 降级到小模型 |
| 输出质量飘忽 | 加 Quality Gate + 自动重试 |
| 数据源变化 / 网站改版 | 加监控,failure rate 上升时报警 |
| Agent 自己改了不该改的文件 | 严格限制工具白名单,只读 / 只写指定目录 |
| Skill 越加越多互相打架 | 一个流水只挂"必要"的 Skill,不要全装 |
七、长期目标
每个工程师都应该至少拥有 1 条属于自己的 L2+ 流水线。
这条流水线 = 你在公司的"个人资产"。 它越成熟,你越值钱,公司越离不开你。 它是你的核心壁垒,也是公司的核心资产。
我们希望未来你回头看:
- 你在公司创造的最大价值,不是你写过多少代码
- 而是 你设计并运营了几条无人监管流水线
八、参考资料
- 📚 Anthropic - Building effective agents
- 📚 LangGraph workflow patterns
- 📚 公司内部 Lead Generation / Future Opportunity / Course Site Builder 仓库(内网)
继续 → 99 · 附录