公司集体 AI 上头怎么办？

这两年我见过太多“我们要全面 AI 化”的场面。

老板很兴奋，团队很紧张，供应商很会讲故事。PPT 里全是 Agent、自动化、知识库、工作流、降本增效。听起来每个岗位都能立刻多出三个虚拟同事，第二天公司就能少开一半会。

可真落到业务里，很多项目就开始露馅：需求没拆清楚，数据不干净，权限没设计，结果没人验，最后变成一群人在给 AI 擦屁股。

所以 Hacker News 上那条 “I believe there are entire companies right now under AI psychosis” 冲到 1870 分、1055 条评论，我一点都不意外。

这个词有点狠，AI psychosis，直译像“AI 精神错乱”。我不太喜欢把它医学化，但这个表达戳中了一个真实现象：有些公司不是在使用 AI，而是在集体被 AI 的想象力带着跑。

我的判断很简单：AI 真有用，但公司集体 AI 上头，比不用 AI 更危险。

不用 AI，最多慢一点。上头之后乱用 AI，可能会把流程、判断和责任边界全搅乱。

“AI 上头”通常长什么样

最常见的症状，是把 demo 当产品。

一个 Agent 在演示里自动读邮件、写方案、改代码、发报告，十分钟看完确实很爽。问题是，demo 的世界通常很干净：输入清楚，权限开放，错误不追责，边界没人问。

真实公司不是这样。

真实公司里，客户资料可能不完整，合同条款有坑，历史代码没人敢动，内部知识库三年没更新。一个人在这种环境里犯错，至少还知道自己在赌什么。AI 犯错时，最麻烦的地方不是它会错，而是它错得很像真的。

第二个症状，是把“能生成”误认为“能负责”。

AI 可以生成一份漂亮的市场分析，也可以把会议纪要整理成行动项，还能写一封语气很得体的客户邮件。但生成不等于判断，更不等于承担后果。

这件事在企业里特别容易被忽略。因为 AI 输出看上去太完整了，完整到让人误以为它已经完成了思考。其实它只是完成了表达。

表达便宜了，不代表决策也便宜了。

第三个症状，是把所有问题都塞给 Agent。

招聘要 Agent，销售要 Agent，客服要 Agent，研发也要 Agent。听起来像一场生产力革命，实际经常是把原本没理顺的流程，外包给一个更难调试的系统。

坏流程加上 AI，不会自动变成好流程。它只会变成跑得更快的坏流程。

企业为什么这么容易上头

我觉得原因有三层。

第一层是焦虑。

这波 AI 来得太快，快到很多管理者产生一种恐惧：如果我不立刻做点什么，公司是不是就落后了？这种焦虑会把正常的技术评估扭曲成表态比赛。谁先喊“全面接入 AI”，谁看起来就更有未来感。

第二层是指标诱惑。

AI 很适合写进 KPI。自动化率提升多少，客服响应时间下降多少，代码产出增加多少，会议纪要节省多少小时。这些数字看起来漂亮，也容易汇报。

可最关键的指标往往没那么好看：错误率谁来验？误伤客户谁负责？模型幻觉造成的返工算谁的成本？员工为了让 AI 能用多花的标注、清洗、提示词和复核时间，又算在哪里？

如果只算 AI 省下来的时间，不算人类补洞的时间，那就是自欺欺人。

第三层是供应商叙事太顺滑。

“让每个人拥有一个 AI 助手”是好故事，“用 Agent 重塑业务流程”也是好故事。好故事的问题在于，它会让复杂的落地细节显得像扫兴。

权限、审计、回滚、数据边界、人工复核、失败预案，这些东西没有 demo 酷，但它们决定了 AI 到底是工具，还是事故放大器。

Agent 不是魔法，是新同事

我更愿意把 Agent 当成“新同事”，而不是“魔法按钮”。

这个新同事很特别：读东西快，写东西快，不怕重复劳动，能 24 小时在线。但它也有几个硬伤：不知道自己什么时候错，不天然理解你的组织语境，容易把相似当正确，也不会为后果负责。

所以你不能只问：“它能不能做这件事？”

你还要问：

它错了会怎样？
谁能发现它错了？
发现之后能不能回滚？
它用了哪些数据？
它有没有权限看到这些数据？
输出结果进入正式流程前，有没有人类签字？

这些问题一点都不性感。但我现在越来越觉得，真正会用 AI 的团队，差距不在 prompt 写得多花，而在这类问题问得够不够早。

给小团队的“别上头检查表”

如果一个团队准备上 AI Agent，我会先让它过一遍这个检查表。

1. 先选低风险、高重复的场景

别一上来就让 AI 处理合同、财务、医疗建议、关键客户沟通和生产环境发布。

更好的起点是：资料整理、会议纪要、内部知识库问答、低风险代码重构、客服草稿、竞品信息收集。这些场景就算 AI 出错，也比较容易被人发现和纠正。

AI 的第一份工作，应该是当助理，不是当老板。

2. 把“验证成本”写进预算

很多 AI 项目失败，不是模型太贵，而是验证太贵。

你让 AI 写一份报告，省了两小时。结果为了确认数据、口径、引用和结论，又花三小时复核。账一算，反而亏了。

所以每个 AI 场景都要提前问一句：复核这件事要花多久？如果复核成本接近人工重做，那这个场景就不适合现在自动化。

3. 保留人工断点

Agent 最危险的不是生成内容，而是自动执行。

读资料、起草、总结、建议，都可以大胆一点。发邮件、改价格、删数据、下订单、上线代码，就必须慢一点。

我喜欢一个简单原则：AI 可以加速准备，人类负责最终动作。

等系统跑稳定了，再逐步放权。别一开始就把钥匙全交出去。

4. 给 AI 工作流做日志

如果一个 Agent 做了什么，没人能回看，那就别上生产。

它读了什么、调用了什么工具、生成了什么版本、谁批准了、什么时候执行的，都应该留下记录。否则出了问题只能靠猜，猜到最后就是互相甩锅。

日志不是官僚主义。对 Agent 来说，日志就是安全带。

5. 允许团队说“不值得”

这是最容易被忽略的一条。

不是每个流程都值得 AI 化。很多事情人工做十分钟，AI 化要折腾三天，还引入一堆新风险。那就别硬上。

成熟的 AI 文化，不是“凡事都用 AI”，而是知道哪些地方该用，哪些地方别碰。

我对这波 AI 热的真实态度

我并不反 AI。恰恰相反，我觉得 AI Agent 会重塑很多工作方式。GitHub 月榜里 skills、agent memory、code context 这些项目一起升温，Product Hunt 上 Agentmemory 也进了日榜，这些都说明 Agent 基建在变成熟。

但越是这样，越要警惕上头。

工具越强，错误就越会被放大。一个普通员工写错一封邮件，影响有限；一个接了 CRM、邮箱、知识库和工单系统的 Agent 如果乱跑，影响就不是一个量级。

真正靠谱的 AI 落地，不应该像宗教运动。它更像工程管理：小步试点，明确边界，认真验收，持续复盘。

这听起来没那么热血，但我喜欢这种笨办法。因为它能活下来。

结尾：兴奋可以，别失智

AI 这一波最迷人的地方，是它真的让很多以前做不到的事变得可做。一个小团队可以拥有过去大公司才有的自动化能力，一个普通人也能把研究、写作、编程、设计串成自己的工作流。

兴奋是正常的。

但兴奋不能替代判断。

如果一家公司开始把“我们用了 AI”当成答案，而不是继续追问“它到底解决了什么问题、带来了什么风险、谁来负责结果”，那就已经有点危险了。

我的建议很土：把 AI 当成能力很强但需要监督的新同事。给它任务，给它边界，给它日志，给它复核。别跪拜，也别妖魔化。

能做到这一点的团队，才是真正在用 AI。

剩下那些，只是在集体上头。

参考链接

Hacker News：I believe there are entire companies right now under AI psychosis：https://news.ycombinator.com/item?id=48153379
Mitchell Hashimoto 原帖：https://twitter.com/mitchellh/status/2055380239711457578
Hacker News：Frontier AI has broken the open CTF format：https://news.ycombinator.com/item?id=48157559
Product Hunt：Agentmemory：https://www.producthunt.com/posts/agentmemory
GitHub：mattpocock/skills：https://github.com/mattpocock/skills
GitHub：rohitg00/agentmemory：https://github.com/rohitg00/agentmemory

“AI 上头”通常长什么样#

企业为什么这么容易上头#

Agent 不是魔法，是新同事#

给小团队的“别上头检查表”#

1. 先选低风险、高重复的场景#

2. 把“验证成本”写进预算#

3. 保留人工断点#

4. 给 AI 工作流做日志#

5. 允许团队说“不值得”#

我对这波 AI 热的真实态度#

结尾：兴奋可以，别失智#

参考链接#