这两年我见过太多“我们要全面 AI 化”的场面。

老板很兴奋,团队很紧张,供应商很会讲故事。PPT 里全是 Agent、自动化、知识库、工作流、降本增效。听起来每个岗位都能立刻多出三个虚拟同事,第二天公司就能少开一半会。

可真落到业务里,很多项目就开始露馅:需求没拆清楚,数据不干净,权限没设计,结果没人验,最后变成一群人在给 AI 擦屁股。

所以 Hacker News 上那条 “I believe there are entire companies right now under AI psychosis” 冲到 1870 分、1055 条评论,我一点都不意外。

这个词有点狠,AI psychosis,直译像“AI 精神错乱”。我不太喜欢把它医学化,但这个表达戳中了一个真实现象:有些公司不是在使用 AI,而是在集体被 AI 的想象力带着跑。

我的判断很简单:AI 真有用,但公司集体 AI 上头,比不用 AI 更危险。

不用 AI,最多慢一点。上头之后乱用 AI,可能会把流程、判断和责任边界全搅乱。

“AI 上头”通常长什么样

最常见的症状,是把 demo 当产品。

一个 Agent 在演示里自动读邮件、写方案、改代码、发报告,十分钟看完确实很爽。问题是,demo 的世界通常很干净:输入清楚,权限开放,错误不追责,边界没人问。

真实公司不是这样。

真实公司里,客户资料可能不完整,合同条款有坑,历史代码没人敢动,内部知识库三年没更新。一个人在这种环境里犯错,至少还知道自己在赌什么。AI 犯错时,最麻烦的地方不是它会错,而是它错得很像真的。

第二个症状,是把“能生成”误认为“能负责”。

AI 可以生成一份漂亮的市场分析,也可以把会议纪要整理成行动项,还能写一封语气很得体的客户邮件。但生成不等于判断,更不等于承担后果。

这件事在企业里特别容易被忽略。因为 AI 输出看上去太完整了,完整到让人误以为它已经完成了思考。其实它只是完成了表达。

表达便宜了,不代表决策也便宜了。

第三个症状,是把所有问题都塞给 Agent。

招聘要 Agent,销售要 Agent,客服要 Agent,研发也要 Agent。听起来像一场生产力革命,实际经常是把原本没理顺的流程,外包给一个更难调试的系统。

坏流程加上 AI,不会自动变成好流程。它只会变成跑得更快的坏流程。

企业为什么这么容易上头

我觉得原因有三层。

第一层是焦虑。

这波 AI 来得太快,快到很多管理者产生一种恐惧:如果我不立刻做点什么,公司是不是就落后了?这种焦虑会把正常的技术评估扭曲成表态比赛。谁先喊“全面接入 AI”,谁看起来就更有未来感。

第二层是指标诱惑。

AI 很适合写进 KPI。自动化率提升多少,客服响应时间下降多少,代码产出增加多少,会议纪要节省多少小时。这些数字看起来漂亮,也容易汇报。

可最关键的指标往往没那么好看:错误率谁来验?误伤客户谁负责?模型幻觉造成的返工算谁的成本?员工为了让 AI 能用多花的标注、清洗、提示词和复核时间,又算在哪里?

如果只算 AI 省下来的时间,不算人类补洞的时间,那就是自欺欺人。

第三层是供应商叙事太顺滑。

“让每个人拥有一个 AI 助手”是好故事,“用 Agent 重塑业务流程”也是好故事。好故事的问题在于,它会让复杂的落地细节显得像扫兴。

权限、审计、回滚、数据边界、人工复核、失败预案,这些东西没有 demo 酷,但它们决定了 AI 到底是工具,还是事故放大器。

Agent 不是魔法,是新同事

我更愿意把 Agent 当成“新同事”,而不是“魔法按钮”。

这个新同事很特别:读东西快,写东西快,不怕重复劳动,能 24 小时在线。但它也有几个硬伤:不知道自己什么时候错,不天然理解你的组织语境,容易把相似当正确,也不会为后果负责。

所以你不能只问:“它能不能做这件事?”

你还要问:

  • 它错了会怎样?
  • 谁能发现它错了?
  • 发现之后能不能回滚?
  • 它用了哪些数据?
  • 它有没有权限看到这些数据?
  • 输出结果进入正式流程前,有没有人类签字?

这些问题一点都不性感。但我现在越来越觉得,真正会用 AI 的团队,差距不在 prompt 写得多花,而在这类问题问得够不够早。

给小团队的“别上头检查表”

如果一个团队准备上 AI Agent,我会先让它过一遍这个检查表。

1. 先选低风险、高重复的场景

别一上来就让 AI 处理合同、财务、医疗建议、关键客户沟通和生产环境发布。

更好的起点是:资料整理、会议纪要、内部知识库问答、低风险代码重构、客服草稿、竞品信息收集。这些场景就算 AI 出错,也比较容易被人发现和纠正。

AI 的第一份工作,应该是当助理,不是当老板。

2. 把“验证成本”写进预算

很多 AI 项目失败,不是模型太贵,而是验证太贵。

你让 AI 写一份报告,省了两小时。结果为了确认数据、口径、引用和结论,又花三小时复核。账一算,反而亏了。

所以每个 AI 场景都要提前问一句:复核这件事要花多久?如果复核成本接近人工重做,那这个场景就不适合现在自动化。

3. 保留人工断点

Agent 最危险的不是生成内容,而是自动执行。

读资料、起草、总结、建议,都可以大胆一点。发邮件、改价格、删数据、下订单、上线代码,就必须慢一点。

我喜欢一个简单原则:AI 可以加速准备,人类负责最终动作。

等系统跑稳定了,再逐步放权。别一开始就把钥匙全交出去。

4. 给 AI 工作流做日志

如果一个 Agent 做了什么,没人能回看,那就别上生产。

它读了什么、调用了什么工具、生成了什么版本、谁批准了、什么时候执行的,都应该留下记录。否则出了问题只能靠猜,猜到最后就是互相甩锅。

日志不是官僚主义。对 Agent 来说,日志就是安全带。

5. 允许团队说“不值得”

这是最容易被忽略的一条。

不是每个流程都值得 AI 化。很多事情人工做十分钟,AI 化要折腾三天,还引入一堆新风险。那就别硬上。

成熟的 AI 文化,不是“凡事都用 AI”,而是知道哪些地方该用,哪些地方别碰。

我对这波 AI 热的真实态度

我并不反 AI。恰恰相反,我觉得 AI Agent 会重塑很多工作方式。GitHub 月榜里 skills、agent memory、code context 这些项目一起升温,Product Hunt 上 Agentmemory 也进了日榜,这些都说明 Agent 基建在变成熟。

但越是这样,越要警惕上头。

工具越强,错误就越会被放大。一个普通员工写错一封邮件,影响有限;一个接了 CRM、邮箱、知识库和工单系统的 Agent 如果乱跑,影响就不是一个量级。

真正靠谱的 AI 落地,不应该像宗教运动。它更像工程管理:小步试点,明确边界,认真验收,持续复盘。

这听起来没那么热血,但我喜欢这种笨办法。因为它能活下来。

结尾:兴奋可以,别失智

AI 这一波最迷人的地方,是它真的让很多以前做不到的事变得可做。一个小团队可以拥有过去大公司才有的自动化能力,一个普通人也能把研究、写作、编程、设计串成自己的工作流。

兴奋是正常的。

但兴奋不能替代判断。

如果一家公司开始把“我们用了 AI”当成答案,而不是继续追问“它到底解决了什么问题、带来了什么风险、谁来负责结果”,那就已经有点危险了。

我的建议很土:把 AI 当成能力很强但需要监督的新同事。给它任务,给它边界,给它日志,给它复核。别跪拜,也别妖魔化。

能做到这一点的团队,才是真正在用 AI。

剩下那些,只是在集体上头。

参考链接

  • Hacker News:I believe there are entire companies right now under AI psychosis:https://news.ycombinator.com/item?id=48153379
  • Mitchell Hashimoto 原帖:https://twitter.com/mitchellh/status/2055380239711457578
  • Hacker News:Frontier AI has broken the open CTF format:https://news.ycombinator.com/item?id=48157559
  • Product Hunt:Agentmemory:https://www.producthunt.com/posts/agentmemory
  • GitHub:mattpocock/skills:https://github.com/mattpocock/skills
  • GitHub:rohitg00/agentmemory:https://github.com/rohitg00/agentmemory