这两年我见过太多“我们要全面 AI 化”的场面。
老板很兴奋,团队很紧张,供应商很会讲故事。PPT 里全是 Agent、自动化、知识库、工作流、降本增效。听起来每个岗位都能立刻多出三个虚拟同事,第二天公司就能少开一半会。
可真落到业务里,很多项目就开始露馅:需求没拆清楚,数据不干净,权限没设计,结果没人验,最后变成一群人在给 AI 擦屁股。
所以 Hacker News 上那条 “I believe there are entire companies right now under AI psychosis” 冲到 1870 分、1055 条评论,我一点都不意外。
这个词有点狠,AI psychosis,直译像“AI 精神错乱”。我不太喜欢把它医学化,但这个表达戳中了一个真实现象:有些公司不是在使用 AI,而是在集体被 AI 的想象力带着跑。
我的判断很简单:AI 真有用,但公司集体 AI 上头,比不用 AI 更危险。
不用 AI,最多慢一点。上头之后乱用 AI,可能会把流程、判断和责任边界全搅乱。
“AI 上头”通常长什么样
最常见的症状,是把 demo 当产品。
一个 Agent 在演示里自动读邮件、写方案、改代码、发报告,十分钟看完确实很爽。问题是,demo 的世界通常很干净:输入清楚,权限开放,错误不追责,边界没人问。
真实公司不是这样。
真实公司里,客户资料可能不完整,合同条款有坑,历史代码没人敢动,内部知识库三年没更新。一个人在这种环境里犯错,至少还知道自己在赌什么。AI 犯错时,最麻烦的地方不是它会错,而是它错得很像真的。
第二个症状,是把“能生成”误认为“能负责”。
AI 可以生成一份漂亮的市场分析,也可以把会议纪要整理成行动项,还能写一封语气很得体的客户邮件。但生成不等于判断,更不等于承担后果。
这件事在企业里特别容易被忽略。因为 AI 输出看上去太完整了,完整到让人误以为它已经完成了思考。其实它只是完成了表达。
表达便宜了,不代表决策也便宜了。
第三个症状,是把所有问题都塞给 Agent。
招聘要 Agent,销售要 Agent,客服要 Agent,研发也要 Agent。听起来像一场生产力革命,实际经常是把原本没理顺的流程,外包给一个更难调试的系统。
坏流程加上 AI,不会自动变成好流程。它只会变成跑得更快的坏流程。
企业为什么这么容易上头
我觉得原因有三层。
第一层是焦虑。
这波 AI 来得太快,快到很多管理者产生一种恐惧:如果我不立刻做点什么,公司是不是就落后了?这种焦虑会把正常的技术评估扭曲成表态比赛。谁先喊“全面接入 AI”,谁看起来就更有未来感。
第二层是指标诱惑。
AI 很适合写进 KPI。自动化率提升多少,客服响应时间下降多少,代码产出增加多少,会议纪要节省多少小时。这些数字看起来漂亮,也容易汇报。
可最关键的指标往往没那么好看:错误率谁来验?误伤客户谁负责?模型幻觉造成的返工算谁的成本?员工为了让 AI 能用多花的标注、清洗、提示词和复核时间,又算在哪里?
如果只算 AI 省下来的时间,不算人类补洞的时间,那就是自欺欺人。
第三层是供应商叙事太顺滑。
“让每个人拥有一个 AI 助手”是好故事,“用 Agent 重塑业务流程”也是好故事。好故事的问题在于,它会让复杂的落地细节显得像扫兴。
权限、审计、回滚、数据边界、人工复核、失败预案,这些东西没有 demo 酷,但它们决定了 AI 到底是工具,还是事故放大器。
Agent 不是魔法,是新同事
我更愿意把 Agent 当成“新同事”,而不是“魔法按钮”。
这个新同事很特别:读东西快,写东西快,不怕重复劳动,能 24 小时在线。但它也有几个硬伤:不知道自己什么时候错,不天然理解你的组织语境,容易把相似当正确,也不会为后果负责。
所以你不能只问:“它能不能做这件事?”
你还要问:
- 它错了会怎样?
- 谁能发现它错了?
- 发现之后能不能回滚?
- 它用了哪些数据?
- 它有没有权限看到这些数据?
- 输出结果进入正式流程前,有没有人类签字?
这些问题一点都不性感。但我现在越来越觉得,真正会用 AI 的团队,差距不在 prompt 写得多花,而在这类问题问得够不够早。
给小团队的“别上头检查表”
如果一个团队准备上 AI Agent,我会先让它过一遍这个检查表。
1. 先选低风险、高重复的场景
别一上来就让 AI 处理合同、财务、医疗建议、关键客户沟通和生产环境发布。
更好的起点是:资料整理、会议纪要、内部知识库问答、低风险代码重构、客服草稿、竞品信息收集。这些场景就算 AI 出错,也比较容易被人发现和纠正。
AI 的第一份工作,应该是当助理,不是当老板。
2. 把“验证成本”写进预算
很多 AI 项目失败,不是模型太贵,而是验证太贵。
你让 AI 写一份报告,省了两小时。结果为了确认数据、口径、引用和结论,又花三小时复核。账一算,反而亏了。
所以每个 AI 场景都要提前问一句:复核这件事要花多久?如果复核成本接近人工重做,那这个场景就不适合现在自动化。
3. 保留人工断点
Agent 最危险的不是生成内容,而是自动执行。
读资料、起草、总结、建议,都可以大胆一点。发邮件、改价格、删数据、下订单、上线代码,就必须慢一点。
我喜欢一个简单原则:AI 可以加速准备,人类负责最终动作。
等系统跑稳定了,再逐步放权。别一开始就把钥匙全交出去。
4. 给 AI 工作流做日志
如果一个 Agent 做了什么,没人能回看,那就别上生产。
它读了什么、调用了什么工具、生成了什么版本、谁批准了、什么时候执行的,都应该留下记录。否则出了问题只能靠猜,猜到最后就是互相甩锅。
日志不是官僚主义。对 Agent 来说,日志就是安全带。
5. 允许团队说“不值得”
这是最容易被忽略的一条。
不是每个流程都值得 AI 化。很多事情人工做十分钟,AI 化要折腾三天,还引入一堆新风险。那就别硬上。
成熟的 AI 文化,不是“凡事都用 AI”,而是知道哪些地方该用,哪些地方别碰。
我对这波 AI 热的真实态度
我并不反 AI。恰恰相反,我觉得 AI Agent 会重塑很多工作方式。GitHub 月榜里 skills、agent memory、code context 这些项目一起升温,Product Hunt 上 Agentmemory 也进了日榜,这些都说明 Agent 基建在变成熟。
但越是这样,越要警惕上头。
工具越强,错误就越会被放大。一个普通员工写错一封邮件,影响有限;一个接了 CRM、邮箱、知识库和工单系统的 Agent 如果乱跑,影响就不是一个量级。
真正靠谱的 AI 落地,不应该像宗教运动。它更像工程管理:小步试点,明确边界,认真验收,持续复盘。
这听起来没那么热血,但我喜欢这种笨办法。因为它能活下来。
结尾:兴奋可以,别失智
AI 这一波最迷人的地方,是它真的让很多以前做不到的事变得可做。一个小团队可以拥有过去大公司才有的自动化能力,一个普通人也能把研究、写作、编程、设计串成自己的工作流。
兴奋是正常的。
但兴奋不能替代判断。
如果一家公司开始把“我们用了 AI”当成答案,而不是继续追问“它到底解决了什么问题、带来了什么风险、谁来负责结果”,那就已经有点危险了。
我的建议很土:把 AI 当成能力很强但需要监督的新同事。给它任务,给它边界,给它日志,给它复核。别跪拜,也别妖魔化。
能做到这一点的团队,才是真正在用 AI。
剩下那些,只是在集体上头。
参考链接
- Hacker News:I believe there are entire companies right now under AI psychosis:https://news.ycombinator.com/item?id=48153379
- Mitchell Hashimoto 原帖:https://twitter.com/mitchellh/status/2055380239711457578
- Hacker News:Frontier AI has broken the open CTF format:https://news.ycombinator.com/item?id=48157559
- Product Hunt:Agentmemory:https://www.producthunt.com/posts/agentmemory
- GitHub:mattpocock/skills:https://github.com/mattpocock/skills
- GitHub:rohitg00/agentmemory:https://github.com/rohitg00/agentmemory