过去一年,我们已经被 AI 训练出一种习惯:
问一个问题,等它吐一大段 Markdown。
标题、列表、表格、加粗、代码块。看起来很规整,也确实比纯文本舒服很多。但说实话,我现在越来越觉得,只让 AI 输出 Markdown,有点像买了台彩电却只拿它听广播。
Markdown 很好。它轻、干净、可复制,适合写笔记和文档。
可问题是,很多时候我们真正想要的并不是“文字”,而是一个能直接看的东西:一份报告、一个仪表盘、一页方案、一组卡片、一套小型幻灯片,甚至是一个可以点击、可以筛选、可以打印的页面。
这也是为什么我看到 Karpathy 那条推文时,会觉得它很值得写。他说,在向 LLM 提问的最后加一句:structure your response as HTML,然后把生成的文件丢进浏览器里看,效果很好。他还提到,也可以让 LLM 把输出做成 slideshow。
这招听起来小,但我觉得方向很大。
AI 的输出,不应该永远停在“回答”这一层。它正在变成一种临时软件、临时页面、临时界面。
Markdown 的问题,不是弱,而是太像“中间产物”
Markdown 当然有价值。程序员喜欢它,写作者喜欢它,知识库也喜欢它。
但如果你站在普通用户角度看,Markdown 往往还差最后一公里。
比如你让 AI 帮你整理一份市场调研。它给你 Markdown 表格,你还要复制到文档里,调整列宽,改标题层级,把重点信息做成卡片。
你让 AI 帮你做一个竞品分析。它给你五级标题和项目符号,你还要自己判断哪些内容适合放在第一页,哪些内容适合做成对比矩阵。
你让 AI 帮你总结一份会议材料。它给你一坨结构化文字,但你真正想发给同事的,可能是一页干净的行动清单,带优先级、负责人、截止时间和风险提示。
这就是 Markdown 的尴尬:它比纯文本更结构化,但离“可直接交付”还有距离。
HTML 则不一样。
HTML 可以直接被浏览器理解。它天然支持布局、颜色、组件、链接、图片、表格、按钮和交互。你不需要先把它翻译到另一个工具里,它自己就可以成为交付物。
这就是 Karpathy 这招好玩的地方。它不是在教你一个提示词技巧,而是在提醒我们:浏览器本来就是世界上最普及的内容运行环境。
让 AI 输出 HTML,本质上是在把“答案”变成“界面”
同一个需求,用 Markdown 和 HTML 输出,体验差别很明显。
假设你让 AI 分析一批用户反馈。
Markdown 版本大概率长这样:
- 用户主要抱怨加载慢
- 第二类问题是支付失败
- 第三类问题是新手引导看不懂
- 建议优先修复性能问题
这能看,但很平。
HTML 版本可以做成另一种东西:
- 顶部是一行关键指标
- 中间是问题分类卡片
- 左侧是用户原话摘录
- 右侧是修复优先级
- 底部是下周行动清单
如果再加一点 JavaScript,它甚至可以筛选标签、切换视图、展开原文。
这时 AI 给你的就不再是“一个回答”,而是一个小工具。
这件事对内容创作者尤其有用。公众号、博客、小红书、演示稿,本质上都不只是文字,它们都是某种“信息界面”。以前我们让 AI 写稿,再自己排版。现在更好的做法可能是:让 AI 先把信息组织成一个可视化页面,再从页面里提炼成文章、图片或视频脚本。
换句话说,不要只让 AI 当写手。让它先当半个设计师和前端。
当然,别把这话理解成“以后大家都要学前端”。恰恰相反,HTML 输出的价值在于,普通人不需要真的写 HTML。你只要会说清楚想要什么样的页面,AI 就能先给你一个可看的版本。
为什么这件事现在突然更值得做
如果只是 Karpathy 一个人说“HTML 输出不错”,那它还只是一个使用技巧。
但今天的信号不止这一条。
Product Hunt 日榜里有一个产品叫 display.dev,定位很直接:把 agent 生成的 HTML 发布到公司认证后面。也就是说,它默认承认一件事:Agent 生成 HTML 页面会越来越常见,而且企业内部需要一种安全、可控的发布方式。
GitHub 月榜里还有 ppt-master,它做的是从文档生成原生可编辑的 PPTX。这个项目和 HTML 不是同一种格式,但背后的方向很像:AI 不再只是吐文字,而是在生成更接近最终交付物的文件。
再看 Product Hunt 上的 Jotform Claude App,用户可以在 Claude 里构建、编辑、分析表单。表单也不是“回答”,它是一种可操作界面。
这些信号放在一起,我觉得很清楚:
AI 输出的竞争,正在从“谁答得更长”转向“谁更接近可用结果”。
这其实挺符合常识。用户不是为了读 AI 的作文才用 AI。用户是为了少做一步、快交付一点、把脑子里的东西变成能发出去、能运行、能协作的东西。
Markdown 只是中间层。HTML、PPTX、表单、仪表盘、工作流,才更接近“结果”。
哪些场景最适合直接要 HTML
我会优先在这几类场景里让 AI 输出 HTML。
第一,报告和摘要
比如每周工作总结、行业观察、竞品分析、投研摘要。
这类内容如果只是 Markdown,很容易变成一篇长文。可如果做成 HTML 页面,就可以有摘要区、重点卡片、数据表格、风险提示和行动项。读者不用从头读到尾,也能快速抓重点。
第二,演示和讲解
Karpathy 提到 slideshow,我觉得这个方向很实用。
你可以让 AI 直接生成一个 HTML 幻灯片。每一屏一个观点,配简单布局和讲稿备注。它未必能替代专业 PPT,但足够用来做内部分享、课程草稿、短视频分镜。
尤其是早期构思阶段,HTML slideshow 比打开 PPT 慢慢拖框舒服多了。
第三,数据整理和对比
比如工具选型、产品价格对比、候选方案评估。
Markdown 表格一长就难看,手机上尤其难受。HTML 可以做折叠、筛选、固定表头、颜色标记。信息量一大,优势立刻出来。
第四,个人知识库里的“可视化卡片”
很多笔记不应该只是文字。一本书的核心观点、一项技术的学习路线、一篇论文的结构,都可以被整理成网页卡片。
这类页面不一定要发布到公网。放在本地浏览器里看,也很舒服。
但别兴奋过头,HTML 也有坑
我挺喜欢这个方向,但它不是银弹。
第一个坑是安全。AI 生成 HTML 时,如果带上外部脚本、可疑链接、复杂 JS,就不能随便打开或发布。内部使用时,最好要求它生成“单文件、无外链、无远程脚本”的版本。
第二个坑是审美。AI 很容易生成那种看起来像 SaaS 官网模板的页面:大渐变、大卡片、大阴影,乍看高级,细看全是套路。我的建议是,先让它做结构,再慢慢调样式。别一上来就追求“惊艳”。
第三个坑是维护。Markdown 很适合长期保存,因为它稳定、可读。HTML 更适合展示和交付,不一定适合当唯一源文件。重要内容最好还是保留一份 Markdown 或纯文本源稿。
第四个坑是事实核查。页面做漂亮了,人会更容易相信它。这个反而危险。AI 生成的 HTML 报告,引用、数据、链接都要查。别让排版替内容背书。
我会怎么用这招
如果你想马上试,我建议别从大任务开始。
可以直接丢给 AI 这段提示:
请把你的回答做成一个单文件 HTML 页面。
要求:
1. 不使用外部 JS 和 CSS;
2. 顶部先给 5 条关键结论;
3. 中间用卡片展示详细分析;
4. 底部给行动清单;
5. 视觉风格简洁,适合在浏览器里阅读。
如果是报告类任务,再补一句:
请把重要数据做成表格,并用颜色区分高、中、低优先级。
如果是演示类任务,可以改成:
请生成一个单文件 HTML slideshow,每页只讲一个观点,支持左右方向键切换。
这几个提示不复杂,但效果往往比“请用 Markdown 输出”更接近可交付物。
最后一句
我不觉得 Markdown 会过时。它太好用了,尤其适合长期写作、知识库和版本管理。
但我觉得,我们该少一点默认反应:别每次都让 AI 给一坨 Markdown。
有些时候,直接说“给我一个 HTML 页面”,会更接近你真正想要的结果。
这背后真正的变化是:AI 不再只是聊天框里的回答机器,它开始能临时生成界面、文档、页面和小工具。
而浏览器,就是普通人最容易打开的运行环境。
所以 Karpathy 这招火,我一点都不意外。它不是炫技,它只是把很多人忽略的一层捅破了:
既然 AI 已经能组织信息,为什么还非得让它只交一份文字稿?
参考链接
- Andrej Karpathy 关于让 LLM 输出 HTML 的推文:https://x.com/karpathy/status/2053872850101285137
- Product Hunt:display.dev,“Publish agent-generated HTML behind company auth”: https://www.producthunt.com/posts/display-dev
- GitHub:hugohe3/ppt-master,AI 生成原生可编辑 PPTX:https://github.com/hugohe3/ppt-master
- Product Hunt:Jotform Claude App,“Build, edit, and analyze forms directly in Claude”: https://www.producthunt.com/posts/jotform-claude-app