站在 2025 的末尾，展望 2026

回望 2025 我们经历了许多

年初的 DeepSeek 爆火，让千千万万的普通人第一次“知道并真正了解”了 AI；Manus 的走红，开创了 Agent 的新纪元，让通用 Agent 的概念不再是论文里的冰冷符号。

Claude 4、GPT-5 的推出，让我们见识到了模型能力的快速崛起。

Kimi K2 让我见识到了国产厂商也能做出真正好用的模型，不再停留在纸面参数。

Nano Banana 的惊艳，让我们见识到了统一多模态设计的强大：把文本理解、图像生成、编辑处理等能力整合在单一模型中，体验上第一次有了“文生图能用”的顺滑感。

Sora 2 让我们见识到了视频生成完成度上了一个巨大的台阶，某些场景里甚至能做到以假乱真。

Gemini 3 的横空出世、GPT-5.2 的紧急推出，也在不断颠覆我们的认知。

2025 AI 产品

在经历的过程中可能不觉得怎么样，但回望一看竟发现天翻地覆。AI 已经彻底且永久融入我的工作和生活——我不知道别人是什么状态，对我来说，AI 已经成为了新时代的“煤水电”。
很多时候它甚至不是“要不要用”，而是“默认就会有”：写一段更稳的文案、把一个模糊的想法快速落成结构、把一坨报错从线索里捋清楚、把重复劳动压到最低……它慢慢变成了我的工作流背景噪音，安静但必不可少。

对于AI能做什么事情的认知也在发生极其快速且巨大的变化

2025 Agent

年初还只是一个对话机器人：能说话，能回答问题，能写点代码（也仅限于写）。
到了年末，Agent 已经是个标配：能写出更专业、更高质量的文本；能写代码、能运行代码、能执行操作；能生成或者编辑高质量图片。

从工作来说，现在的 Agent 已经不是当初的傻白甜。With tool，它已经成长成了巨人：第一次拥有了“读取和操作世界”的能力。年初的时候你很难想象，Agent 会如此彻底地融入工作流程：Coding 有 Coding Agent，CR 有 CR Agent，只要是能说清楚的场景，基本都有了对应的 Agent 解决方案，Agent 也已经在企业里遍地开花。

AI 浏览器（browser use）也从技术玩具变成了大众可以接触到的“能力”。技术不再稀有和高贵，豆包手机的推出更让我看到 Mobile use 居然已经这么成熟：很多过去需要“会一点技术、会一点配置”的事，现在普通人也能直接上手完成。

Coding Agent 更是高度可用 Cursor、Claude Code、Codex、Trae 等产品不论是创新还是抄袭，AI IDE 或者 CLI 已经进入了每个开发者的手中。年初我们还不敢想象3年内 AI 能写出能用的代码，但是当我写下这段文本的时候我追求100%的AI Coding，我们不再质疑它能不能写出能用的代码，而是考虑还有什么“小问题”影响了它的发挥，是对项目的上下文还是人生经验

对于Agent的架构设计，也在快速变化

得益于模型的进步，tool use 在今年有了质的突破。去年流行的 workflow，在今年不再“绝对正确”；取而代之的是 ReAct 等更智能、更动态的架构思路的流行：让模型拥有更强的自主决策能力，也让 Agent 的灵活性和易用性有了巨大的提升。

“记忆”在今年也有了长足的发展：从技术实验到家家必有的基础设施。年初的时候我们什么都不管，直接把内容往模型里塞，塞多了自然就“傻”了；但现在长短期记忆、知识图谱等一系列手段已经不再新鲜，大家更关心的是：怎么更稳、更便宜、可控地把“记住”这件事落到工程里。

规划、Task 等技术也逐步落地，并在 Agent 中发挥重要作用：让 Agent 能干活、干好活、准确地干活。

2025 Agent 架构

生态和规范不断提出、更新、替代

2025 Agent 生态

MCP、llms.txt、Agent.md、Agent Skill 等一系列规范的诞生，直接把生态推向“疯狂生长”。

我们很少看到如此井喷且迅速的变化，令人兴奋。我对此感到无比幸福，也很感谢这个时代；但同时也会对自己没有更深入地卷入其中感到不快——这或许会成为我 2026 的重点：更主动、更深地参与到浪潮里。

展望 2026，AI 将会再一次把世界上每个人卷入其中。模型将在巨大投资和人类智慧的加持下更快成长；Agent 应用会更深入地解决工作、流程与效率问题；AI 产品也会向着更丰富的方向前进，不断给人惊喜与赞叹，时代的浪潮滚滚。