回望 2025 我们经历了许多
年初的 DeepSeek 爆火,让千千万万的普通人第一次“知道并真正了解”了 AI;Manus 的走红,开创了 Agent 的新纪元,让通用 Agent 的概念不再是论文里的冰冷符号。
Claude 4、GPT-5 的推出,让我们见识到了模型能力的快速崛起。
Kimi K2 让我见识到了国产厂商也能做出真正好用的模型,不再停留在纸面参数。
Nano Banana 的惊艳,让我们见识到了统一多模态设计的强大:把文本理解、图像生成、编辑处理等能力整合在单一模型中,体验上第一次有了“文生图能用”的顺滑感。
Sora 2 让我们见识到了视频生成完成度上了一个巨大的台阶,某些场景里甚至能做到以假乱真。
Gemini 3 的横空出世、GPT-5.2 的紧急推出,也在不断颠覆我们的认知。

在经历的过程中可能不觉得怎么样,但回望一看竟发现天翻地覆。AI 已经彻底且永久融入我的工作和生活——我不知道别人是什么状态,对我来说,AI 已经成为了新时代的“煤水电”。
很多时候它甚至不是“要不要用”,而是“默认就会有”:写一段更稳的文案、把一个模糊的想法快速落成结构、把一坨报错从线索里捋清楚、把重复劳动压到最低……它慢慢变成了我的工作流背景噪音,安静但必不可少。
对于AI能做什么事情的认知也在发生极其快速且巨大的变化

年初还只是一个对话机器人:能说话,能回答问题,能写点代码(也仅限于写)。
到了年末,Agent 已经是个标配:能写出更专业、更高质量的文本;能写代码、能运行代码、能执行操作;能生成或者编辑高质量图片。
从工作来说,现在的 Agent 已经不是当初的傻白甜。With tool,它已经成长成了巨人:第一次拥有了“读取和操作世界”的能力。年初的时候你很难想象,Agent 会如此彻底地融入工作流程:Coding 有 Coding Agent,CR 有 CR Agent,只要是能说清楚的场景,基本都有了对应的 Agent 解决方案,Agent 也已经在企业里遍地开花。
AI 浏览器(browser use)也从技术玩具变成了大众可以接触到的“能力”。技术不再稀有和高贵,豆包手机的推出更让我看到 Mobile use 居然已经这么成熟:很多过去需要“会一点技术、会一点配置”的事,现在普通人也能直接上手完成。
Coding Agent 更是高度可用 Cursor、Claude Code、Codex、Trae 等产品不论是创新还是抄袭,AI IDE 或者 CLI 已经进入了每个开发者的手中。年初我们还不敢想象3年内 AI 能写出能用的代码,但是当我写下这段文本的时候我追求100%的AI Coding,我们不再质疑它能不能写出能用的代码,而是考虑还有什么“小问题”影响了它的发挥,是对项目的上下文还是人生经验
对于Agent的架构设计,也在快速变化
得益于模型的进步,tool use 在今年有了质的突破。去年流行的 workflow,在今年不再“绝对正确”;取而代之的是 ReAct 等更智能、更动态的架构思路的流行:让模型拥有更强的自主决策能力,也让 Agent 的灵活性和易用性有了巨大的提升。
“记忆”在今年也有了长足的发展:从技术实验到家家必有的基础设施。年初的时候我们什么都不管,直接把内容往模型里塞,塞多了自然就“傻”了;但现在长短期记忆、知识图谱等一系列手段已经不再新鲜,大家更关心的是:怎么更稳、更便宜、可控地把“记住”这件事落到工程里。
规划、Task 等技术也逐步落地,并在 Agent 中发挥重要作用:让 Agent 能干活、干好活、准确地干活。

生态和规范不断提出、更新、替代

MCP、llms.txt、Agent.md、Agent Skill 等一系列规范的诞生,直接把生态推向“疯狂生长”。
我们很少看到如此井喷且迅速的变化,令人兴奋。我对此感到无比幸福,也很感谢这个时代;但同时也会对自己没有更深入地卷入其中感到不快——这或许会成为我 2026 的重点:更主动、更深地参与到浪潮里。
展望 2026,AI 将会再一次把世界上每个人卷入其中。模型将在巨大投资和人类智慧的加持下更快成长;Agent 应用会更深入地解决工作、流程与效率问题;AI 产品也会向着更丰富的方向前进,不断给人惊喜与赞叹,时代的浪潮滚滚。
idevlab's Blog