NewsletterBlogGlossary

Qwen3.5 开源搅局,低代码 Agent 平台杀疯了,OpenAI 说"没有天花板"

2026-03-09 至 2026-03-13

开源多模态模型卷到飞起,两个 Agent 开发平台同时霸榜 GitHub Trending,OpenAI 放话"能力曲线没有墙"。这一周的主题很明确:AI 基础设施在加速成熟,留给"只用 API 套壳"的窗口越来越小了。


1. Qwen3.5-27B 开源:多模态开源阵营的新标杆

别再说开源模型只能跟在闭源后面吃灰了。阿里通义千问本周一口气放出 Qwen3.5 全家桶 — 27B、4B、2B 三个尺寸,旗舰 27B 是图文多模态模型,HuggingFace 上线即爆:638 likes、83.5 万次下载。(638 likes | 835.0K downloads)

27B 参数量是个聪明的选择 — 大到能打硬仗,小到单卡能跑。对比同级别的开源选手(LLaVA-Next、InternVL2),Qwen3.5 在中文场景的理解力有明显优势,毕竟是吃中文数据长大的。全家桶策略也值得注意:2B 适合端侧部署,4B 适合低成本推理,27B 做质量天花板,开发者可以按场景选型。

为什么重要: 多模态是今年的主战场,但之前开源阵营在这个方向上一直缺一个"默认选择"。Qwen3.5-27B 有机会成为那个选择 — 尤其对国内开发者来说,不用翻墙、不用付 API 费、社区生态完善。

接下来看什么: 社区 benchmark 复现结果。官方数字看看就好,等 HuggingFace 社区 eval 和实际应用反馈出来再下判断。另外盯紧 DeepSeek 和 Kimi 的回应。

详情 ->


2. GPT-5.4 发布:OpenAI 说能力曲线"看不到天花板"

OpenAI CEO Sam Altman 本周转发了一条引发热议的帖子:GPT-5.4 在计算机使用和经济价值任务(GDPval)上有显著提升,"我们看不到天花板,预期 AI 能力将持续提升"。(2,377 likes | 234 RTs)

这话当然要打折听。但 GPT-5.4 确实在"computer use"方向上迈了一大步 — 这意味着模型不只是生成文本,而是能操作软件界面、执行多步骤任务。GDPval 是 OpenAI 内部衡量"模型能替代多少经济活动"的指标,虽然方法论不公开,但方向很明确:他们在用经济产出而非学术跑分来衡量模型价值。

为什么重要: "Computer use"正在成为 2026 年的关键战场。Anthropic 有 Claude Computer Use,Google 有 Project Mariner,现在 OpenAI 也在加码。当模型能直接操作你的电脑,"AI 助手"就不再是比喻了。

接下来看什么: 定价和 API 开放程度。Computer use 能力如果只在 ChatGPT Pro($200/月)里才有,对开发者的意义就有限。另外,Anthropic 大概率会在几周内秀一波 Claude 的 computer use 升级。

详情 ->


3. Langflow 爆火:可视化搭 Agent,14.5 万 Star 不是开玩笑

Langflow 本周登上 GitHub Trending 榜首,Star 数突破 14.5 万。这个项目做的事情很直接:用拖拽式的可视化界面搭建 AI Agent 和工作流,不用写(太多)代码。(145,291 stars | 8,518 forks)

为什么一个"低代码 Agent 搭建工具"能有这么高的热度?因为痛点太真实了。大多数团队想用 Agent 解决业务问题,但从零写 Agent 编排逻辑的门槛太高 — 要处理工具调用、错误重试、状态管理、上下文传递。Langflow 把这些抽象成可视化节点,让产品经理和初级开发者也能参与 Agent 开发。

为什么重要: Agent 开发正在从"少数高手的手艺活"变成"团队协作的工程活"。可视化工具降低了门槛,但也带来新问题:当 Agent 逻辑变复杂,拖拽界面能不能支撑?调试体验怎么样?这些是 Langflow 接下来要回答的。

接下来看什么: 企业版的商业化路径。开源项目的 Star 数不等于收入,看他们怎么在 managed hosting 和企业功能上变现。

详情 ->


4. Dify 13 万 Star:Agent 工作流平台进入"生产就绪"时代

和 Langflow 同一周霸榜的还有 Dify — 另一个 Agent 工作流平台,13.1 万 Star,2 万多 Fork。Dify 的定位更偏"生产级":不只是搭原型,而是真正能部署到生产环境的 Agentic 工作流平台。(131,361 stars | 20,453 forks)

两个同类项目同时爆火,说明市场需求是真实的。Dify 和 Langflow 的差异在于:Dify 更强调后端编排和 API 优先,适合有工程团队的公司;Langflow 更强调可视化和易用性,适合快速原型。选哪个取决于你的团队构成和部署需求。

为什么重要: 2025 年大家在问"Agent 能做什么",2026 年的问题变成了"怎么把 Agent 部署到生产"。Dify 和 Langflow 的同时爆发标志着 Agent 开发从实验阶段进入工程化阶段。对国内开发者来说,Dify 团队在国内(原 LangGenius),社区支持和中文文档都更友好。

接下来看什么: 这两个平台和 Claude Agent SDK、OpenAI Agents SDK 的集成深度。平台之争最终是生态之争。

详情 ->


5. Claude 社区大使计划:Anthropic 开始建开发者社区

Anthropic 本周宣布启动 Claude Community Ambassadors 计划 — 招募社区大使组织本地 meetup、连接开发者、和官方团队合作。这条推文被疯狂转发。(27,221 likes | 3,423 RTs)

表面上看是个社区运营动作,但背后的信号值得注意。Anthropic 一直以来的风格是"闷头做技术",开发者社区建设远落后于 OpenAI。现在正式启动大使计划,说明他们意识到了:光有好模型不够,还需要开发者生态。Claude Code 的快速增长证明了产品力,但要把用户变成布道者,需要社区。

为什么重要: 对中国开发者来说,这可能意味着更多本地化的 Claude 开发者活动和资源。如果你在用 Claude 做产品,申请成为大使是个低成本建立影响力的方式。

接下来看什么: 大使计划的实际执行 — 是真的给资源支持,还是只发个 title?以及中国区是否在覆盖范围内。

详情 ->


速览

  • Qwen3.5 全家桶:除了 27B 旗舰,4B 和 2B 小模型同步开源,端侧部署场景值得关注 链接
  • Agent 平台混战:Langflow + Dify 同时霸榜说明一个趋势 — "Agent 编排"正在成为独立的软件品类,就像当年的 CI/CD 工具一样
  • OpenAI GDPval 指标:用经济产出衡量模型能力,比学术 benchmark 更务实,但方法论不透明是个问题

本周精读

本周我们深挖了 Claude Code 工程实践和 AI Agent 架构设计,干货密度很高:

  • Claude Code 七层架构深度解析 — Claude Code 有七层,99% 的人只用了第一层。从工具使用者到系统设计者,逐层拆解。 阅读 ->
  • Claude Code 记忆系统详解 — 每次新会话都要重复交代项目规范?CLAUDE.md 让你只说一次。规则手册 + 自动笔记,两套记忆机制全解析。 阅读 ->
  • AI Agent 长时间运行不翻车 — 最强模型连续跑也会翻车,问题不在智力而在记忆。Anthropic 双 Agent 架构与四大工程实践。 阅读 ->
  • Claude Code 无头模式 — 一个 -p 参数,把聊天工具变成自动化引擎。CI/CD、批处理、定时任务全能用。 阅读 ->
  • Claude Code 定时任务 — 代码提交了还在盯着 CI/CD 傻等?一条命令解放你。 阅读 ->
  • Notion 创始人谈 AI Agent — 一个人顶 40 个工程师,700 个 AI 员工重新定义组织。Ivan Zhao 的思考值得每个技术管理者读。 阅读 ->
  • Red Green Refactor — AI 越能写代码,你越需要用测试拴住它。TDD + AI 编程的正确姿势。 阅读 ->
  • Obsidian + Claude Code — 一个命令让 AI 加载你的整个人生,项目、日记、工作流全部到位。 阅读 ->
  • Superpowers 项目 — 用 15 份 Markdown 文档管住 AI 编程助手。AI 说测试通过了,你敢信吗? 阅读 ->
  • Claude Code Agent 工具设计 — 一个提问工具迭代三版,Claude Code 团队踩过的坑比你想的多。 阅读 ->
  • Claude Web Search 动态过滤 — AI 每搜一次网页,80% 的 Token 都在读垃圾信息——直到动态过滤出现。 阅读 ->

本周 AI 要闻就到这里。订阅 AI News 获取每日速递。