Anthropic 把 Advisor 模式做成了平台原语

🧠 发布动态

Anthropic 把 Advisor 模式做成了平台原语。

你的 Agent 终于不用全程烧 Opus 了。Anthropic 正式在 Claude Platform 上线 advisor 策略 — 用 Opus 当"军师"做高层决策，Sonnet 或 Haiku 当"执行者"干活，智能水平接近纯 Opus，成本直接砍到零头。这不是简单的模型切换，而是把"什么任务用什么脑子"的路由逻辑变成了一等公民 API。如果你在跑 Agent 工作流，现在就该重构调用链。(21,168 likes | 1,311 RTs) 详情 →

OpenAI 围着 Codex 重建订阅体系，新增 $100 档位。

OpenAI 调整了 ChatGPT Pro 和 Plus 的订阅结构，明确为 Codex 使用量分层，并推出 $100/月的新档位。信号很清楚：AI 编码已经取代闲聊成为付费订阅的核心价值驱动。这个定价直接对标 Claude Code 和 Cursor — 如果你每月在 AI 编码工具上花超过 $50，现在是重新算账的时候。(11,766 likes | 975 RTs) 详情 →

延伸阅读：想了解 Codex 的定价模式？看看 Codex 是免费还是付费？

Claude Cowork 全面开放，企业管控能力拉满。 Preview 阶段 12 周就拿下百万用户，现在 Claude Cowork 正式 GA，面向所有付费方案。企业版新增 RBAC、组级支出限额、用量分析和 OpenTelemetry 集成 — 安全团队要的东西全到了。(6,763 likes | 456 RTs) 详情 →

微软悄悄放出 Harrier，27B 参数的特征提取模型。 Microsoft 在 HuggingFace 上发布了 Harrier（27B），专注 feature-extraction 任务，上线就被下了 2.29 万次。大概率针对嵌入和检索场景做了优化，跑嵌入 pipeline 的可以拉下来对比一下。(103 likes | 22.9K downloads) 详情 →

🔧 开发者工具

Claude Code 新增 Monitor Tool — Agent 终于能"盯着看"了。

你的 Agent 不再需要轮询了。Claude Code 现在可以创建后台监控脚本，在特定事件触发时唤醒 Agent — 比如"启动 dev server 然后帮我盯着报错"。对于长时间运行的自主化工作流来说，这是从"不断问"到"有事叫我"的关键转变。(2,433 likes | 139 RTs) 详情 →

延伸阅读：想了解 Claude Code 的异步机制？看看什么是 Claude Code 中的 Async Hooks。

Safetensors 正式加入 PyTorch Foundation。 那个干掉 pickle、让模型文件变安全又变快的格式 — Safetensors — 现在归 PyTorch Foundation 管了。这意味着长期治理不再依赖单一公司，也彻底确立了它作为标准权重格式的地位。还在发 .bin 文件的，该迁了。详情 →

OpenAI 在 Prism 中上线 Paper Review — 帮你读论文，不是帮你写。 OpenAI 给 Prism 加了专门的论文审阅工作流，定位是结构化的批判性分析，而不是生成。被 arXiv 海洋淹没的研究者终于有了一个正经的筛选工具。(438 likes | 43 RTs) 详情 →

谷歌开源 Scion，Agent 编排试验场。 Google 开源了 Scion，一个用于多 Agent 架构实验的编排平台。本周 Anthropic 发了 Managed Agents，OpenAI 发了 AgentKit，谷歌给研究者提供了一个中立地盘来对比各家方案。(148 likes | 42 RTs) 详情 →

🔬 研究前沿

700 万参数模型靠纯递归，在推理任务上硬刚大模型。

这可能是本周最反直觉的论文。Tiny Recursion Model（TRM） 只有 700 万参数，却通过递归计算在推理任务上拿到了接近大模型的成绩。如果这个方法能泛化，边缘设备上跑推理的可能性被彻底重新定义 — 不是参数不够大，是算法不够巧。(4,188 likes | 669 RTs) 详情 →

OpenAI Foundation 为阿尔茨海默研究建了 AI 平台。 Sam Altman 宣布 OpenAI Foundation 部署了一个专用 AI 研究平台来加速阿尔茨海默病研究。前沿 AI 被定向用于医学界最难啃的骨头之一 — 这是"AI for Science"从口号变成实践的具体案例。(1,609 likes | 199 RTs) 详情 →

研究者逆向工程了谷歌的 SynthID 水印。 有人把 Google 的 AI 内容水印方案 SynthID 给拆了。如果第三方能可靠地检测（甚至移除）水印，那整个 AI 内容溯源和监管的逻辑都要重新想。对内容真实性领域的人来说，必读。(89 likes | 39 RTs) 详情 →

📝 技术实战

Sentence Transformers 支持多模态嵌入和重排了。 用得最多的嵌入库 Sentence Transformers 现在官方支持多模态 embedding 和 reranker。如果你在做图文混合的 RAG，这是最省事的统一检索入口 — 升级库就能用。详情 →

Research-Driven Agents：先读再写的 Agent 模式。 SkyPilot 的博客提出一个有说服力的观点 — 让 Agent 在写代码之前先大量阅读文档、搜索已有代码、规划方案，效果持续优于直接上手写的 Agent。读-搜-想-写，不是读-写。(113 likes | 40 RTs) 详情 →

延伸阅读：对测试驱动 Agent 开发感兴趣？看看测试驱动 Agent 开发的优势。

💡 行业洞察

Karpathy：AI 能力认知差在急速拉大。 Karpathy 指出一个越来越严重的问题 — 一年前试过免费版 ChatGPT 的人，对 AI 的认知已经严重过时，而前沿能力的提升速度远快于公众理解。这不是技术问题，是产品采用曲线的问题：你的潜在用户可能还停留在"AI 只会胡说八道"的阶段。(6,754 likes | 755 RTs) 详情 →

Mollick 画了张前沿 AI 格局图。 Mollick 最新的竞争格局分析：Google/OpenAI/Anthropic 领跑，可能出现递归自我改进的迹象；xAI 已跌出前沿梯队；Meta 带着闭源模型重新入场。这是最近几周最清晰的一张竞争快照。(879 likes | 93 RTs) 详情 →

Mistral 和 Sakana 结盟 — 欧日 AI 联手。 欧洲的开源旗手 Mistral 和日本的 AI for Science 先锋 Sakana 宣布正式合作。美国实验室在整合，非美 AI 生态在建自己的协作网络。关注后续联合模型和研究产出。(1,491 likes | 95 RTs) 详情 →

🏗️ 值得一试

ACE-Step 1.5 XL：开源音乐生成模型上线 HuggingFace。 带 demo 的开源权重音乐生成模型。当 AI 音乐生成从玩具变成真正的创作工具，开源替代方案的重要性不言而喻。(176 likes | 31 RTs) 详情 →

CSS Studio：手绘设计，Agent 写代码。 反转了通常的 AI 编码流程 — 你用手画 UI，Agent 生成生产级代码。人类创意驱动视觉，AI 负责实现。做前端的值得试一把。(139 likes | 93 RTs) 详情 →

🎓 模型小课堂

模型级联与路由（Model Cascading & Routing）：今天 Anthropic 的 advisor-executor 发布和 OpenAI 围绕 Codex 重建订阅档位，指向同一个趋势 — 生产级 AI 不是一个模型，而是一条 pipeline。模型级联的核心思想是把每个子任务路由到"能搞定它的最便宜的模型"。简单的格式化任务用 Haiku，需要判断力的决策用 Opus，中间地带用 Sonnet。这就是 Anthropic advisor 模式背后的原理，也是 OpenAI 现在按"工作负载强度"而非"聊天权限"来定价的原因。从"选一个最强模型"到"编排一条模型链"，这个转变正在重塑整个行业的成本结构。

⚡ 快讯

NVIDIA Nemotron OCR v2：专用图像转文本模型，面向文档理解场景。链接
Waypoint 1.5：更高保真的交互式 3D 世界生成，消费级 GPU 就能跑。链接
从 Claude Code 转向 Zed + OpenRouter：一位开发者详细拆解了 $100/月 AI 编码工具费用的重新分配方案。(282 likes | 193 RTs) 链接
InstantDB 1.0：专为 AI 生成应用设计的后端，架构论文值得一读。链接
Simon Willison：没有一家 AI 实验室公开说明他们的聊天搜索用的是哪个搜索引擎。(446 likes) 链接

🎯 今日精选

Advisor-Executor 模式不是省钱技巧，是未来两年所有 Agent 系统的架构模板：Anthropic 今天把"前沿大脑 + 廉价双手"正式做成了平台级原语。advisor-executor 的本质是在智能水平和推理成本之间建立一个系统化的权衡机制 — Opus 负责高层规划和关键判断，Sonnet/Haiku 负责执行和填充。这不是 Anthropic 独有的想法（OpenAI 围绕 Codex 重切订阅档位、700 万参数 TRM 靠递归复用计算，本质上都是同一种思路），但 Anthropic 是第一个把它变成 API 级别功能的。对开发者来说，这意味着你不再需要自己搭模型路由逻辑 — 平台帮你做了。对行业来说，这标志着竞争焦点从"谁的模型跑分高"转向"谁的编排方案最省最聪明"。详情 →

下期见 ✌️