NewsletterBlogLearnCompareTopicsGlossary
English
LAUNCHTOOLINSIGHTRESEARCHTECHNIQUEBUILD

23 条资讯

Anthropic 把 Advisor 模式做成了平台原语

🧠 发布动态

Anthropic 把 Advisor 模式做成了平台原语。

你的 Agent 终于不用全程烧 Opus 了。Anthropic 正式在 Claude Platform 上线 advisor 策略 — 用 Opus 当"军师"做高层决策,Sonnet 或 Haiku 当"执行者"干活,智能水平接近纯 Opus,成本直接砍到零头。这不是简单的模型切换,而是把"什么任务用什么脑子"的路由逻辑变成了一等公民 API。如果你在跑 Agent 工作流,现在就该重构调用链。(21,168 likes | 1,311 RTs) 详情 →

OpenAI 围着 Codex 重建订阅体系,新增 $100 档位。

OpenAI 调整了 ChatGPT Pro 和 Plus 的订阅结构,明确为 Codex 使用量分层,并推出 $100/月的新档位。信号很清楚:AI 编码已经取代闲聊成为付费订阅的核心价值驱动。这个定价直接对标 Claude Code 和 Cursor — 如果你每月在 AI 编码工具上花超过 $50,现在是重新算账的时候。(11,766 likes | 975 RTs) 详情 →

延伸阅读:想了解 Codex 的定价模式?看看 Codex 是免费还是付费?

Claude Cowork 全面开放,企业管控能力拉满。 Preview 阶段 12 周就拿下百万用户,现在 Claude Cowork 正式 GA,面向所有付费方案。企业版新增 RBAC、组级支出限额、用量分析和 OpenTelemetry 集成 — 安全团队要的东西全到了。(6,763 likes | 456 RTs) 详情 →

微软悄悄放出 Harrier,27B 参数的特征提取模型。 Microsoft 在 HuggingFace 上发布了 Harrier(27B),专注 feature-extraction 任务,上线就被下了 2.29 万次。大概率针对嵌入和检索场景做了优化,跑嵌入 pipeline 的可以拉下来对比一下。(103 likes | 22.9K downloads) 详情 →


🔧 开发者工具

Claude Code 新增 Monitor Tool — Agent 终于能"盯着看"了。

你的 Agent 不再需要轮询了。Claude Code 现在可以创建后台监控脚本,在特定事件触发时唤醒 Agent — 比如"启动 dev server 然后帮我盯着报错"。对于长时间运行的自主化工作流来说,这是从"不断问"到"有事叫我"的关键转变。(2,433 likes | 139 RTs) 详情 →

延伸阅读:想了解 Claude Code 的异步机制?看看什么是 Claude Code 中的 Async Hooks

Safetensors 正式加入 PyTorch Foundation。 那个干掉 pickle、让模型文件变安全又变快的格式 — Safetensors — 现在归 PyTorch Foundation 管了。这意味着长期治理不再依赖单一公司,也彻底确立了它作为标准权重格式的地位。还在发 .bin 文件的,该迁了。 详情 →

OpenAI 在 Prism 中上线 Paper Review — 帮你读论文,不是帮你写。 OpenAIPrism 加了专门的论文审阅工作流,定位是结构化的批判性分析,而不是生成。被 arXiv 海洋淹没的研究者终于有了一个正经的筛选工具。(438 likes | 43 RTs) 详情 →

谷歌开源 Scion,Agent 编排试验场。 Google 开源了 Scion,一个用于多 Agent 架构实验的编排平台。本周 Anthropic 发了 Managed Agents,OpenAI 发了 AgentKit,谷歌给研究者提供了一个中立地盘来对比各家方案。(148 likes | 42 RTs) 详情 →


🔬 研究前沿

700 万参数模型靠纯递归,在推理任务上硬刚大模型。

这可能是本周最反直觉的论文。Tiny Recursion Model(TRM) 只有 700 万参数,却通过递归计算在推理任务上拿到了接近大模型的成绩。如果这个方法能泛化,边缘设备上跑推理的可能性被彻底重新定义 — 不是参数不够大,是算法不够巧。(4,188 likes | 669 RTs) 详情 →

OpenAI Foundation 为阿尔茨海默研究建了 AI 平台。 Sam Altman 宣布 OpenAI Foundation 部署了一个专用 AI 研究平台来加速阿尔茨海默病研究。前沿 AI 被定向用于医学界最难啃的骨头之一 — 这是"AI for Science"从口号变成实践的具体案例。(1,609 likes | 199 RTs) 详情 →

研究者逆向工程了谷歌的 SynthID 水印。 有人把 Google 的 AI 内容水印方案 SynthID 给拆了。如果第三方能可靠地检测(甚至移除)水印,那整个 AI 内容溯源和监管的逻辑都要重新想。对内容真实性领域的人来说,必读。(89 likes | 39 RTs) 详情 →


📝 技术实战

Sentence Transformers 支持多模态嵌入和重排了。 用得最多的嵌入库 Sentence Transformers 现在官方支持多模态 embedding 和 reranker。如果你在做图文混合的 RAG,这是最省事的统一检索入口 — 升级库就能用。 详情 →

Research-Driven Agents:先读再写的 Agent 模式。 SkyPilot 的博客提出一个有说服力的观点 — 让 Agent 在写代码之前先大量阅读文档、搜索已有代码、规划方案,效果持续优于直接上手写的 Agent。读-搜-想-写,不是读-写。(113 likes | 40 RTs) 详情 →

延伸阅读:对测试驱动 Agent 开发感兴趣?看看测试驱动 Agent 开发的优势


💡 行业洞察

Karpathy:AI 能力认知差在急速拉大。 Karpathy 指出一个越来越严重的问题 — 一年前试过免费版 ChatGPT 的人,对 AI 的认知已经严重过时,而前沿能力的提升速度远快于公众理解。这不是技术问题,是产品采用曲线的问题:你的潜在用户可能还停留在"AI 只会胡说八道"的阶段。(6,754 likes | 755 RTs) 详情 →

Mollick 画了张前沿 AI 格局图。 Mollick 最新的竞争格局分析:Google/OpenAI/Anthropic 领跑,可能出现递归自我改进的迹象;xAI 已跌出前沿梯队;Meta 带着闭源模型重新入场。这是最近几周最清晰的一张竞争快照。(879 likes | 93 RTs) 详情 →

Mistral 和 Sakana 结盟 — 欧日 AI 联手。 欧洲的开源旗手 Mistral 和日本的 AI for Science 先锋 Sakana 宣布正式合作。美国实验室在整合,非美 AI 生态在建自己的协作网络。关注后续联合模型和研究产出。(1,491 likes | 95 RTs) 详情 →


🏗️ 值得一试

ACE-Step 1.5 XL:开源音乐生成模型上线 HuggingFace。 带 demo 的开源权重音乐生成模型。当 AI 音乐生成从玩具变成真正的创作工具,开源替代方案的重要性不言而喻。(176 likes | 31 RTs) 详情 →

CSS Studio:手绘设计,Agent 写代码。 反转了通常的 AI 编码流程 — 你用手画 UI,Agent 生成生产级代码。人类创意驱动视觉,AI 负责实现。做前端的值得试一把。(139 likes | 93 RTs) 详情 →


🎓 模型小课堂

模型级联与路由(Model Cascading & Routing):今天 Anthropic 的 advisor-executor 发布和 OpenAI 围绕 Codex 重建订阅档位,指向同一个趋势 — 生产级 AI 不是一个模型,而是一条 pipeline。模型级联的核心思想是把每个子任务路由到"能搞定它的最便宜的模型"。简单的格式化任务用 Haiku,需要判断力的决策用 Opus,中间地带用 Sonnet。这就是 Anthropic advisor 模式背后的原理,也是 OpenAI 现在按"工作负载强度"而非"聊天权限"来定价的原因。从"选一个最强模型"到"编排一条模型链",这个转变正在重塑整个行业的成本结构。


⚡ 快讯

  • NVIDIA Nemotron OCR v2:专用图像转文本模型,面向文档理解场景。 链接
  • Waypoint 1.5:更高保真的交互式 3D 世界生成,消费级 GPU 就能跑。 链接
  • 从 Claude Code 转向 Zed + OpenRouter:一位开发者详细拆解了 $100/月 AI 编码工具费用的重新分配方案。(282 likes | 193 RTs) 链接
  • InstantDB 1.0:专为 AI 生成应用设计的后端,架构论文值得一读。 链接
  • Simon Willison:没有一家 AI 实验室公开说明他们的聊天搜索用的是哪个搜索引擎。(446 likes) 链接

🎯 今日精选

Advisor-Executor 模式不是省钱技巧,是未来两年所有 Agent 系统的架构模板:Anthropic 今天把"前沿大脑 + 廉价双手"正式做成了平台级原语。advisor-executor 的本质是在智能水平和推理成本之间建立一个系统化的权衡机制 — Opus 负责高层规划和关键判断,Sonnet/Haiku 负责执行和填充。这不是 Anthropic 独有的想法(OpenAI 围绕 Codex 重切订阅档位、700 万参数 TRM 靠递归复用计算,本质上都是同一种思路),但 Anthropic 是第一个把它变成 API 级别功能的。对开发者来说,这意味着你不再需要自己搭模型路由逻辑 — 平台帮你做了。对行业来说,这标志着竞争焦点从"谁的模型跑分高"转向"谁的编排方案最省最聪明"。 详情 →


下期见 ✌️