Claude Managed Agents 公测 — 部署自主 Agent 不用再自己搭基础设施了

🧠 发布动态

Claude Managed Agents 公测 — 部署自主 Agent 不用再自己搭基础设施了。

Anthropic 推出完全托管的 Agent 运行环境：安全沙箱、内置工具、SSE 流式输出，开箱即用。以前想上线一个能自主跑任务的 Claude Agent，光是容器编排、会话管理、权限隔离就得折腾一周。现在？API 调一下就行。这对中小团队的 Agent 落地是真正的加速器 — 基础设施不再是门槛，产品逻辑才是。详情 →

Gemini 3.1 Flash TTS 上线 — 多说话人对话，70+ 语言。

Google DeepMind 的最新 TTS 模型原生支持多说话人对话合成，通过 audio tag 控制语调和节奏，覆盖 70 多种语言。AI Studio 里直接可用。做播客生成、有声书、多角色对话 demo 的，这个模型省掉了大量拼接后处理的工作。(978 likes | 94 RTs) 详情 →

Claude Cowork 企业版来了。 SSO、审计日志、管理员后台、用量分析 — IT 部门评估桌面 AI Agent 时最关心的几个门槛，一次性全补上了。如果你之前因为合规问题没法在团队里推 Cowork，现在可以重新评估了。详情 →

Claude 登陆 Microsoft Word。 Pro 和 Max 用户现在可以在 Word 里直接用 Opus 4.7 — 这是 frontier 模型首次原生集成进最主流的商务文档编辑器。写报告、改合同、润色方案，不用再切窗口了。(10,134 likes | 690 RTs) 详情 →

阿里发布 Qwen3.6-35B-A3B。 35B 参数、3B 激活、Apache 2.0 开源、多模态、专为 Agent 终端编码设计。这个参数效率在开源模型里是碾压级的 — 跑在消费级显卡上就能对标好几个商用 API 的表现。(207 likes | 22 RTs) 详情 →

🔧 开发者工具

Claude Code Routines — 把临时 prompt 变成触发式自动化。

Routines 让你在 Claude Code 里定义可复用的多步工作流，绑定触发条件后自动执行。这是从"想到什么问什么"到"流程化自动跑"的关键一步。比如：每次 PR 合并自动跑安全扫描，每次新文件创建自动生成测试骨架。Ad-hoc prompting 终于有了结构化的升级路径。延伸阅读：Claude Code Hooks 完全指南详情 →

Claude Code Desktop 重新设计 — 围绕并行 Agent 构建。 全新的多 Agent 面板、状态看板、对话线程，专为 Opus 4.7 的委托模式设计。不再是一个窗口一个 Agent，而是多个 Agent 同时跑不同任务，你在一个界面里监控全局。详情 →

Managed Agents 平台文档发布。 容器配置、会话管理、工具注册、beta header 用法 — 博客公告的技术实现伴侣。想动手的直接看文档。详情 →

Claude Messages API 登陆 Amazon Bedrock。 同样的 API 请求格式，跑在 AWS 托管的 Bedrock 基础设施上，us-east-1 可用，零运营商访问。企业团队拿到的是 Claude 的能力加上 AWS 的合规和数据驻留保障。详情 →

Claude Code v2.1.113：原生二进制 + 网络拒绝列表。 CLI 从打包 JS 改为原生二进制，启动速度明显提升。新增 sandbox.network.deniedDomains 配置，在宽松网络权限下也能精确屏蔽特定域名。详情 →

📝 技术实战

Anthropic 官方指南：如何在 Claude Code 里用好 Opus 4.7。

Anthropic 出了一篇详细的最佳实践 — 委托模式、上下文管理、什么时候用 subagent 什么时候直接 prompt。核心思路：Opus 4.7 不是你逐行指导的初级开发者，而是你布置任务然后验收结果的资深工程师。用对了方式，效率差距是数量级的。详情 →

Advisor 策略 — 用零头成本逼近 Opus 质量。 核心思路：用一个便宜的执行模型跑大部分步骤，只在遇到难题时召唤更强的 advisor 模型介入。长 Agent 任务的成本能砍 70-80%，质量损失极小。这不是省钱的 hack，而是第一个让长链 Agent 在企业规模下经济可行的架构。详情 →

Cat Wu 的心智模型转变：把 Opus 4.7 当你要委托任务的工程师。 Anthropic 的 Cat Wu 讲了三个具体的工作流转变 — 核心洞察是 Opus 4.7 在你交代完整任务时表现最好，逐行指导反而拖后腿。(993 likes | 78 RTs) 详情 →

🔬 研究前沿

Claude Mythos Preview — Anthropic 首个专用网络安全模型。 通过 Project Glasswing 以邀请制提供研究预览，专注防御性网络安全。Anthropic 开始走垂直专精路线了 — 通用大模型之外，针对高价值场景做专门优化。详情 →

OpenAI 详解 GPT Rosalind 和生命科学模型系列。 OpenAI 研究和产品负责人在播客里深入讨论了生物学专用微调的技术路径和负责任部署。两大 AI 巨头不约而同盯上了生命科学，这个赛道要热了。(1,004 likes | 99 RTs) 详情 →

NVIDIA Nemotron-OCR v2 — 用合成数据训出碾压商用 API 的多语言 OCR。 NVIDIA 详解了如何用合成数据流水线训练多语言 OCR 模型，效果追平甚至超过商用 API。做文档理解的团队，这篇方法论值得细读。详情 →

💡 行业洞察

Mollick：Gemini Pro 3.1 是一个被困在糟糕产品壳里的好模型。 Ethan Mollick 指出 Gemini 模型能力和产品体验之间的鸿沟越来越大 — 没有可审计的思维链、手动 canvas、工具集成薄弱。模型本身能打，但产品追不上。这对 Google 来说是个危险信号：模型不是护城河，产品才是。(867 likes | 54 RTs) 详情 →

Opus 4.7 的 Adaptive Thinking 触发频率大幅提升。 发布首日被批评思考不够深入后，Anthropic 快速更新 — 现在 Adaptive Thinking 在更多任务上自动触发，包括之前会失败的场景。代价是 token 消耗增加，但质量确实上了一个台阶。(969 likes | 40 RTs) 详情 →

Dario Amodei 造访白宫。 Anthropic CEO 与白宫幕僚长和财政部长会面，双方称"富有成效"。AI 公司和政府之间的关系似乎在回暖 — 这对整个行业的监管走向都是信号。详情 →

Anthropic 任命诺华 CEO 进入长期利益信托董事会。 Vas Narasimhan 加入 LTBT 董事会，释放两个信号：一是 Anthropic 在生命科学方向的野心越来越明确（和 Claude Mythos 的安全方向形成对照），二是公司治理在朝 IPO 标准靠拢。详情 →

🏗️ 值得一试

Claude Code 黑客松回归 — 10 万美元奖金池，每人 $500 API 额度。 基于 Opus 4.7 的一周黑客松，申请即将截止。有想法的赶紧报名，$500 的 API 额度够你折腾出不少东西了。(193 likes | 13 RTs) 详情 →

🎓 模型小课堂

模型级联（Fast-Slow Routing）：今天提到的 Advisor 策略，本质上是一种模型级联架构。想象你有两个助手 — 一个反应快但能力一般（比如 Haiku），一个深思熟虑但收费贵（比如 Opus）。模型级联就是让便宜的模型先处理任务，只有当它"不确定"或遇到复杂问题时，才把这一步交给贵的模型。这样大部分简单步骤用低成本跑完，只在关键节点花大钱。Managed Agents 把多模型编排变成了平台原生能力，意味着你不用自己写路由逻辑就能实现这种架构。

⚡ 快讯

Google 一周 AI 汇总：Flash TTS、Robotics-ER 1.6、Gemini Mac 桌面版，一周内密集发布。(770 likes | 73 RTs) 链接
LangChain Core 1.3.0：大版本更新，anthropic 集成支持 Opus 4.7，包括 compaction blocks 处理。链接
Alex Albert：Opus 4.7 发布首日的 bug 已修复，之前碰壁的可以再试一次。(1,204 likes | 44 RTs) 链接
论文：可审计的自我改进 Agent：新框架让 Agent 能提议、评估并提交自身改进，全程可审计、可回滚。(163 likes | 24 RTs) 链接

🎯 今日精选

Advisor 策略不只是省钱的技巧 — 它是让长链 Agent 在企业规模下经济可行的第一个靠谱架构。 Anthropic 这篇博客把很多 power user 一直在手动做的事情正式化了：用一个便宜快速的模型执行大部分步骤，只在关键决策点召唤强模型介入。表面看是成本优化，实际揭示了一个更深的洞察 — AI 编码的真正瓶颈不是模型智力，而是知道什么时候该用哪个级别的智力。配合今天同时发布的 Managed Agents 平台，多模型编排从需要自己搭路由逻辑变成了平台原生能力。这意味着中小团队也能跑得起之前只有大厂才负担得起的复杂 Agent 工作流。如果你在做任何长链 Agent 应用，Advisor 模式 + Managed Agents 这个组合拳值得今天就开始研究。详情 →

下期见 ✌️