Claude Code 上线 /ultrareview — 一群 Agent 在云端帮你审代码

🧠 发布动态

Claude Code 上线 /ultrareview — 一群 Agent 在云端帮你审代码。

不是一个 Agent 看你的代码，是一支舰队。Claude Code 新功能 /ultrareview 会在云端并行启动多个专注不同方向的 bug 猎手，同时扫描你的代码库。从单 Agent 到多 Agent 并行审查，这是 Claude Code 能力的质变 — 本地跑不动的大项目，现在扔给云端几分钟出结果。当前分支直接 /ultrareview 就能用。（延伸阅读：Claude Code subagents 实战案例）(9,561 likes | 595 RTs) 详情 →

谷歌发布第八代 TPU 双芯片 — 训练和推理各一块。

TPU v8 分成 8T（训练专用）和 8I（推理专用），谷歌终于承认了一个事实：跑 Agent 的推理负载和训练大模型根本是两种工作。8I 针对的就是 Agent 场景 — 百万级小请求、低延迟、高并发。这个拆分会直接影响云端定价和 Agent 架构设计，后面展开讲。详情 →

Qwen3.6-27B 来了 — 27B 参数干翻 Opus 4.5。

阿里放出 dense 27B 模型，LiveBench 跑分超过 Opus 4.5，编程任务逼近 frontier 水平。量化到 16GB 就能在消费级显卡上跑 — Simon Willison 实测多模态表现也很能打。开源编程模型的天花板又被推高了一截，有卡的直接 Ollama 拉下来试。(628 likes | 318 RTs) 详情 →

OpenAI 开源 PII 检测模型 — Privacy Filter 上线。 罕见操作 — OpenAI 发布了一个开源的双向 token 分类模型，专门做个人隐私信息（PII）的检测和脱敏。已经集成进 HuggingFace Transformers v5.6.0，支持本地部署、高吞吐。做数据管道的，这是现成的合规工具。详情 →

谷歌把 Vertex AI 升级成全栈企业 Agent 平台。 不只是改名 — 新的 Vertex AI 集成了模型选择、Agent 构建、工具编排和企业安全，直接对标 Anthropic Managed Agents 和 OpenAI 的 Agent 基础设施。Agent 平台战争正式三方混战。(970 likes | 105 RTs) 详情 →

Claude Cowork 上线交互式图表和可视化（Beta）。 付费用户现在可以在 Cowork 里生成可交互的图表和流程图 — 不是静态截图，是真能点、能拖、能缩放的。从"帮你出个图"到"帮你做个 dashboard"，Cowork 的定位又清晰了一步。(3,314 likes | 207 RTs) 详情 →

OpenAI 在 ChatGPT 工作区里加了持久化团队 Agent。 ChatGPT 不再只是聊天窗口 — 现在你可以在工作区里创建常驻 Agent，整个团队共享。这是 OpenAI 把 ChatGPT 从个人工具推向企业平台的关键一步，直接和 Claude Cowork 的企业版抢市场。(89 likes | 31 RTs) 详情 →

🔧 开发者工具

Anthropic 发布 MCP 生产环境集成权威指南：如果你还在把 MCP 当开发玩具，该认真了。Anthropic 官方博客详细拆解了 MCP 在生产系统中的接入模式 — 从架构设计到安全考量。这种"canonical reference"级别的文档一旦出来，整个社区的实现方式都会往这个方向靠。下次做 Agent 集成前先读一遍。（延伸阅读：如何集成 MCP 服务器）详情 →

Ollama v0.21.1 — 支持 Kimi CLI 直接启动，采样速度更快：ollama launch kimi 一行命令跑 Kimi，加上 MLX logprobs 和 fused top-P/top-K 加速。本地跑开源模型的体验越来越丝滑了。详情 →

📝 技术实战

79% 的 Claude API 用户没开 Prompt Caching — 你可能在白花钱。 Anthropic 公布了一个扎心的数据：绝大多数 API 客户根本没用 prompt caching，而做得好的集成方 cache 命中率高达 92-96%。现在 Anthropic 上线了一个 adoption dashboard，你可以直接看自己的命中率。用 Claude API 的，今天就去查一下，省下来的可能不是小数目。(36 likes | 3 RTs) 详情 →

VS Code Copilot 支持自带模型和 API Key 了。 这一刀砍向的是 Cursor 和 Windsurf — GitHub Copilot 终于打破了模型锁定，你可以在 VS Code 里接入任何 LLM。很多开发者当初换编辑器就是为了模型自由度，现在这个理由不存在了。(253 likes | 32 RTs) 详情 →

🔬 研究前沿

Karpathy 转发的 demo：屏幕上每个像素都是模型实时生成的。 没有 HTML，没有布局引擎，没有代码 — 整个界面逐像素从模型输出流式渲染。如果这个方向跑通了，整个前端技术栈都可以扔了。现阶段还是 demo 级别，但 7,130 个赞说明这个想法击中了很多人的想象力。(7,130 likes | 764 RTs) 详情 →

Anthropic 发布 81,000 人 AI 经济影响调研。 目前最大规模的公开调研，聚焦普通人对 AI 经济影响的期待和担忧。做 AI 产品的，这份数据能帮你理解用户对"AI 取代工作"的真实焦虑在哪 — 产品定位和沟通策略都用得上。(1,415 likes | 126 RTs) 详情 →

💡 行业洞察

Shopify CTO 揭底：工程师 Opus 4.6 额度无上限，内部造了三个 Agent 工具。

Shopify CTO 在 Latent Space 播客上详细讲了公司的 AI 策略 — 每个工程师都有无上限的 Opus 4.6 token 预算，内部开发了 Tangle、Tangent、SimGym 三个 AI 原生开发工具。这是目前公开信息里，一家千亿美元级公司 all-in agentic coding 最详细的案例。当一家公司愿意给工程师烧无限 token，说明他们算过 ROI — 这个信号比任何跑分都能说明 Agent 编程的未来走向。详情 →

OpenAI 正在谈一个 100 亿美元的企业部署合资公司。 代号"DeployCo"，OpenAI 初期投入 5 亿美元，估值 100 亿。信号很明确：OpenAI 不满足于卖模型，要亲自下场做企业 AI 部署。从模型公司到部署公司，这是一条新的竞争赛道。详情 →

🏗️ 值得一试

HuggingFace ml-intern — 一句话完成微调全流程：开源 Agent，从数据集选择到训练到评估全自动。已经有人用一句 prompt 微调了医学 SAM 模型。微调的门槛从"需要 ML 工程师"降到了"会写 prompt"。(2,901 likes | 360 RTs) 详情 →

Google Cloud 开源 13 个 Agent Skills — 跨平台通用：这批 Skills 同时支持 Gemini CLI、Codex、Claude Code 等多个 harness。谷歌有意思的地方在于：它发布的技能刻意兼容竞品工具，走的是生态渗透路线而不是围墙花园。(37 likes | 7 RTs) 详情 →

🎓 模型小课堂

训练专用芯片 vs. 推理专用芯片（Training-Optimized vs. Inference-Optimized Silicon）：谷歌 TPU v8 分成 8T 和 8I 两款，背后反映的是整个行业的一个认知转变。训练大模型需要的是海量计算、高带宽、大批量并行 — 像建一座大工厂，一次性投入巨大但产出一个成品。而 Agent 时代的推理负载完全不同 — 百万级的小请求、每个都要低延迟返回、并发量巨大 — 更像经营一家快餐连锁，追求的是每单的速度和效率。用训练芯片跑推理就像用炼钢炉烤面包，能用但浪费。这个拆分意味着云端定价、模型部署策略、甚至 Agent 架构设计都会随之改变。

⚡ 快讯

Claude Code v2.1.117：支持 forked subagents（环境变量启用）和 Agent 会话内加载 MCP 服务器，模型选择跨重启保持。链接
Gemma 4 VLA：在 $249 的 Jetson Orin Nano Super 上实时跑机器人视觉-语言-动作模型，边缘端 AI 又近了一步。链接
Claude Code 获 Webby 奖：创始人 Boris Cherny 官宣，Agent 原生开发工具正式从小众走向主流。(405 likes | 13 RTs) 链接
DeepMind 牵手四大咨询：与 Accenture、BCG、Deloitte、McKinsey 合作推动企业 AI 落地，目前只有 25% 的企业做到了生产级 AI 部署。链接
Google Ads Advisor 加入三项 Agent 安全功能：Agent 在高风险商业系统中自主运行的安全护栏案例，模式比产品本身更值得学。链接

🎯 今日精选

Shopify 的无限 Token 预算，是 Agent 编程时代最有力的信号：当一家 1000 亿美元市值的公司决定给每个工程师发无上限的 Opus 4.6 额度，并且自研了三个内部 Agent 工具（Tangle 做代码生成、Tangent 做调试、SimGym 做模拟测试），这不是在"试试 AI" — 这是在重建整个工程文化。Shopify CTO 在播客里说的核心逻辑很简单：一个工程师 + 无限 AI 算力 > 三个工程师。这个 ROI 计算比任何跑分都能说明问题。联系今天谷歌拆分 TPU、Claude Code 上线多 Agent 审查、Copilot 开放模型接入 — 整个产业链从芯片到工具到企业实践都在朝同一个方向跑：Agent 不是功能，是基础设施。还在观望的团队，窗口期可能比你想的短。详情 →

下期见 ✌️