Anthropic 和 SpaceX 达成算力合作，这事比你想的大

💡 行业洞察

Anthropic 和 SpaceX 达成算力合作，这事比你想的大。

Anthropic 官宣接入 SpaceX 的 Colossus 1 超算集群，直接解决了用户抱怨最多的问题 — 算力不够用。这不只是"买了更多 GPU"：当一家 AI 公司开始找航天公司要算力，说明传统云厂商的供给已经跟不上需求了。对用户的即时影响：高峰期限流取消，5 小时用量上限翻倍。(94,395 likes | 8,403 RTs) 详情 →

Claude 用量限额立刻翻倍。 算力交易签完，Anthropic 当天就把好处给到用户 — 高峰期限流取消，5 小时限额翻倍。从签约到用户受益的速度，在 AI 行业前所未有。如果你之前被限额劝退了，现在可以回来了。(2,710 likes | 97 RTs) 详情 →

DeepSeek 首轮融资估值可能达 500 亿美元。 还没正式融过资就值 500 亿，DeepSeek 用开源模型证明了一条不同的路 — 不靠封闭 API 赚钱，靠效率和开放赢得市场。这笔钱如果到位，中国 AI 创业的天花板又被推高了一截。(77 likes | 19 RTs) 详情 →

硅谷从卖 API 转向卖服务。 Latent Space 把这周的趋势串了起来：AI 公司不再满足于当"模型供应商"，而是要做全栈服务商。Anthropic 的企业服务、Sierra 的 1.5 亿美元 ARR、Meta 的 Hatch — 模式清晰了。API 是起点，不是终局。详情 →

🧠 发布动态

Claude Managed Agents 学会"做梦"了。

Anthropic 在 Code with Claude 大会上放出重磅更新 — Managed Agents 新增 dreaming（研究预览）、outcomes、多智能体编排和 webhooks。最值得关注的是 dreaming：Agent 可以在用户不在线时异步推理，不是干等着你下指令，而是自己在后台"想问题"。这从根本上改变了 Agent 的计算范式 — 从同步推理走向异步思考。Outcomes 和多智能体编排已进入公测，现在就能用。(8,803 likes | 563 RTs) 详情 →

HuggingFace 上线机器人应用商店。 300+ 现成应用、10,000+ 已连接机器人 — HuggingFace 把模型中心的打法复制到了物理 AI 领域。如果你有机器人硬件，现在可以像装手机 App 一样给它装技能了。(446 likes | 60 RTs) 详情 →

腾讯混元 Hy3 登顶 OpenRouter 用量榜。 上线两周，3.66T token 用量，周增长 298% — Hy3 用脚投票的开发者数据证明了自己。用量比跑分更能说明问题：开发者在真实场景里选择了这个免费开源的 Agent/代码模型。(58 likes | 17 RTs) 详情 →

Google 发布 Gemma 4 31B 全模态助手版。 Gemma 4 31B 的 any-to-any 变体来了 — 多模态输入输出，单模型搞定，可以本地部署。30B 级别的全模态开源模型，本地玩家又多了一个选择。(121 likes | 4.2K downloads) 详情 →

🔧 开发者工具

OpenAI 联合五巨头开源 MRC，专为 AI 训练集群设计的网络协议。

OpenAI 拉上 AMD、Broadcom、Intel、Microsoft、NVIDIA 一起开源了 MRC（Multipath Reliable Connection）— 一个专门解决大规模 GPU 集群同步通信问题的网络协议。五家芯片/云巨头联合背书，这东西很可能成为 AI 训练基础设施的事实标准。如果你在运维训练集群，现在就该读 spec。(4,773 likes | 521 RTs) 详情 →

AWS Agent Toolkit 上线：一个 MCP 服务器接入 15,000+ AWS API。 40 个预构建技能、3 个 Agent 插件、一个 Remote MCP 服务器覆盖 15,000+ AWS API — 这是目前任何云厂商发布的最大 MCP 工具集。一行配置接入整个 AWS 生态，Agent 开发者的工具箱瞬间扩大了一个量级。(333 likes | 63 RTs) 详情 →

Anthropic Python SDK 到 v0.100.0。 里程碑版本，完整支持 Managed Agents 多智能体编排、outcomes、webhooks 和 vault 验证。今天发布的所有平台新功能，代码里立刻能用：pip install --upgrade anthropic。详情 →

Next.js 16.2.5 修复两个高危漏洞。 Server Components 的 DoS 漏洞和 App Router 的中间件绕过 — 如果你在生产环境跑 Next.js，这是优先级最高的更新。别等了：npm i next@16.2.5。详情 →

Claude Code 桌面端支持视觉标注。 直接在 UI 上画圈标注、附加 DOM 元素作为上下文 — 视觉调试和 Agent 辅助编码之间的鸿沟被填上了。用铅笔工具在界面上画一圈，Claude 就知道你在说哪个组件。(164 likes | 8 RTs) 详情 →

🔬 研究前沿

DeepMind 选了 EVE Online 当 AI 对齐试验场，这个选择很有深意。

Google DeepMind 和 EVE Online 开发商合作，用这款以"阴谋诡计"闻名的太空 MMO 来研究 AI 对齐问题。为什么选 EVE？因为它有玩家驱动的经济系统、复杂的社交博弈、以及长达数月的战略规划 — 这些正是 AI 安全最难解决的问题：涌现欺骗、联盟操纵、长期规划。在消毒过的跑分里测不出来的东西，在数千名真实玩家互相算计的宇宙里能自然暴露。(1,470 likes | 169 RTs) 详情 →

SubQ 声称比 Opus 4.7 快 50 倍、便宜 20 倍。 新架构号称支持 1200 万 token 上下文，推理效率碾压当前 frontier 模型。如果独立测试能验证这些数字，推理经济学将被重写。但"extraordinary claims require extraordinary evidence"— 等第三方跑分出来再说。(732 likes | 59 RTs) 详情 →

先做对比反复改更重要。 ServiceNow AI 的研究发现，训练强化学习（RL）Agent 一次写对代码，比训练它们迭代修 bug 效果更好。对构建代码生成管线的团队来说，这意味着奖励信号应该偏向首次正确率，而不是修复能力。详情 →

🏗️ 值得一试

Tilde.run：给 Agent 一个有事务回滚的沙箱。 每次文件操作都有事务语义和版本历史 — Agent 搞砸了？一键回滚。这从文件系统层面解决了"Agent 把我仓库搞乱了"的痛点。跑高风险 Agent 编码任务之前，先试试这个。(119 likes | 89 RTs) 详情 →

🎓 模型小课堂

异步 Agent 推理（Dreaming）：传统的 AI Agent 是"你问我答"模式 — 你发指令，它才开始想。Dreaming 打破了这个限制：Agent 在你下线后继续推理，整理信息、规划下一步、甚至主动发现问题。想象你给助理布置了任务就去睡觉，第二天醒来它已经把方案想好了。这不是简单的后台运行 — 是一种全新的计算范式，从同步推理（Synchronous Inference）走向异步思考。Anthropic 今天发布的 Managed Agents 更新首次把这个概念带入了生产环境。

⚡ 快讯

Code with Claude 大会：dreaming 功能在 keynote 上正式亮相。链接
Ethan Mollick 评 SpaceX 交易："这基本宣告了 Grok 作为 frontier 模型的野心受挫。" (1,011 likes | 50 RTs) 链接
Claude Code v2.1.132：新增 session ID 环境变量，28 项 CLI 改动。链接
Qwen3.6 35B：新版登陆 HuggingFace，30-40B 本地部署甜点区又多一员。(209 likes | 17 RTs) 链接
多智能体 Sessions API 文档上线：公测开放，标准 beta header 即可调用。链接
Anthropic 官方博客：SpaceX 合作细节和限额提升时间表。(350 likes | 287 RTs) 链接

🎯 今日精选

DeepMind 选择 EVE Online 做对齐试验场 — AI 安全最难的问题只能在野外研究：当大多数 AI 安全研究还在用精心设计的 benchmark 测试模型行为时，DeepMind 做了一个大胆的选择：去一个以欺骗、背叛和政治操纵闻名的游戏宇宙里研究 AI 对齐。这个选择揭示了一个根本性的认知转变 — AI 安全最棘手的问题（涌现欺骗、联盟操纵、跨时间尺度的战略规划）在标准化测试里根本测不出来，只有在数千名真实玩家互相博弈的复杂环境里才会自然涌现。EVE Online 20 年的历史证明了一件事：当利益足够大、规则足够自由，智能体（不管是人还是 AI）会发展出令人意想不到的策略。如果 AI Agent 能在 EVE 里学会合作而不是欺骗，那才是真正经得住考验的对齐。详情 →

下期见 ✌️