NewsletterBlogLearnCompareTopicsGlossary
English
INSIGHTLAUNCHTOOLRESEARCHBUILD

23 条资讯

Anthropic 和 SpaceX 达成算力合作,这事比你想的大

💡 行业洞察

Anthropic 和 SpaceX 达成算力合作,这事比你想的大。

Anthropic 官宣接入 SpaceX 的 Colossus 1 超算集群,直接解决了用户抱怨最多的问题 — 算力不够用。这不只是"买了更多 GPU":当一家 AI 公司开始找航天公司要算力,说明传统云厂商的供给已经跟不上需求了。对用户的即时影响:高峰期限流取消,5 小时用量上限翻倍。(94,395 likes | 8,403 RTs) 详情 →

Claude 用量限额立刻翻倍。 算力交易签完,Anthropic 当天就把好处给到用户 — 高峰期限流取消,5 小时限额翻倍。从签约到用户受益的速度,在 AI 行业前所未有。如果你之前被限额劝退了,现在可以回来了。(2,710 likes | 97 RTs) 详情 →

DeepSeek 首轮融资估值可能达 500 亿美元。 还没正式融过资就值 500 亿,DeepSeek 用开源模型证明了一条不同的路 — 不靠封闭 API 赚钱,靠效率和开放赢得市场。这笔钱如果到位,中国 AI 创业的天花板又被推高了一截。(77 likes | 19 RTs) 详情 →

硅谷从卖 API 转向卖服务。 Latent Space 把这周的趋势串了起来:AI 公司不再满足于当"模型供应商",而是要做全栈服务商。Anthropic 的企业服务、Sierra 的 1.5 亿美元 ARR、Meta 的 Hatch — 模式清晰了。API 是起点,不是终局。 详情 →


🧠 发布动态

Claude Managed Agents 学会"做梦"了。

Anthropic 在 Code with Claude 大会上放出重磅更新 — Managed Agents 新增 dreaming(研究预览)、outcomes、多智能体编排和 webhooks。最值得关注的是 dreaming:Agent 可以在用户不在线时异步推理,不是干等着你下指令,而是自己在后台"想问题"。这从根本上改变了 Agent 的计算范式 — 从同步推理走向异步思考。Outcomes 和多智能体编排已进入公测,现在就能用。(8,803 likes | 563 RTs) 详情 →

HuggingFace 上线机器人应用商店。 300+ 现成应用、10,000+ 已连接机器人 — HuggingFace 把模型中心的打法复制到了物理 AI 领域。如果你有机器人硬件,现在可以像装手机 App 一样给它装技能了。(446 likes | 60 RTs) 详情 →

腾讯混元 Hy3 登顶 OpenRouter 用量榜。 上线两周,3.66T token 用量,周增长 298% — Hy3 用脚投票的开发者数据证明了自己。用量比跑分更能说明问题:开发者在真实场景里选择了这个免费开源的 Agent/代码模型。(58 likes | 17 RTs) 详情 →

Google 发布 Gemma 4 31B 全模态助手版。 Gemma 4 31B 的 any-to-any 变体来了 — 多模态输入输出,单模型搞定,可以本地部署。30B 级别的全模态开源模型,本地玩家又多了一个选择。(121 likes | 4.2K downloads) 详情 →


🔧 开发者工具

OpenAI 联合五巨头开源 MRC,专为 AI 训练集群设计的网络协议。

OpenAI 拉上 AMD、Broadcom、Intel、Microsoft、NVIDIA 一起开源了 MRC(Multipath Reliable Connection)— 一个专门解决大规模 GPU 集群同步通信问题的网络协议。五家芯片/云巨头联合背书,这东西很可能成为 AI 训练基础设施的事实标准。如果你在运维训练集群,现在就该读 spec。(4,773 likes | 521 RTs) 详情 →

AWS Agent Toolkit 上线:一个 MCP 服务器接入 15,000+ AWS API。 40 个预构建技能、3 个 Agent 插件、一个 Remote MCP 服务器覆盖 15,000+ AWS API — 这是目前任何云厂商发布的最大 MCP 工具集。一行配置接入整个 AWS 生态,Agent 开发者的工具箱瞬间扩大了一个量级。(333 likes | 63 RTs) 详情 →

Anthropic Python SDK 到 v0.100.0。 里程碑版本,完整支持 Managed Agents 多智能体编排、outcomes、webhooks 和 vault 验证。今天发布的所有平台新功能,代码里立刻能用:pip install --upgrade anthropic详情 →

Next.js 16.2.5 修复两个高危漏洞。 Server Components 的 DoS 漏洞和 App Router 的中间件绕过 — 如果你在生产环境跑 Next.js,这是优先级最高的更新。别等了:npm i next@16.2.5详情 →

Claude Code 桌面端支持视觉标注。 直接在 UI 上画圈标注、附加 DOM 元素作为上下文 — 视觉调试和 Agent 辅助编码之间的鸿沟被填上了。用铅笔工具在界面上画一圈,Claude 就知道你在说哪个组件。(164 likes | 8 RTs) 详情 →


🔬 研究前沿

DeepMind 选了 EVE Online 当 AI 对齐试验场,这个选择很有深意。

Google DeepMindEVE Online 开发商合作,用这款以"阴谋诡计"闻名的太空 MMO 来研究 AI 对齐问题。为什么选 EVE?因为它有玩家驱动的经济系统、复杂的社交博弈、以及长达数月的战略规划 — 这些正是 AI 安全最难解决的问题:涌现欺骗、联盟操纵、长期规划。在消毒过的跑分里测不出来的东西,在数千名真实玩家互相算计的宇宙里能自然暴露。(1,470 likes | 169 RTs) 详情 →

SubQ 声称比 Opus 4.7 快 50 倍、便宜 20 倍。 新架构号称支持 1200 万 token 上下文,推理效率碾压当前 frontier 模型。如果独立测试能验证这些数字,推理经济学将被重写。但"extraordinary claims require extraordinary evidence"— 等第三方跑分出来再说。(732 likes | 59 RTs) 详情 →

先做对比反复改更重要。 ServiceNow AI 的研究发现,训练强化学习(RL)Agent 一次写对代码,比训练它们迭代修 bug 效果更好。对构建代码生成管线的团队来说,这意味着奖励信号应该偏向首次正确率,而不是修复能力。 详情 →


🏗️ 值得一试

Tilde.run:给 Agent 一个有事务回滚的沙箱。 每次文件操作都有事务语义和版本历史 — Agent 搞砸了?一键回滚。这从文件系统层面解决了"Agent 把我仓库搞乱了"的痛点。跑高风险 Agent 编码任务之前,先试试这个。(119 likes | 89 RTs) 详情 →


🎓 模型小课堂

异步 Agent 推理(Dreaming):传统的 AI Agent 是"你问我答"模式 — 你发指令,它才开始想。Dreaming 打破了这个限制:Agent 在你下线后继续推理,整理信息、规划下一步、甚至主动发现问题。想象你给助理布置了任务就去睡觉,第二天醒来它已经把方案想好了。这不是简单的后台运行 — 是一种全新的计算范式,从同步推理(Synchronous Inference)走向异步思考。Anthropic 今天发布的 Managed Agents 更新首次把这个概念带入了生产环境。


⚡ 快讯

  • Code with Claude 大会:dreaming 功能在 keynote 上正式亮相。 链接
  • Ethan Mollick 评 SpaceX 交易:"这基本宣告了 Grok 作为 frontier 模型的野心受挫。" (1,011 likes | 50 RTs) 链接
  • Claude Code v2.1.132:新增 session ID 环境变量,28 项 CLI 改动。 链接
  • Qwen3.6 35B:新版登陆 HuggingFace,30-40B 本地部署甜点区又多一员。(209 likes | 17 RTs) 链接
  • 多智能体 Sessions API 文档上线:公测开放,标准 beta header 即可调用。 链接
  • Anthropic 官方博客:SpaceX 合作细节和限额提升时间表。(350 likes | 287 RTs) 链接

🎯 今日精选

DeepMind 选择 EVE Online 做对齐试验场 — AI 安全最难的问题只能在野外研究:当大多数 AI 安全研究还在用精心设计的 benchmark 测试模型行为时,DeepMind 做了一个大胆的选择:去一个以欺骗、背叛和政治操纵闻名的游戏宇宙里研究 AI 对齐。这个选择揭示了一个根本性的认知转变 — AI 安全最棘手的问题(涌现欺骗、联盟操纵、跨时间尺度的战略规划)在标准化测试里根本测不出来,只有在数千名真实玩家互相博弈的复杂环境里才会自然涌现。EVE Online 20 年的历史证明了一件事:当利益足够大、规则足够自由,智能体(不管是人还是 AI)会发展出令人意想不到的策略。如果 AI Agent 能在 EVE 里学会合作而不是欺骗,那才是真正经得住考验的对齐。 详情 →


下期见 ✌️