Anthropic 押注 TPU，签下数吉瓦级算力协议

🧠 发布动态

Anthropic 押注 TPU，签下数吉瓦级算力协议。

不跟 NVIDIA 绑死 — Anthropic 跟 Google 和 Broadcom 达成合作，从 2027 年起获得多吉瓦级下一代 TPU 算力，用于训练和部署 frontier Claude 模型。这是目前已知非谷歌公司拿到的最大 TPU 订单。信号很明确：前沿实验室的竞争已经从模型战变成基础设施战，Anthropic 赌的是 TPU 路线能在 2027 年后拉开差距。对开发者来说，意味着未来 Claude 的推理速度和模型规模可能迎来跳跃式提升。(7,442 likes | 483 RTs) 详情 →

NVIDIA 官方量化 Gemma 4 31B，单卡就能跑。

NVIDIA 用自家 NVFP4 格式对 Gemma 4 31B 做了官方量化 — 权重压缩 4 倍，质量基本不掉。关键词是"官方"：不是社区野生量化，而是 NVIDIA 亲自出品，精度有保障。一块消费级 GPU 就能跑 31B 参数的 frontier 级模型，本地部署的门槛又低了一大截。(3,596 likes | 374 RTs) 详情 →

Google 发布 Gemma 4 E2B：全模态双向模型。 Gemma 家族新成员，支持"any-to-any"多模态输入输出。上线就拿到 23K 下载，定位是跟其他多模态模型正面竞争。如果你在做多模态应用，值得第一时间测试。(134 likes | 23.1K downloads) 详情 →

🔧 开发者工具

X/Twitter 发布官方 MCP 服务器。

你的 AI Agent 现在可以通过 MCP 协议搜推文、读书签、跟 X 平台交互了 — 而且是官方出品，不是第三方 hack。这对 MCP 生态是重大验证：连 X 都接入了，说明 MCP 正在成为 AI 工具调用的事实标准。Clone 下来接入你的 Agent 工作流，Twitter 数据不用再爬了。延伸阅读：Claude Code MCP 配置指南 (820 likes | 68 RTs) 详情 →

Claude 接入实时金融数据。 Financial Datasets MCP Server 让 Claude 能实时查询股价、资产负债表、现金流和公司新闻。做金融分析的最头疼 AI 瞎编数字 — 这个 MCP 集成直接解决了数据源问题。(486 likes | 65 RTs) 详情 →

Gradio Server 前后端解耦。 HuggingFace 推出 Gradio Server，把 Gradio 的 ML 后端（推理、鉴权、队列）跟前端彻底分开。你现在可以用 React、Vue 或任何框架写 UI，同时保留 Gradio 的 serving 能力。做 ML 应用的，这是两全其美的方案。详情 →

OpenAI 直播 Codex 工作流。 OpenAI 团队开了场直播，聊 Codex 从功能探索到团队实际 shipping 的工作流。想了解 Codex 怎么用最高效，看录播就行。(196 likes | 12 RTs) 详情 →

📝 技术实战

免费 Colab 微调 Gemma 4 和 500+ 模型。 Unsloth Studio 做了个 Colab notebook，零配置、零 GPU 成本，直接微调 Gemma 4 和 500 多个开源模型。fine-tuning 的门槛现在低到只需要点"运行"。(656 likes | 86 RTs) 详情 →

LM Studio 无头 CLI + Claude Code 本地跑 Gemma 4。 一篇手把手教程，用 LM Studio 的 headless CLI 配合 Claude Code 在本地运行 Gemma 4，附真实 benchmark。很多人想要这个工作流但没搞定 — 现在有现成方案了。(157 likes | 40 RTs) 详情 →

🔬 研究前沿

苹果研究：AI 模型连小学算术都不会。

Apple 的研究团队证明，当前主流 AI 模型在小学级别的算术题上系统性地失败 — 不是高等数学，是 10 岁孩子能做的加减乘除。LeCun 转发放大了这个发现，2.4K 赞。如果你的产品有任何依赖 AI 做数学计算的功能，现在就去审计一遍。这不是能力不够，是根本性的架构限制。(2,429 likes | 639 RTs) 详情 →

OpenAI 推出安全研究奖学金。 OpenAI 设立 Safety Fellowship，资助独立研究者做 AI 安全和对齐研究。意义在于把安全研究从公司内部推向外部独立社区 — 回应了"安全研究过于集中"的批评。做 AI safety 的可以关注申请。(1,679 likes | 181 RTs) 详情 →

Nature 发表端到端自动化 AI 研究论文。 从假设生成到实验执行再到论文写作，全流程自动化。AI 加速 AI 研究不再是空想 — Nature 背书的研究给了方法论层面的验证。(271 likes | 56 RTs) 详情 →

💡 行业洞察

Anthropic 营收四个月翻三倍，跑出 $300 亿年化。

从 2025 年底的 $90 亿到现在的 $300 亿年化营收 — Anthropic 创下了 AI 行业最快的营收增长纪录。Claude 的企业付费转化在加速，配合刚签的 TPU 算力大单，Anthropic 正在用真金白银证明 frontier 模型不只是烧钱游戏。对比 OpenAI 的营收曲线，差距在快速缩小。(1,506 likes | 117 RTs) 详情 →

Meta 即将发布 Alexandr Wang 领导下的首个大模型（LLM）。 Meta 在 Scale AI 创始人 Alexandr Wang 加入后的第一个 LLM 即将亮相，策略是在特定消费场景上做到最强，而不是全面对标 OpenAI/Anthropic。计划最终开源部分版本。(348 likes | 16 RTs) 详情 →

Axios 供应链攻击始于社工开源维护者。 Simon Willison 警告：Axios npm 包的供应链攻击是从精准社工一名维护者开始的。所有开源项目维护者注意 — 攻击越来越针对人而不是代码。现在就检查你项目的 contributor 权限设置。(437 likes | 73 RTs) 详情 →

Karpathy：AI 可以反转监控关系。 Karpathy 提出一个有意思的视角 — AI 不只是让政府监控公民的工具，也可以让公民让政府变得透明和可追责。4.9K 赞，说明这个 reframing 戳中了很多人。(4,916 likes | 600 RTs) 详情 →

🏗️ 值得一试

八年想做的项目，AI 帮三个月做完了。 一位开发者用 AI 辅助在三个月内完成了 SyntaqLite — 一个想了八年但一直没动手的项目。573 个 HN 赞。这是 AI 解锁个人积压项目的典型案例 — 你的 side project backlog 里是不是也有类似的？(573 likes | 176 RTs) 详情 →

Hippo：模仿海马体的 AI Agent 记忆系统。 受神经科学启发，实现了记忆巩固、遗忘和检索模式 — 不是简单的向量存储，而是模拟大脑记忆的工作方式。做 Agent 的可以试试这个新思路。(30 likes | 12 RTs) 详情 →

🎓 模型小课堂

模型量化（NVFP4）：想象你有一本 500 页的技术手册，量化就是把它压缩成 125 页的精华版 — 关键信息都在，但体积小了 4 倍。具体来说，模型的每个参数原本用高精度数字存储（比如 16 位浮点数），量化就是把它降到更低精度（NVFP4 是 4 位）。NVIDIA 的 NVFP4 格式是专门为他们的 GPU 优化的 4 位量化方案，能让 Gemma 4 31B 这种大模型塞进一块消费级显卡。为什么官方量化比社区量化重要？因为模型厂商知道哪些参数可以压、哪些不能动，精度损失更小。

⚡ 快讯

Anthropic TPU 协议推文：7.4K 赞，行业确认这是基础设施层面的重大转向。链接
AI 歌手 "Eddie Dalton"：一个完全由 AI 生成的"歌手"同时占据 iTunes 单曲榜 11 个位置，人类音乐人坐不住了。链接
Mollick 评 Gemma 4：设备端表现亮眼，但真正的 Agentic 工作流跑不动 — 判断力和自我纠错能力还不够。链接
Claude Code "复杂任务不可用"：GitHub issue 拿到 709 赞，社区反馈 Claude Code 在复杂工程任务上有退步。链接

🎯 今日精选

Anthropic 签下数吉瓦 TPU — 前沿实验室的竞争变成了基础设施竞争：这是第一家非谷歌公司签下多吉瓦级 TPU 算力协议。背后的战略判断很清晰 — Anthropic 不想把命运绑在 NVIDIA 一家身上，TPU 路线给了它差异化的训练基础设施。配合同期爆出的 $300 亿年化营收，Anthropic 正在用钱和算力两条腿跑。这个决定的连锁反应会很深远：如果 Anthropic 在 TPU 上训出更强的模型，其他前沿实验室也不得不重新考虑自己的硬件策略，整个 AI 算力供应链的格局可能被重塑。NVIDIA 的垄断地位第一次面临来自客户端的真正挑战。详情 →

下期见 ✌️