Claude Cowork 未来 30 天速率限制翻倍

🧠 发布动态

Claude Cowork 未来 30 天速率限制翻倍。

你的大型重构和迁移项目可以提上日程了 — Claude Cowork 5 小时速率限制翻倍，多智能体协作不再动不动撞墙。这是限时窗口，趁现在把一直拖着的大项目跑起来。(4,934 likes | 297 RTs) 详情 →

Gemma 4 全系 QAT 权重登陆 Hugging Face。

Google 放出所有尺寸的 Gemma 4 量化感知训练（QAT）检查点 — 不是训练完再压缩，而是训练过程中就把量化织进去。INT4/INT8 下的推理质量比 GPTQ、AWQ 等事后量化方案好一截。如果你在用量化版 Gemma 跑推理，现在有更好的选择了。(1,931 likes | 168 RTs) 详情 →

Google 一周三连发。 Nano Banana 2 GA、Co-Scientist 多智能体科研框架、Dreambeans 个性化生成 — 全部在一周内发布。Google 的出货节奏明显在加速，Gemini 生态正在补齐企业级应用的最后几块拼图。(151 likes | 16 RTs) 详情 →

Higgs Audio v3 — 一个 4B 参数的 TTS 模型，小到能自己部署。 BosonAI 的新语音合成模型在 Hugging Face 上快速走红，参数量控制在 4B，一张消费级显卡就能跑。如果你受够了云端 TTS 的延迟和成本，这个值得试试。(117 likes | 408 downloads) 详情 →

🔬 研究前沿

Opus 4.7 在核磁共振波谱分析上追平人类专家 — 看的是真实光谱，不是教科书。

Anthropic 科学博客发布重磅研究：Claude Opus 4.7 在解读 NMR（核磁共振）光谱时达到甚至超过了人类化学专家的水平。关键区别是这不是做选择题，而是面对真实的、噪声满满的实验数据做结构推断。对药物发现和材料科学的流程来说，这意味着 AI 可以直接参与分析工作，而不只是查文献。(1,655 likes | 169 RTs) 详情 →

Sakana AI 在东京成立全球首个递归自我改进实验室。 由进化模型合并团队主导，专注研究 AI 系统的开放式自我改进。日本制造业的约束思维用在 AI 系统设计上是个新鲜角度 — 这个实验室的产出将定义开源 RSI（递归自我改进）的前沿。(389 likes | 48 RTs) 详情 →

NVIDIA NitroGen 拿下 CVPR 2026 最佳论文荣誉提名。 通用物理的具身智能体 — 一个 Agent 能跨多种物理模拟环境完成任务。从四年前的 MineDojo 到现在的物理通用 Agent，NVIDIA 在具身 AI 上的进展是实打实的。做机器人或仿真的值得细读。(190 likes | 23 RTs) 详情 →

Cog 发布 100 小时 Agent 评测，还敢给准确性上财务担保。 评测时长是 METR 16 小时上限的 6 倍，方法论用 GPT-5 从 Claude Code 对话记录中估算人类等效时间。第一家敢拿真金白银给评测结果背书的公司 — 如果你在做 Agent 评测框架，这是新的参考基线。(216 likes | 12 RTs) 详情 →

🔧 开发者工具

Opus 4.1 正式退役倒计时：2026 年 8 月 5 日。

如果你的生产环境还 pin 着 claude-opus-4-1-20250805，你还有整整两个月迁移到 Opus 4.8。现在就 grep 一下你的代码库，把模型 ID 换了 — 别等到最后一天手忙脚乱。详情 →

TanStack AI 加入一等公民级 MCP 支持。 CLI 自动生成类型、托管服务器生命周期、连接池管理 — 如果你在 React/Vue/Solid 里构建 MCP 驱动的应用，这就是你本来得自己写的那层集成。省掉的胶水代码不少。(161 likes | 11 RTs) 详情 →

Claude Cowork 官方产品指南发布。 多智能体委派模式的权威手册 — 配合今天翻倍的用量限制，现在是重新设计 Cowork 工作流的好时机。详情 →

Anthropic TypeScript SDK v0.101.0 新增中间件支持。 可以在请求/响应链路上插入拦截、转换和日志，不用再包装 client。做可观测性和重试逻辑的终于有了干净的扩展点。详情 →

📝 技术实战

你的 RL 环境可能在拖你模型的后腿。 Latent Space 发了一篇实操指南，列出了真实训练轨迹中发现的 RL 环境反模式 — 这些 bug 会主动让模型变差。如果你在用强化学习（RL）做训练或微调，先对着这份清单审计一遍你的环境再说。详情 →

Anthropic 销售负责人用 Claude Code 重建了 GTM 工作流。 真实内部案例 — 非工程团队怎么用 Claude Code 自动化销售和运营流程。核心启示：AI 编程工具的用户不只是开发者，任何有重复性工作流的团队都能用。找一个你团队里最重复的流程，试着用 Claude Code 自动化它。详情 →

💡 行业洞察

Claude API 故障期间疑似返回其他用户的推理输出。 有用户报告在今天的 API 故障期间收到了不属于自己的输出内容。Anthropic 状态页确认了错误率升高，但尚未确认数据泄露。如果你通过 API 发送敏感数据，密切关注官方事后分析。(91 likes | 5 RTs) 详情 →

Mythos 定价泄露：输出 $70/M tokens，前沿模型的"前沿税"来了。 传闻 Claude Mythos 将与 GPT 5.6 和 Gemini 3.5 同期发布，输出价格是当前 Opus 的 3.5 倍。前沿越来越贵，市场分层正在发生 — 哪些任务值得花前沿模型的钱，哪些用 Sonnet 就够了，是时候算清楚了。(712 likes | 16 RTs) 详情 →

Claude 真的让 rsync 的 bug 变多了吗？独立分析来了。 一篇独立分析探讨 AI 辅助贡献是否在 rsync 这类关键基础设施中引入了更多 bug。Hacker News 上讨论火热 — 在 AI 生成代码占比越来越高的今天，这个问题值得每个团队认真想想。看结论之前先看方法论。(270 likes | 259 RTs) 详情 →

🏗️ 值得一试

NVIDIA Nemotron 3 Ultra 550B BF16 权重开放下载。 昨天发布的 550B MoE 模型，完整 BF16 权重现在可以从 Hugging Face 直接拉。已有 9,125 次下载 — 社区正在大规模压测 NVIDIA 的开源 Agent 骨干模型。有多卡集群的可以跑起来了。(116 likes | 9.1K downloads) 详情 →

🎓 模型小课堂

量化感知训练（Quantization-Aware Training, QAT）：模型量化就是把权重从高精度（比如 FP32）压缩到低精度（比如 INT4、INT8），让模型跑得更快、占显存更少。但传统的事后量化（如 GPTQ、AWQ）是训练完再压缩，模型根本不知道自己会被压 — 就像先做好一件衣服再硬改尺寸，总会变形。QAT 的思路是在训练过程中就模拟量化带来的精度损失，让模型学会在低精度下也保持性能。今天 Gemma 4 发布的 QAT 检查点就是这个思路的产物 — 在 INT4/INT8 下的质量比事后量化方案明显更好。如果你在部署量化模型，QAT 权重是更优的起点。

⚡ 快讯

OpenAI API 平台导航重新设计：找端点、文档和 Playground 更快了。(554 likes | 20 RTs) 链接
Opus 4.7/4.8 性能问题修复中：Anthropic 工程师确认正在修复，等下个 Claude Code 版本。(114 likes | 5 RTs) 链接
Python SDK v0.106.0：Opus 4.1 标记弃用，修复 Foundry client 的 copy()/with_options()。链接
Vercel AI SDK canary 新增统一语音 API：OpenAI、Google、xAI 语音接口一套代码搞定。链接
Lowfat：CLI 过滤器，号称帮 LLM 省 91.8% 的 token。大文件和日志塞给 Claude 之前先过一遍。(102 likes | 54 RTs) 链接

🎯 今日精选

当 AI 不再只是答题机器，而是真的能看懂实验数据：Anthropic 今天发布的科学博客展示了一个质变 — Claude Opus 4.7 在核磁共振（NMR）波谱解读上达到了人类领域专家的水平。注意，这不是做多选题或回答教科书问题，而是面对真实的、带噪声的实验光谱数据，推断分子结构。这个能力一旦成熟，直接影响的是药物发现和材料科学的研发流水线 — 过去需要资深化学家花数小时解读的光谱，AI 可以秒级完成初筛。AI 从"科学助教"到"科学同事"的转变，正在分析化学这个领域先发生了。详情 →

下期见 ✌️