Claude Cowork 未来 30 天速率限制翻倍
🧠 发布动态
Claude Cowork 未来 30 天速率限制翻倍。
你的大型重构和迁移项目可以提上日程了 — Claude Cowork 5 小时速率限制翻倍,多智能体协作不再动不动撞墙。这是限时窗口,趁现在把一直拖着的大项目跑起来。(4,934 likes | 297 RTs) 详情 →
Gemma 4 全系 QAT 权重登陆 Hugging Face。
Google 放出所有尺寸的 Gemma 4 量化感知训练(QAT)检查点 — 不是训练完再压缩,而是训练过程中就把量化织进去。INT4/INT8 下的推理质量比 GPTQ、AWQ 等事后量化方案好一截。如果你在用量化版 Gemma 跑推理,现在有更好的选择了。(1,931 likes | 168 RTs) 详情 →
Google 一周三连发。 Nano Banana 2 GA、Co-Scientist 多智能体科研框架、Dreambeans 个性化生成 — 全部在一周内发布。Google 的出货节奏明显在加速,Gemini 生态正在补齐企业级应用的最后几块拼图。(151 likes | 16 RTs) 详情 →
Higgs Audio v3 — 一个 4B 参数的 TTS 模型,小到能自己部署。 BosonAI 的新语音合成模型在 Hugging Face 上快速走红,参数量控制在 4B,一张消费级显卡就能跑。如果你受够了云端 TTS 的延迟和成本,这个值得试试。(117 likes | 408 downloads) 详情 →
🔬 研究前沿
Opus 4.7 在核磁共振波谱分析上追平人类专家 — 看的是真实光谱,不是教科书。
Anthropic 科学博客发布重磅研究:Claude Opus 4.7 在解读 NMR(核磁共振)光谱时达到甚至超过了人类化学专家的水平。关键区别是这不是做选择题,而是面对真实的、噪声满满的实验数据做结构推断。对药物发现和材料科学的流程来说,这意味着 AI 可以直接参与分析工作,而不只是查文献。(1,655 likes | 169 RTs) 详情 →
Sakana AI 在东京成立全球首个递归自我改进实验室。 由进化模型合并团队主导,专注研究 AI 系统的开放式自我改进。日本制造业的约束思维用在 AI 系统设计上是个新鲜角度 — 这个实验室的产出将定义开源 RSI(递归自我改进)的前沿。(389 likes | 48 RTs) 详情 →
NVIDIA NitroGen 拿下 CVPR 2026 最佳论文荣誉提名。 通用物理的具身智能体 — 一个 Agent 能跨多种物理模拟环境完成任务。从四年前的 MineDojo 到现在的物理通用 Agent,NVIDIA 在具身 AI 上的进展是实打实的。做机器人或仿真的值得细读。(190 likes | 23 RTs) 详情 →
Cog 发布 100 小时 Agent 评测,还敢给准确性上财务担保。 评测时长是 METR 16 小时上限的 6 倍,方法论用 GPT-5 从 Claude Code 对话记录中估算人类等效时间。第一家敢拿真金白银给评测结果背书的公司 — 如果你在做 Agent 评测框架,这是新的参考基线。(216 likes | 12 RTs) 详情 →
🔧 开发者工具
Opus 4.1 正式退役倒计时:2026 年 8 月 5 日。
如果你的生产环境还 pin 着 claude-opus-4-1-20250805,你还有整整两个月迁移到 Opus 4.8。现在就 grep 一下你的代码库,把模型 ID 换了 — 别等到最后一天手忙脚乱。详情 →
TanStack AI 加入一等公民级 MCP 支持。 CLI 自动生成类型、托管服务器生命周期、连接池管理 — 如果你在 React/Vue/Solid 里构建 MCP 驱动的应用,这就是你本来得自己写的那层集成。省掉的胶水代码不少。(161 likes | 11 RTs) 详情 →
Claude Cowork 官方产品指南发布。 多智能体委派模式的权威手册 — 配合今天翻倍的用量限制,现在是重新设计 Cowork 工作流的好时机。详情 →
Anthropic TypeScript SDK v0.101.0 新增中间件支持。 可以在请求/响应链路上插入拦截、转换和日志,不用再包装 client。做可观测性和重试逻辑的终于有了干净的扩展点。详情 →
📝 技术实战
你的 RL 环境可能在拖你模型的后腿。 Latent Space 发了一篇实操指南,列出了真实训练轨迹中发现的 RL 环境反模式 — 这些 bug 会主动让模型变差。如果你在用强化学习(RL)做训练或微调,先对着这份清单审计一遍你的环境再说。详情 →
Anthropic 销售负责人用 Claude Code 重建了 GTM 工作流。 真实内部案例 — 非工程团队怎么用 Claude Code 自动化销售和运营流程。核心启示:AI 编程工具的用户不只是开发者,任何有重复性工作流的团队都能用。找一个你团队里最重复的流程,试着用 Claude Code 自动化它。详情 →
💡 行业洞察
Claude API 故障期间疑似返回其他用户的推理输出。 有用户报告在今天的 API 故障期间收到了不属于自己的输出内容。Anthropic 状态页确认了错误率升高,但尚未确认数据泄露。如果你通过 API 发送敏感数据,密切关注官方事后分析。(91 likes | 5 RTs) 详情 →
Mythos 定价泄露:输出 $70/M tokens,前沿模型的"前沿税"来了。 传闻 Claude Mythos 将与 GPT 5.6 和 Gemini 3.5 同期发布,输出价格是当前 Opus 的 3.5 倍。前沿越来越贵,市场分层正在发生 — 哪些任务值得花前沿模型的钱,哪些用 Sonnet 就够了,是时候算清楚了。(712 likes | 16 RTs) 详情 →
Claude 真的让 rsync 的 bug 变多了吗?独立分析来了。 一篇独立分析探讨 AI 辅助贡献是否在 rsync 这类关键基础设施中引入了更多 bug。Hacker News 上讨论火热 — 在 AI 生成代码占比越来越高的今天,这个问题值得每个团队认真想想。看结论之前先看方法论。(270 likes | 259 RTs) 详情 →
🏗️ 值得一试
NVIDIA Nemotron 3 Ultra 550B BF16 权重开放下载。 昨天发布的 550B MoE 模型,完整 BF16 权重现在可以从 Hugging Face 直接拉。已有 9,125 次下载 — 社区正在大规模压测 NVIDIA 的开源 Agent 骨干模型。有多卡集群的可以跑起来了。(116 likes | 9.1K downloads) 详情 →
🎓 模型小课堂
量化感知训练(Quantization-Aware Training, QAT):模型量化就是把权重从高精度(比如 FP32)压缩到低精度(比如 INT4、INT8),让模型跑得更快、占显存更少。但传统的事后量化(如 GPTQ、AWQ)是训练完再压缩,模型根本不知道自己会被压 — 就像先做好一件衣服再硬改尺寸,总会变形。QAT 的思路是在训练过程中就模拟量化带来的精度损失,让模型学会在低精度下也保持性能。今天 Gemma 4 发布的 QAT 检查点就是这个思路的产物 — 在 INT4/INT8 下的质量比事后量化方案明显更好。如果你在部署量化模型,QAT 权重是更优的起点。
⚡ 快讯
- OpenAI API 平台导航重新设计:找端点、文档和 Playground 更快了。(554 likes | 20 RTs) 链接
- Opus 4.7/4.8 性能问题修复中:Anthropic 工程师确认正在修复,等下个 Claude Code 版本。(114 likes | 5 RTs) 链接
- Python SDK v0.106.0:Opus 4.1 标记弃用,修复 Foundry client 的 copy()/with_options()。 链接
- Vercel AI SDK canary 新增统一语音 API:OpenAI、Google、xAI 语音接口一套代码搞定。 链接
- Lowfat:CLI 过滤器,号称帮 LLM 省 91.8% 的 token。大文件和日志塞给 Claude 之前先过一遍。(102 likes | 54 RTs) 链接
🎯 今日精选
当 AI 不再只是答题机器,而是真的能看懂实验数据:Anthropic 今天发布的科学博客展示了一个质变 — Claude Opus 4.7 在核磁共振(NMR)波谱解读上达到了人类领域专家的水平。注意,这不是做多选题或回答教科书问题,而是面对真实的、带噪声的实验光谱数据,推断分子结构。这个能力一旦成熟,直接影响的是药物发现和材料科学的研发流水线 — 过去需要资深化学家花数小时解读的光谱,AI 可以秒级完成初筛。AI 从"科学助教"到"科学同事"的转变,正在分析化学这个领域先发生了。 详情 →
下期见 ✌️