Opus 4.7 开了快车道 — 输出速度提升 2.5 倍,API 和 Claude Code 同步上线
🧠 发布动态
Opus 4.7 开了快车道 — 输出速度提升 2.5 倍,API 和 Claude Code 同步上线。
你的 Agent 工作流刚提速了。Opus 4.7 fast mode 进入 research preview,同等质量层级下输出速度翻 2.5 倍 — 对延迟敏感的 Agent 场景来说这是质变。定价 $30/$150 per 1M tokens,跟 Opus 4.6 fast mode 一致。Claude Code 里打 /fast 直接开启,API 端设置 speed: fast 加 beta header,但目前需要 waitlist。(2,300 likes | 93 RTs) 详情 →
Opus 4.7 Fast Mode API 文档上线。 官方文档确认:相同价格、相同 rate limits,waitlist 准入制。想尝鲜的先排队。 详情 →
Anthropic 首次下场做垂直行业 — Claude for Legal 来了。 全球法律服务市场超万亿美元,Anthropic 不再只做通用工具。法律行业对上下文长度、推理准确性、合规性要求极高,正好是 Claude 长项。这是 Anthropic 从"最好的通用模型"转向"最好的行业解决方案"的信号。 详情 →
🔧 开发者工具
OpenAI 发布 Symphony — 每个任务自动生成一个 Codex Agent。
多 Agent IDE 之战正式开打。OpenAI Symphony 让工作流中的每个 open task 自动 spawn 一个专属 Codex Agent — 这是对 Claude Code agent view 的正面回应,而且撞在同一周。如果你还在单 Agent 模式下工作,两家巨头都在告诉你:该换打法了。(663 likes | 53 RTs) 详情 →
claude agents — 你不知道的终端控制面板。 Power-user 技巧:在项目根目录运行 claude agents,获得所有 session 的终端控制面板。任何 CLI session 里按左箭头即可注册。多 Agent 工作流的效率倍增器。(522 likes | 35 RTs) 详情 →
这个 MCP Server 把 Claude Code 的工具调用减少了 94%。 一个开源 MCP Server 把你的代码库索引成本地知识图谱(Knowledge Graph),Agent 查图谱而不是扫文件。支持 19+ 种语言,完全本地运行,不需要 API key。直击上周讨论的 token 开销问题 — 大仓库必试。(132 likes | 10 RTs) 详情 →
🔬 研究前沿
DeepMind 要重新发明鼠标指针 — 手势、语音和 Gemini 接管屏幕。
50 年了,我们还在用一个小箭头指来指去。Google DeepMind 的实验性 demo 展示了另一种可能:动作、语音、自然手势直接指挥 Gemini 在屏幕上操作。这不是 UX 小实验 — 这是在赌下一代计算范式会彻底跳过聊天界面,谁拥有交互层谁就拥有平台。结合即将到来的 Google I/O,多模态交互是谷歌要讲的大故事。(4,414 likes | 505 RTs) 详情 →
GPT 5.5 攻破 ProgramBench — 而且两个配置选了不同编程语言。 GPT 5.5 high/xhigh 成为第一个解出 ProgramBench 任务的模型,打破了又一个基准天花板。更有意思的是两个配置独立选择了不同语言来解题 — 模型的策略多样性本身就值得研究。(954 likes | 90 RTs) 详情 →
Sakana AI 的 KAME 走了一条不同的实时语音路线。 当 OpenAI 和 xAI 都在用单模型搞语音 Agent 时,KAME 用 tandem 架构(串联架构)增强实时语音对话中的知识能力。语音 AI 架构正在分化,这条路线值得关注。(730 likes | 145 RTs) 详情 →
Thinking Machines 干掉了语音活动检测器(VAD)。 TML-Interaction-Small(276B-A12B)推进实时语音 SOTA,完全去掉了传统 VAD — 用原生交互模型处理对话轮替。做语音 Agent 的注意了,VAD 可能不再是必需组件。 详情 →
📝 技术实战
Boris Cherny 用 Claude Cowork + Opus 4.7 端到端订机票。 Claude Code 的创造者亲自验证:Opus 4.7 跨过了真实世界 Agent 任务的可用性门槛 — 从搜索航班到完成预订,全程 Agent 搞定。模型能力的提升终于在日常任务上体现出来了。(2,789 likes | 71 RTs) 详情 →
你的 Claude Code 可能在吃 30GB 内存。 Simon Willison 发现 Claude Code 进程在他的 Mac 上占了近 30GB — 单个进程最高 7.8GB。如果你同时开多个 Claude Code session,去看一眼 Activity Monitor。这是目前已知的实际问题,不是 edge case。(551 likes | 8 RTs) 详情 →
💡 行业洞察
Code with Claude SF — Anthropic 开发者生态的旗舰时刻。
Anthropic 举办了 Code with Claude SF 开发者活动,这不只是一场会议 — 这是 Anthropic 从"模型公司"转向"开发者平台"的标志性动作。活动内容围绕 AI 指数级增长展开,释放了产品路线图和生态战略的关键信号。 详情 →
Mollick:ChatGPT 悄悄砍掉了 Study Mode,这是个大错误。 OpenAI 默默移除了 ChatGPT 的学习模式。Mollick 指出证据很清楚 — AI 在纯助手模式下会损害学习效果,Study Mode 是最简单的补救。Claude 和 Gemini 还保留着类似功能,教育场景的用户注意切换。(495 likes | 36 RTs) 详情 →
ASI 启发式判断法:看咨询团队,别看跑分。 Mollick 又一个精辟观察:只要 AI 实验室还需要"前线部署工程"团队来让 AI 真正好用,ASI 的时间线就比营销材料说的远得多。下次有人跟你吹 AGI 将至,问问他们的 consulting team 有多大就行了。(804 likes | 72 RTs) 详情 →
🏗️ 值得一试
Anthropic 安全团队用 Claude Code 搭建了威胁检测平台。 自家人吃自家饭 — Anthropic 的网络安全团队用 Claude Code 构建内部威胁检测系统。这是一个具体的 Agent 编码工具在安全运营中的实战案例,做安全的值得研究这套架构。 详情 →
Needle:把 Gemini 的工具调用能力蒸馏进 26M 参数模型。 一个只有 2600 万参数的模型,复刻了 Gemini 的 tool-calling 能力 — 比原模型小 1000 倍。如果工具调用可以这么激进地蒸馏,Agent 架构的成本结构要重新算了。(242 likes | 87 RTs) 详情 →
🎓 模型小课堂
投机解码(Speculative Decoding):Opus 4.7 fast mode 承诺同等质量下速度提升 2.5 倍 — 投机解码是背后的关键技术。原理很直觉:用一个更小、更快的模型先"草拟"一批 token,然后让完整的大模型批量验证。验证通过的直接采纳,不通过的重新生成。因为大模型验证一批 token 的速度远快于逐个生成,整体速度就上去了。类比:让实习生先写初稿,主编批量审阅比从头写快得多 — 而且最终质量由主编把关。
⚡ 快讯
- Altman 定义 Daybreak:OpenAI 把 Daybreak 定位为自家的网络安全垂直产品,frontier 模型 + Codex 组合出击。(2,385 likes | 167 RTs) 链接
- Gemini Omni:传闻将在 Google I/O 发布 — 高级视频模型,带花式编辑和世界理解能力。(262 likes | 14 RTs) 链接
- Code with Claude 硬件赠品:Anthropic 给参会者发了迷你电脑,催生了一波创意小型构建。(1,996 likes | 122 RTs) 链接
- Claude Code v2.1.140:Agent 颜色方案更新、子类型匹配改进、/goal 卡死问题修复。 链接
- LangChain 1.3.0:大版本更新,v3 stream_events 支持上线,Agent 执行数据流方式变了。做 LangChain Agent 的更新并迁移。 链接
🎯 今日精选
DeepMind 的 AI 指针不是 UX 实验 — 这是一场交互层的平台之争。 当所有人都在卷聊天界面和 Agent 工具链时,DeepMind 在问一个更根本的问题:如果下一代计算范式根本不需要聊天呢?他们的实验性 demo 展示了手势、语音和自然动作直接指挥 Gemini 操控屏幕 — 跳过了打字、跳过了 prompt、甚至跳过了鼠标。这不是学术玩具:结合即将到来的 Google I/O 和 Gemini Omni 传闻,谷歌在押注多模态交互就是下一个操作系统级入口。历史反复证明,谁控制了人机交互层,谁就控制了平台 — 从 GUI 到触屏到语音助手都是如此。如果 DeepMind 赌对了,今天围绕 chat-based AI 建立的护城河都得重修。(4,414 likes | 505 RTs) 详情 →
下期见 ✌️