Claude Corps 来了 — Anthropic 的下一代智能层

🧠 发布动态

Claude Corps 来了 — Anthropic 的下一代智能层。

不是又一个模型升级，而是一整套面向高难度知识工作和编码的智能体产品。Claude Corps 的定位很清楚：Fable 5 解决通用对话，Corps 解决那些需要深度推理、长时间专注、多步骤协作的硬活。如果你的工作流里有"让 AI 连续干 2 小时不走神"的需求，这就是为你准备的。现在就去看看适不适合你的场景。详情 →

Fable 5 的安全护栏终于透明了。

社区吐槽 Fable 5 拒绝行为不透明？Anthropic 听进去了。现在 Fable 5 的 LLM 开发安全护栏完全公开可查 — 你能看到哪些场景会触发限制、为什么触发、以及如何规避误杀。之前因为莫名其妙被拒绝而弃用 Fable 的开发者，值得再试一次。(4,521 likes | 387 RTs) 详情 →

SCAIL-2 加入开源视频生成战局。 又一个 image-to-video 模型在 HuggingFace 上登顶热榜。SCAIL-2 主打图生视频，开源可用。这个赛道现在挤得跟早高峰地铁似的，但竞争越激烈，开发者的选择越多。(112 likes) 详情 →

📝 技术实战

Fable 5 直接生成了一个能用的 V8 发动机 CAD 模型。

一个 prompt，一个完整的 V8 发动机三维模型 — 不是示意图，是真正可以导入 CAD 软件的工程模型。Fable 5 在硬件工程设计领域展现的能力超出了大多数人对大语言模型（LLM）的想象。如果你做机械设计、工业设计，这个演示值得认真看 — 然后在自己的项目上试一把。(5,619 likes | 384 RTs) 详情 →

Carmack 提了个有意思的想法：为 AI 优化代码风格。 John Carmack 建议用 LLM 找出什么样的代码写法更容易被 AI Agent 理解和导航。逻辑很简单 — 如果代码对机器更友好，大概率对人也更友好。这不是"让 AI 重写你的代码"，而是"让你的代码对所有读者都更好读"。(1,021 likes) 详情 →

PyTorch MLP 层融合实战指南。 HuggingFace 出了一篇手把手教程：从 nn.Linear 到 Fused MLP，附完整 profiling 流程和具体加速数据。不是理论文章，是你今天就能拿去加速训练的实操指南。跑模型的都该看。详情 →

🔬 研究前沿

DeepMind 联合 Schmidt Sciences 投 1000 万美元研究多智能体安全。

这是第一笔专门针对"AI Agent 群体交互时会出什么问题"的大额研究资金。当多个 Agent 协作、竞争、通信时，单个模型不存在的行为可能自发涌现 — 而我们目前几乎没有工具来预测或控制这些涌现行为。DeepMind 这笔钱下注的是：多智能体系统的安全问题会比单模型安全问题更早爆发。做多智能体研究的，赶紧申请。详情 →

LeCun 说卡尔森其实不"擅长"下棋 — 至少不是你理解的那种"擅长"。 Yann LeCun 发了一篇可能是今年最具争议的 AI 论文，核心论点：我们衡量智能和能力的方式从根本上就有问题。用国际象棋 Elo 评价"智能"，就像用百米冲刺成绩评价"运动能力" — 精确但片面。对 AI 评测体系的启示很深：如果你还在根据单一跑分选模型，可能该换个思路了。(2,811 likes | 512 RTs) 详情 →

独立测评：Fable 5 编码能力只是中游水平。 Endor Labs 跑了一轮独立基准测试，结果给 Fable 5 的编码评分是 mid-tier — 跟发布时的宣传形成鲜明对比。老规矩：不要看发布会选模型，在自己的任务上跑 eval 再做决定。(189 likes | 85 RTs) 详情 →

Palmeiras 成为首个用 TacticAI 的足球俱乐部。 DeepMind 的 TacticAI 能模拟未来 8 秒的球场动态 — 巴西球队 Palmeiras 是第一个吃螃蟹的。AI 体育分析从统计看板进化到实时战术预测，这个方向的商业化速度比预想的快。(1,791 likes | 188 RTs) 详情 →

💡 行业洞察

Dario Amodei 发了一篇 AI 治理长文 — 这不是空谈。

Anthropic CEO 的最新文章可能是迄今为止任何前沿实验室负责人写过的最详尽的 AI 治理蓝图。不是那种"我们需要负责任的 AI"的套话，而是具体到政策框架、监管时间线、实验室自律机制的完整方案。核心论点很直白：AI 发展速度已经超过政策制定速度，行业要么自己先建规则，要么等政府来建 — 后者通常更粗暴。不管你同不同意他的方案，这篇值得读全文。(121 likes | 178 RTs) 详情 →

Anthropic 启动千人公益 AI 计划。 Claude Corps 同名但不同事 — 这是一个面向早期职业人才的 fellowship 项目，资助 1000 人到美国非营利组织里用 AI 干活。这是前沿实验室里规模最大的公益 AI 人才项目。如果你身边有刚入行的年轻人对 AI + 社会影响感兴趣，分享给他们。(4,788 likes | 492 RTs) 详情 →

社区吐槽真的有用 — Simon Willison 确认 Fable 5 限制已撤回。 Simon Willison 明确表示 Anthropic 已经回滚了之前引发争议的 Fable 5 限制策略。这事的意义不只是"问题修了"，而是证明了一个模式：社区有组织的反馈能改变前沿实验室的产品决策。之前因为限制放弃 Fable 的用例，可以重新评估了。(1,001 likes | 73 RTs) 详情 →

DXC 把 Claude 接入银行、航空和受监管行业。 DXC 跟 Anthropic 达成合作，把 Claude 集成到银行、航空公司等受严格监管的企业系统里。模式越来越清晰：受监管行业的 AI 采用不是"要不要"的问题，而是"谁先打通合规通道"的问题。详情 →

Ramp AI 指数：OpenAI 在 Codex 发布后企业支出居然没涨。 Ramp 六月 AI 支出指数显示，OpenAI 的企业端消费在 Codex 发布后基本持平 — 产品发布和实际企业采用之间的鸿沟比想象的大。做决策的时候，看钱的流向比看发布会更靠谱。(231 likes | 31 RTs) 详情 →

🔧 开发者工具

Vercel AI SDK 紧急安全补丁 — 立即更新。 严重漏洞：Vercel AI SDK 之前会直接执行客户端消息历史中的工具调用，不重新验证输入 schema 和审批状态。如果你用了 tool approvals 功能，这个洞可以被绕过。v6.0.202 已修复，现在就更新。详情 →

CrewAI 1.14.7：可插拔后端 + Snowflake Cortex。 CrewAI 这次更新动作不小 — 可插拔的记忆/知识后端、对话式 Chat API、原生 Snowflake Cortex 支持。对做多智能体部署的团队来说，架构灵活性大幅提升。详情 →

🏗️ 值得一试

50 美元零件 + Claude 3 小时 = 咖啡机控制器。 Anthropic 的 Claude Code 负责人用一个 $50 的零件和 Fable 5，3 小时搞定了一个意式咖啡机的显示控制器。不是概念验证，是真的能用。硬件 tinkering 的门槛被 AI 拉到了这个程度 — 周末找个项目试试。(899 likes) 详情 →

DiffusionGemma GGUF：本地跑 Google 的扩散式文本生成。 Unsloth 发布了 GGUF 量化版 DiffusionGemma — 通过 llama.cpp 在本地运行 Google 的并行文本生成模型。这是目前在自己机器上测试扩散文本生成最快的方式。(177 likes) 详情 →

🎓 模型小课堂

多智能体系统中的涌现行为（Emergent Behavior in Multi-Agent Systems）：DeepMind 刚拿出 1000 万美元研究这个问题 — 当多个 AI Agent 在一个系统里协作、竞争或通信时，可能出现任何单个模型都不具备的行为。这就像蚂蚁群体能建造复杂蚁穴，但单只蚂蚁完全不理解建筑学。问题在于：这些涌现行为既可能是有益的（更高效的协作），也可能是危险的（集体"幻觉"或欺骗策略），而我们目前几乎没有工具来预测哪种情况会发生。

⚡ 快讯

Prometheus：Bezos 的 AI 创业公司据报估值 410 亿美元，瞄准工程和制造业。链接
Simon Willison：Fable "主动得令人发指" — 用的时候记得加好护栏。链接
TestSprite：开源 CLI，让 Agent 像真实用户一样跑端到端测试（Apache-2.0）。链接
ChatGPT：OpenAI 重新设计了模型选择器，回应"模型太多选不过来"的用户吐槽。(563 likes) 链接
Claude Code v2.1.173：修复 Fable 5 模型名称规范化问题，清理 Windows 沙箱警告。链接

🎯 今日精选

Amodei 的治理长文不是作秀 — 这是前沿实验室第一次承认自己跑得比安全机制快：Dario Amodei 这篇文章的分量在于它的坦诚程度。不是"我们很负责任"的 PR 话术，而是一位前沿实验室 CEO 第一次公开承认：整个行业的发展速度已经超过了自身安全机制的承载能力。他提出的具体方案 — 从实验室间的协调机制到政府介入的触发条件 — 如果真的执行，会从根本上改变实验室自我监管的方式。关键判断：与其等政府出手（通常是过度反应），不如行业先建立可信的自律框架。不管你觉得他是真心还是在抢占叙事高地，这篇文章设定了接下来 AI 治理讨论的基调。详情 →

下期见 ✌️