Claude Corps 来了 — Anthropic 的下一代智能层
🧠 发布动态
Claude Corps 来了 — Anthropic 的下一代智能层。
不是又一个模型升级,而是一整套面向高难度知识工作和编码的智能体产品。Claude Corps 的定位很清楚:Fable 5 解决通用对话,Corps 解决那些需要深度推理、长时间专注、多步骤协作的硬活。如果你的工作流里有"让 AI 连续干 2 小时不走神"的需求,这就是为你准备的。现在就去看看适不适合你的场景。 详情 →
Fable 5 的安全护栏终于透明了。
社区吐槽 Fable 5 拒绝行为不透明?Anthropic 听进去了。现在 Fable 5 的 LLM 开发安全护栏完全公开可查 — 你能看到哪些场景会触发限制、为什么触发、以及如何规避误杀。之前因为莫名其妙被拒绝而弃用 Fable 的开发者,值得再试一次。(4,521 likes | 387 RTs) 详情 →
SCAIL-2 加入开源视频生成战局。 又一个 image-to-video 模型在 HuggingFace 上登顶热榜。SCAIL-2 主打图生视频,开源可用。这个赛道现在挤得跟早高峰地铁似的,但竞争越激烈,开发者的选择越多。(112 likes) 详情 →
📝 技术实战
Fable 5 直接生成了一个能用的 V8 发动机 CAD 模型。
一个 prompt,一个完整的 V8 发动机三维模型 — 不是示意图,是真正可以导入 CAD 软件的工程模型。Fable 5 在硬件工程设计领域展现的能力超出了大多数人对大语言模型(LLM)的想象。如果你做机械设计、工业设计,这个演示值得认真看 — 然后在自己的项目上试一把。(5,619 likes | 384 RTs) 详情 →
Carmack 提了个有意思的想法:为 AI 优化代码风格。 John Carmack 建议用 LLM 找出什么样的代码写法更容易被 AI Agent 理解和导航。逻辑很简单 — 如果代码对机器更友好,大概率对人也更友好。这不是"让 AI 重写你的代码",而是"让你的代码对所有读者都更好读"。(1,021 likes) 详情 →
PyTorch MLP 层融合实战指南。 HuggingFace 出了一篇手把手教程:从 nn.Linear 到 Fused MLP,附完整 profiling 流程和具体加速数据。不是理论文章,是你今天就能拿去加速训练的实操指南。跑模型的都该看。 详情 →
🔬 研究前沿
DeepMind 联合 Schmidt Sciences 投 1000 万美元研究多智能体安全。
这是第一笔专门针对"AI Agent 群体交互时会出什么问题"的大额研究资金。当多个 Agent 协作、竞争、通信时,单个模型不存在的行为可能自发涌现 — 而我们目前几乎没有工具来预测或控制这些涌现行为。DeepMind 这笔钱下注的是:多智能体系统的安全问题会比单模型安全问题更早爆发。做多智能体研究的,赶紧申请。 详情 →
LeCun 说卡尔森其实不"擅长"下棋 — 至少不是你理解的那种"擅长"。 Yann LeCun 发了一篇可能是今年最具争议的 AI 论文,核心论点:我们衡量智能和能力的方式从根本上就有问题。用国际象棋 Elo 评价"智能",就像用百米冲刺成绩评价"运动能力" — 精确但片面。对 AI 评测体系的启示很深:如果你还在根据单一跑分选模型,可能该换个思路了。(2,811 likes | 512 RTs) 详情 →
独立测评:Fable 5 编码能力只是中游水平。 Endor Labs 跑了一轮独立基准测试,结果给 Fable 5 的编码评分是 mid-tier — 跟发布时的宣传形成鲜明对比。老规矩:不要看发布会选模型,在自己的任务上跑 eval 再做决定。(189 likes | 85 RTs) 详情 →
Palmeiras 成为首个用 TacticAI 的足球俱乐部。 DeepMind 的 TacticAI 能模拟未来 8 秒的球场动态 — 巴西球队 Palmeiras 是第一个吃螃蟹的。AI 体育分析从统计看板进化到实时战术预测,这个方向的商业化速度比预想的快。(1,791 likes | 188 RTs) 详情 →
💡 行业洞察
Dario Amodei 发了一篇 AI 治理长文 — 这不是空谈。
Anthropic CEO 的最新文章可能是迄今为止任何前沿实验室负责人写过的最详尽的 AI 治理蓝图。不是那种"我们需要负责任的 AI"的套话,而是具体到政策框架、监管时间线、实验室自律机制的完整方案。核心论点很直白:AI 发展速度已经超过政策制定速度,行业要么自己先建规则,要么等政府来建 — 后者通常更粗暴。不管你同不同意他的方案,这篇值得读全文。(121 likes | 178 RTs) 详情 →
Anthropic 启动千人公益 AI 计划。 Claude Corps 同名但不同事 — 这是一个面向早期职业人才的 fellowship 项目,资助 1000 人到美国非营利组织里用 AI 干活。这是前沿实验室里规模最大的公益 AI 人才项目。如果你身边有刚入行的年轻人对 AI + 社会影响感兴趣,分享给他们。(4,788 likes | 492 RTs) 详情 →
社区吐槽真的有用 — Simon Willison 确认 Fable 5 限制已撤回。 Simon Willison 明确表示 Anthropic 已经回滚了之前引发争议的 Fable 5 限制策略。这事的意义不只是"问题修了",而是证明了一个模式:社区有组织的反馈能改变前沿实验室的产品决策。之前因为限制放弃 Fable 的用例,可以重新评估了。(1,001 likes | 73 RTs) 详情 →
DXC 把 Claude 接入银行、航空和受监管行业。 DXC 跟 Anthropic 达成合作,把 Claude 集成到银行、航空公司等受严格监管的企业系统里。模式越来越清晰:受监管行业的 AI 采用不是"要不要"的问题,而是"谁先打通合规通道"的问题。 详情 →
Ramp AI 指数:OpenAI 在 Codex 发布后企业支出居然没涨。 Ramp 六月 AI 支出指数显示,OpenAI 的企业端消费在 Codex 发布后基本持平 — 产品发布和实际企业采用之间的鸿沟比想象的大。做决策的时候,看钱的流向比看发布会更靠谱。(231 likes | 31 RTs) 详情 →
🔧 开发者工具
Vercel AI SDK 紧急安全补丁 — 立即更新。 严重漏洞:Vercel AI SDK 之前会直接执行客户端消息历史中的工具调用,不重新验证输入 schema 和审批状态。如果你用了 tool approvals 功能,这个洞可以被绕过。v6.0.202 已修复,现在就更新。 详情 →
CrewAI 1.14.7:可插拔后端 + Snowflake Cortex。 CrewAI 这次更新动作不小 — 可插拔的记忆/知识后端、对话式 Chat API、原生 Snowflake Cortex 支持。对做多智能体部署的团队来说,架构灵活性大幅提升。 详情 →
🏗️ 值得一试
50 美元零件 + Claude 3 小时 = 咖啡机控制器。 Anthropic 的 Claude Code 负责人用一个 $50 的零件和 Fable 5,3 小时搞定了一个意式咖啡机的显示控制器。不是概念验证,是真的能用。硬件 tinkering 的门槛被 AI 拉到了这个程度 — 周末找个项目试试。(899 likes) 详情 →
DiffusionGemma GGUF:本地跑 Google 的扩散式文本生成。 Unsloth 发布了 GGUF 量化版 DiffusionGemma — 通过 llama.cpp 在本地运行 Google 的并行文本生成模型。这是目前在自己机器上测试扩散文本生成最快的方式。(177 likes) 详情 →
🎓 模型小课堂
多智能体系统中的涌现行为(Emergent Behavior in Multi-Agent Systems):DeepMind 刚拿出 1000 万美元研究这个问题 — 当多个 AI Agent 在一个系统里协作、竞争或通信时,可能出现任何单个模型都不具备的行为。这就像蚂蚁群体能建造复杂蚁穴,但单只蚂蚁完全不理解建筑学。问题在于:这些涌现行为既可能是有益的(更高效的协作),也可能是危险的(集体"幻觉"或欺骗策略),而我们目前几乎没有工具来预测哪种情况会发生。
⚡ 快讯
- Prometheus:Bezos 的 AI 创业公司据报估值 410 亿美元,瞄准工程和制造业。 链接
- Simon Willison:Fable "主动得令人发指" — 用的时候记得加好护栏。 链接
- TestSprite:开源 CLI,让 Agent 像真实用户一样跑端到端测试(Apache-2.0)。 链接
- ChatGPT:OpenAI 重新设计了模型选择器,回应"模型太多选不过来"的用户吐槽。(563 likes) 链接
- Claude Code v2.1.173:修复 Fable 5 模型名称规范化问题,清理 Windows 沙箱警告。 链接
🎯 今日精选
Amodei 的治理长文不是作秀 — 这是前沿实验室第一次承认自己跑得比安全机制快:Dario Amodei 这篇文章的分量在于它的坦诚程度。不是"我们很负责任"的 PR 话术,而是一位前沿实验室 CEO 第一次公开承认:整个行业的发展速度已经超过了自身安全机制的承载能力。他提出的具体方案 — 从实验室间的协调机制到政府介入的触发条件 — 如果真的执行,会从根本上改变实验室自我监管的方式。关键判断:与其等政府出手(通常是过度反应),不如行业先建立可信的自律框架。不管你觉得他是真心还是在抢占叙事高地,这篇文章设定了接下来 AI 治理讨论的基调。 详情 →
下期见 ✌️