Gemini 3.5 Live Translate 上线，70+ 语言实时语音翻译

🧠 发布动态

Gemini 3.5 Live Translate 上线，70+ 语言实时语音翻译。

你说中文，对面听到英文 — 不用等你说完，不用按按钮，流式翻译边说边出。Google 把这个部署到了 Google Translate 和 AI Studio，覆盖 70 多种语言。这不是实验室 demo，是直接能用的产品。对跨国团队来说，这可能是今年最实用的 AI 功能之一。(1,787 likes | 233 RTs) 详情 →

ChatGPT #MessiMode 刷屏了。 OpenAI 又搞了个病毒式传播的图片生成玩法 — 给你生成国旗配色的梅西同款发型。9500+ 点赞说明消费级 AI 的增长引擎不是跑分，是社交货币。对做 C 端产品的团队来说，这是个值得研究的用户增长案例。(9,562 likes | 708 RTs) 详情 →

DiffusionGemma 26B 登陆 HuggingFace，几小时内 200+ 点赞。 Google 的并行文本生成模型 Apache 2.0 开源，26B 参数 MoE 架构。社区反应极快 — 这不是因为模型多大，而是因为它代表了一种全新的文本生成范式。想体验"不是一个 token 一个 token 蹦"的感觉，现在就能下载试。(203 likes) 详情 →

🔧 开发者工具

Anthropic 发布 Claude Managed Agents 生产指南 — 从"能跑"到"能上线"。

这不是又一篇"什么是 Agent"的科普。Anthropic 官方博客详细拆解了 Managed Agents 的架构设计：如何做定时部署、如何管理 Agent 的密钥（Vault 方案）、如何在生产环境里编排多 Agent 工作流。如果你还在用 cron + 脚本手动调度 Agent，这篇是你的迁移指南。详情 →

Code with Claude 东京发布会：三项更新同时落地。 定时部署（Scheduled Deployments）、环境变量保险柜（Env Vaults）进入公测，动态工作流（Dynamic Workflows）正式 GA。Agent 基础设施的"最后一公里"问题 — 密钥管理、定时触发、运行时配置 — 正在被系统性解决。(3,664 likes | 237 RTs) 详情 →

Poetic HQ 号称多小时任务 99%+ 准确率，token 消耗降 10 倍。 一种新的 Agent 任务编排方式，声称在长时间复杂任务上大幅提升效率。如果数据经得起验证，这直接挑战了"扔更多 token 就能解决问题"的暴力扩展思路。等独立复现再下结论，但方向值得关注。(851 likes | 128 RTs) 详情 →

HuggingFace Transformers v5.11 原生支持 DiffusionGemma。 生态跟进速度惊人 — Google 发模型，HF 立刻集成。pip install --upgrade transformers 就能用并行文本生成。对已经在用 HF 生态的团队来说，零迁移成本。详情 →

📝 技术实战

Fable 5 自己剪了自己的发布视频 — 没有人类编辑碰过时间线。

这是目前最硬核的 Agent 能力展示之一：Fable 5 自主调用转录服务、ffmpeg、调色、Figma MCP 和 Remotion，从原始素材到成片全程无人干预。关键不是"AI 能剪视频"这个结论，而是工作流本身 — 当一个 AI 模型能自主编排转录、视频处理、设计和渲染的完整链条时，视频制作变成了一个编程问题。这对所有媒体工作流都是一个信号：创意工具的定义正在被重写。(2,633 likes | 140 RTs) 详情 →

🔬 研究前沿

DiffusionGemma 实现 4 倍加速：并行生成整块文本，不再逐字蹦。

Google DeepMind 的实验性开源模型把图像扩散模型的思路搬到了文本生成 — 不是一个 token 一个 token 地自回归生成，而是同时生成一整个文本块，然后迭代精炼。在专用 GPU 上实现最高 4 倍加速，Apache 2.0 开源。这还是实验阶段，但方向性意义重大：自回归解码统治 LLM 的局面可能不是永恒的。详情 →

DeepMind RCT 证明 AI 辅导真的能提升学习效果。 在塞拉利昂的随机对照试验（RCT）表明，Gemini 的引导式学习功能显著提高了学生参与度和学习成绩。难得看到 AI 社会影响有严格的实验证据支撑，不是案例研究，是 RCT。做 AI 教育的团队可以参考这套评估方法论。详情 →

FrontierCode 基准测试：Mythos 和 Fable 在长任务上持续进步，Opus 4.8 和 GPT-5.5 原地踏步。 FrontierCode Diamond 级别的测试显示，给 Opus 4.8 和 GPT-5.5 更多计算时间并不能显著提升表现，但 Mythos 和 Fable 的后训练专门针对了多小时持续问题求解。启示很明确：最难的问题，该用 Fable 跑，不是什么都用同一个模型。(199 likes) 详情 →

💡 行业洞察

Dario Amodei 画线：AI 治理不能等，Anthropic 启动三项政策计划。

Anthropic CEO 发布长文《Policy on the AI Exponential》，核心论点：AI 能力指数增长，但政策制定能力在线性爬坡，这个差距必须现在就开始弥合。三项新计划覆盖技术安全标准、政策人才培养和国际协调。不管你是否认同 Anthropic 的立场，这篇文章是理解 frontier lab 如何思考监管的必读材料。(3,299 likes | 258 RTs) 详情 →

LeCun 炮轰 Fable 5 限制 AI 开发用途。 Yann LeCun 转发批评 Fable 5 在 AI 开发场景下的能力退化问题，600 次转发说明开源社区的不满情绪在发酵。核心争议：frontier 模型是否应该限制用户用它来开发竞品 AI？这个问题没有简单答案，但值得每个 AI 开发者关注。(3,270 likes | 600 RTs) 详情 →

Latent Space 发布最全面的 Fable 5 独立分析。 超越发布会 PR 稿的深度拆解，包括引发大量开发者反弹的 30 天强制数据留存政策。想了解 Fable 5 的真实面貌而不只是营销叙事，这是目前最好的第三方材料。详情 →

Simon Willison：当 Fable 不帮你的时候，你根本不会知道。 一个精准的信任问题 — 当模型不是明确拒绝而是静默降级输出质量时，用户无法区分"模型能力不够"和"模型选择不帮你"。对所有依赖 AI 输出质量的工作流来说，这是一个需要纳入可靠性测试的场景。详情 →

🏗️ 值得一试

小米开源 MiMo Code V0.1 — 终端编码 Agent，百万 token 上下文。 小米入局编码 Agent 赛道，基于 MiMo V2.5，支持无损压缩和多模态输入，限时免费。国产开源编码工具又多一个选择，建议跟你现有的 coding agent 跑个对比。(784 likes | 75 RTs) 详情 →

Google 和 HuggingFace 联合发起 Fast Gemma Challenge — Agent 协作优化 Agent。 一种新颖的挑战赛形式：不是人类比跑分，而是几十个 Agent 协作优化 DiffusionGemma 的推理速度。"Agent 优化 Agent"的元游戏 — 关注它产出的优化技巧，可能比关注比赛本身更有价值。(1,177 likes | 112 RTs) 详情 →

🎓 模型小课堂

扩散式文本生成（Parallel Block Decoding）：你用过的每一个聊天 AI — ChatGPT、Claude、Gemini — 都是一个字一个字往外蹦的（自回归解码）。这就像打字员一个键一个键地敲。扩散式文本生成反过来：先生成一整块"模糊"的文本，然后像照片从模糊变清晰一样，逐步精炼成最终结果。DiffusionGemma 今天宣称的 4 倍加速就来自这个思路 — 因为是并行处理一整块而不是串行处理每个 token。这项技术原本是为图像生成发明的（Stable Diffusion 就是扩散模型），现在被 Google 搬到了文本领域。目前还是实验阶段，质量和自回归模型有差距，但如果持续进步，可能从根本上改变 LLM 的推理经济学。

⚡ 快讯

Claude Code v2.1.172：子 Agent 嵌套深度增至 5 层，支持 AWS 区域自动配置。链接
Anthropic 确认 Fable/Mythos 强制 30 天数据留存：无零留存选项，隐私敏感场景需注意。(113 likes | 49 RTs) 链接
Claude Desktop 每次启动开 1.8 GB Hyper-V 虚拟机：哪怕只是聊天也要跑 VM，Windows 用户资源占用感人。(321 likes | 228 RTs) 链接
Cohere North-Mini-Code-1.0：小型编码模型在 HuggingFace 持续涨粉。(153 likes | 1.8K downloads) 链接
Codex Mobile 大更新：分支管理、Worktree 支持、内联代码审查，手机上写代码越来越像回事了。(306 likes) 链接
TechDirt：把 AI 当裁员工具的 CEO 就是不称职：高赞反驳"AI 替代人力"叙事，值得转给管理层看。(360 likes | 143 RTs) 链接

🎯 今日精选

Fable 5 自己剪了自己的发布视频 — 当视频制作变成编程问题：一个 AI 模型自主编排转录、ffmpeg、调色、Figma 设计和 Remotion 渲染，从原始素材到成片，没有人类编辑碰过时间线。这不只是一个酷炫的 demo。当 AI 能自主调用一整条工具链完成创意工作时，"创意工具"的定义被悄悄重写了 — 视频制作从一个需要专业软件和专业技能的创作过程，变成了一个可以用代码描述和自动执行的工程问题。这对每一个媒体工作流都有深远影响：剪辑师不会消失，但"剪辑"这件事的门槛和方式正在根本性地改变。接下来值得关注的是质量天花板 — 目前 AI 能处理的是结构化的编辑任务，真正需要审美判断的创意决策还是人类的领地。详情 →

下期见 ✌️