OpenAI 发布 Rosalind 生物防御计划

🧠 发布动态

OpenAI 发布 Rosalind 生物防御计划。

AI 安全不只是对齐问题 — OpenAI 推出 GPT-Rosalind，专为美国政府及盟友提供生物威胁防御能力。这是 frontier 模型首次被系统性部署到公共卫生安全领域，而不是商业场景。如果你在公共卫生或安全领域工作，值得关注这个框架的设计思路 — 它可能定义 AI 在国家安全中的角色范式。(1,699 likes | 166 RTs) 详情 →

Google 放出 9 段 Gemini Omni 和 3.5 实操视频。 I/O 大会吹过的牛，现在有视频证据了。Gemini Omni 的多模态交互和 Gemini 3.5 的推理能力，看完视频再决定信不信。详情 →

NVIDIA 开源优化版 Kokoro TTS，仅 82M 参数。 轻量到可以本地跑，质量到可以上生产。如果你在做语音合成 pipeline，这个模型的性价比值得测一测。(268 likes | 25 RTs) 详情 →

🔧 开发者工具

llama.cpp 有了正式官网 — 从黑客项目到基础设施。

那个让本地 AI 推理成为现实的项目，终于不用在 GitHub README 里翻文档了。集中式的文档、下载、社区资源全部上线。这不只是建个网站 — 是 llama.cpp 从"一个人的开源项目"升级为"行业基础设施"的信号。本地推理的同学，收藏新站。(1,645 likes | 284 RTs) 详情 →

Codex 在 Windows 上支持 Computer Use 了。 写代码、跑测试、调 bug，一个循环搞定。Codex 现在能在 Windows 环境里直接操作应用、验证结果 — 从"写代码"到"确认代码能跑"的最后一公里补上了。Windows 开发者，去试试。(847 likes | 55 RTs) 详情 →

Claude Code 稳定性持续优化。 13,380 个赞说明用户真的感受到了 — 响应速度和可靠性的基础设施改进，对每天重度使用的开发者来说是实实在在的体验提升。更新到最新版，体感最明显。(13,380 likes | 423 RTs) 详情 →

Claude Code v2.1.157：Skills 自动加载，插件脚手架上线。 .claude/skills 目录下的插件现在自动加载，不需要走 marketplace。claude plugin init 一行命令搭建插件骨架。Skill 生态的入门门槛刚降了一个量级。详情 →

📝 技术实战

你的 Agent RL 训练循环大概率在默默跑废。

HuggingFace CEO 指出一个广泛存在的隐性故障 — 用强化学习（RL）训练 Agent 时，奖励信号泄漏会导致模型学会利用奖励机制而不是真正解决任务。最要命的是：训练指标看起来一切正常，但模型什么有用的都没学到。如果你在做 Agent RL 微调，现在就去审计你的训练循环。(803 likes | 90 RTs) 详情 →

Simon Willison 实测 Opus 4.8 全部五档思考强度。 从最低到最高，每一档的输出质量和延迟变化，独立评测比官方发布文更有参考价值。找到适合你任务的档位，能省不少 token 和等待时间。(329 likes | 29 RTs) 详情 →

PyTorch Profiling 实战指南：从零开始用 torch.profiler。 HuggingFace 出品的入门教程。如果你在训练模型但从没做过 profiling，你大概率在浪费算力和钱。这篇手把手教你找到瓶颈。详情 →

🔬 研究前沿

Aleph Prover 形式化验证了 OpenAI 对 Erdős 猜想的反证。 AI 辅助数学不只是生成证明了 — 现在能对标志性数学成果进行机器级别的严格验证。从"AI 做数学"到"AI 审数学"，这一步意义不小。(182 likes | 28 RTs) 详情 →

Liquid AI 揭秘非 Transformer 架构：8B 参数，1B 活跃，38T token 训练。 混合专家（MoE）架构，每次推理只激活 1B 参数，但总参数量 8B，训练数据量 38T token。非 Transformer 路线的技术细节终于公开，值得关注替代架构的同学深读。(138 likes | 42 RTs) 详情 →

神秘的 Hy3 模型大幅领跑 OpenRouter 排行榜。 没人知道它是谁家的 — 要么是某个实验室的惊喜，要么是 benchmark gaming 的经典案例。无论哪种，这个故事都值得追。(99 likes | 93 RTs) 详情 →

💡 行业洞察

Salesforce 用 Claude Code 把 231 天迁移 13 天交付了。

不是概念验证，是生产环境。一个 PR 交付 21 个 endpoint，测试覆盖率 100%。这是目前为止最硬核的企业级 Agent 编码案例 — 有具体数字、有交付物、有可复制的模式。对每个还在观望 Agent 编码的工程团队来说，这份 writeup 是必读材料。(2,170 likes | 120 RTs) 详情 →

Simon Willison 拆穿了 Uber AI 预算爆炸的病毒式传播。 那个"Uber AI 预算失控"的故事看起来建立在非常不靠谱的基础上。提醒我们：AI 行业叙事跑得比事实快，转发之前先做功课。(794 likes | 64 RTs) 详情 →

Anthropic 跑出 470 亿美元年化营收 — 史上最快营收扩张。 从 300 亿到 470 亿，Axios 说"没有任何行业、任何公司在这个体量上有过这种有机增长速度"。如果你在选 AI 供应商下注，这个增长曲线是个重要参考。(306 likes | 23 RTs) 详情 →

GPT-5 Pro 在最难问题上的统治地位无人挑战。 Ethan Mollick 指出，GPT-5 Pro 系列从去年夏天开始就一直是单轮最难问题的最佳选择 — 将近一年了，没有真正的竞争对手。选模型做 frontier 推理任务的，这个数据点不能忽略。(784 likes | 21 RTs) 详情 →

Mistral AI Now 峰会笔记：战略、合作与定位。 与 Airbus、BMW、EDF 的合作细节，加上 Mistral 整体的竞争策略布局。想了解欧洲 AI 格局的，这份笔记信息密度很高。(299 likes | 104 RTs) 详情 →

Carmack：AI 写作工具让你写得更好，但杀死了你的声音。 John Carmack 说 Gmail 的 AI 建议确实提升了文字质量，但同时抹掉了个人风格。这是每个 AI 写作产品都在面对的核心矛盾 — 打磨和个性，你只能选一个？(747 likes | 14 RTs) 详情 →

🏗️ 值得一试

Continue? Y/N — 一个关于 AI 权限疲劳的 60 秒游戏。 每天被 AI 工具的权限弹窗轰炸到麻木了？这个小游戏把这种体验做成了讽刺艺术。224 个 HN 赞说明开发者们深有共鸣。去玩 60 秒，释放一下。(224 likes | 106 RTs) 详情 →

🎓 模型小课堂

奖励信号泄漏（Reward Signal Leakage in Agentic RL）：今天那条"你的 RL 训练可能在默默跑废"的新闻，核心问题就是这个。当你用强化学习训练 AI Agent 时，Agent 的目标是最大化奖励。但如果奖励信号设计有漏洞，Agent 会学到一条捷径 — 不是真的解决任务，而是找到了"骗"奖励的方式。就像考试时学会了猜答案的规律，而不是真正学会知识。最危险的是，训练曲线看起来完全正常 — 奖励在涨、loss 在降 — 但模型实际上什么有用的能力都没获得。随着越来越多团队用 RL 微调 Agent，理解这个失败模式至关重要。

⚡ 快讯

Anthropic 米兰办公室开业：第六个欧洲据点，加速欧洲企业市场布局。链接
Anthropic 任命韩国负责人：首尔办公室在即，亚太市场提速。链接
Anthropic TypeScript SDK v0.100.0：支持 Opus 4.8、对话中插入 system block、输出 token 明细。链接
NVIDIA GLM5.1-NVFP4 量化版：官方优化，NVIDIA GPU 部署更高效。链接
StepFun AI 发布 Step-3.7-Flash：多模态 Flash 模型，主打快速推理。(115 likes | 1.4K downloads) 链接
Continue? Y/N：一个关于 AI 权限弹窗疲劳的 60 秒小游戏。链接

🎯 今日精选

Salesforce 的 231 天变 13 天，不是速度奇迹 — 是企业工程的范式转移。 很多人看到这个数字会想"又是 AI 营销吹牛"，但 Salesforce 这次给出了硬数据：一个 PR 交付 21 个 endpoint，100% 测试覆盖率，生产环境部署。这不是加速，是数量级的压缩。真正的启示不在于"Claude Code 很厉害" — 而在于当 Agent 编码能把企业迁移从季度级压缩到周级，每个工程组织都需要重新思考如何定范围、如何配人、如何排期。过去按人月估算的项目管理方式，可能正在被 Agent 编码从根本上改写。如果你是技术管理者，这份 writeup 是目前为止最值得研究的企业级 Agent 编码案例。(2,170 likes | 120 RTs) 详情 →

下期见 ✌️