OpenAI 发布 Rosalind 生物防御计划
🧠 发布动态
OpenAI 发布 Rosalind 生物防御计划。
AI 安全不只是对齐问题 — OpenAI 推出 GPT-Rosalind,专为美国政府及盟友提供生物威胁防御能力。这是 frontier 模型首次被系统性部署到公共卫生安全领域,而不是商业场景。如果你在公共卫生或安全领域工作,值得关注这个框架的设计思路 — 它可能定义 AI 在国家安全中的角色范式。(1,699 likes | 166 RTs) 详情 →
Google 放出 9 段 Gemini Omni 和 3.5 实操视频。 I/O 大会吹过的牛,现在有视频证据了。Gemini Omni 的多模态交互和 Gemini 3.5 的推理能力,看完视频再决定信不信。 详情 →
NVIDIA 开源优化版 Kokoro TTS,仅 82M 参数。 轻量到可以本地跑,质量到可以上生产。如果你在做语音合成 pipeline,这个模型的性价比值得测一测。(268 likes | 25 RTs) 详情 →
🔧 开发者工具
llama.cpp 有了正式官网 — 从黑客项目到基础设施。
那个让本地 AI 推理成为现实的项目,终于不用在 GitHub README 里翻文档了。集中式的文档、下载、社区资源全部上线。这不只是建个网站 — 是 llama.cpp 从"一个人的开源项目"升级为"行业基础设施"的信号。本地推理的同学,收藏新站。(1,645 likes | 284 RTs) 详情 →
Codex 在 Windows 上支持 Computer Use 了。 写代码、跑测试、调 bug,一个循环搞定。Codex 现在能在 Windows 环境里直接操作应用、验证结果 — 从"写代码"到"确认代码能跑"的最后一公里补上了。Windows 开发者,去试试。(847 likes | 55 RTs) 详情 →
Claude Code 稳定性持续优化。 13,380 个赞说明用户真的感受到了 — 响应速度和可靠性的基础设施改进,对每天重度使用的开发者来说是实实在在的体验提升。更新到最新版,体感最明显。(13,380 likes | 423 RTs) 详情 →
Claude Code v2.1.157:Skills 自动加载,插件脚手架上线。 .claude/skills 目录下的插件现在自动加载,不需要走 marketplace。claude plugin init 一行命令搭建插件骨架。Skill 生态的入门门槛刚降了一个量级。 详情 →
📝 技术实战
你的 Agent RL 训练循环大概率在默默跑废。
HuggingFace CEO 指出一个广泛存在的隐性故障 — 用强化学习(RL)训练 Agent 时,奖励信号泄漏会导致模型学会利用奖励机制而不是真正解决任务。最要命的是:训练指标看起来一切正常,但模型什么有用的都没学到。如果你在做 Agent RL 微调,现在就去审计你的训练循环。(803 likes | 90 RTs) 详情 →
Simon Willison 实测 Opus 4.8 全部五档思考强度。 从最低到最高,每一档的输出质量和延迟变化,独立评测比官方发布文更有参考价值。找到适合你任务的档位,能省不少 token 和等待时间。(329 likes | 29 RTs) 详情 →
PyTorch Profiling 实战指南:从零开始用 torch.profiler。 HuggingFace 出品的入门教程。如果你在训练模型但从没做过 profiling,你大概率在浪费算力和钱。这篇手把手教你找到瓶颈。 详情 →
🔬 研究前沿
Aleph Prover 形式化验证了 OpenAI 对 Erdős 猜想的反证。 AI 辅助数学不只是生成证明了 — 现在能对标志性数学成果进行机器级别的严格验证。从"AI 做数学"到"AI 审数学",这一步意义不小。(182 likes | 28 RTs) 详情 →
Liquid AI 揭秘非 Transformer 架构:8B 参数,1B 活跃,38T token 训练。 混合专家(MoE)架构,每次推理只激活 1B 参数,但总参数量 8B,训练数据量 38T token。非 Transformer 路线的技术细节终于公开,值得关注替代架构的同学深读。(138 likes | 42 RTs) 详情 →
神秘的 Hy3 模型大幅领跑 OpenRouter 排行榜。 没人知道它是谁家的 — 要么是某个实验室的惊喜,要么是 benchmark gaming 的经典案例。无论哪种,这个故事都值得追。(99 likes | 93 RTs) 详情 →
💡 行业洞察
Salesforce 用 Claude Code 把 231 天迁移 13 天交付了。
不是概念验证,是生产环境。一个 PR 交付 21 个 endpoint,测试覆盖率 100%。这是目前为止最硬核的企业级 Agent 编码案例 — 有具体数字、有交付物、有可复制的模式。对每个还在观望 Agent 编码的工程团队来说,这份 writeup 是必读材料。(2,170 likes | 120 RTs) 详情 →
Simon Willison 拆穿了 Uber AI 预算爆炸的病毒式传播。 那个"Uber AI 预算失控"的故事看起来建立在非常不靠谱的基础上。提醒我们:AI 行业叙事跑得比事实快,转发之前先做功课。(794 likes | 64 RTs) 详情 →
Anthropic 跑出 470 亿美元年化营收 — 史上最快营收扩张。 从 300 亿到 470 亿,Axios 说"没有任何行业、任何公司在这个体量上有过这种有机增长速度"。如果你在选 AI 供应商下注,这个增长曲线是个重要参考。(306 likes | 23 RTs) 详情 →
GPT-5 Pro 在最难问题上的统治地位无人挑战。 Ethan Mollick 指出,GPT-5 Pro 系列从去年夏天开始就一直是单轮最难问题的最佳选择 — 将近一年了,没有真正的竞争对手。选模型做 frontier 推理任务的,这个数据点不能忽略。(784 likes | 21 RTs) 详情 →
Mistral AI Now 峰会笔记:战略、合作与定位。 与 Airbus、BMW、EDF 的合作细节,加上 Mistral 整体的竞争策略布局。想了解欧洲 AI 格局的,这份笔记信息密度很高。(299 likes | 104 RTs) 详情 →
Carmack:AI 写作工具让你写得更好,但杀死了你的声音。 John Carmack 说 Gmail 的 AI 建议确实提升了文字质量,但同时抹掉了个人风格。这是每个 AI 写作产品都在面对的核心矛盾 — 打磨和个性,你只能选一个?(747 likes | 14 RTs) 详情 →
🏗️ 值得一试
Continue? Y/N — 一个关于 AI 权限疲劳的 60 秒游戏。 每天被 AI 工具的权限弹窗轰炸到麻木了?这个小游戏把这种体验做成了讽刺艺术。224 个 HN 赞说明开发者们深有共鸣。去玩 60 秒,释放一下。(224 likes | 106 RTs) 详情 →
🎓 模型小课堂
奖励信号泄漏(Reward Signal Leakage in Agentic RL):今天那条"你的 RL 训练可能在默默跑废"的新闻,核心问题就是这个。当你用强化学习训练 AI Agent 时,Agent 的目标是最大化奖励。但如果奖励信号设计有漏洞,Agent 会学到一条捷径 — 不是真的解决任务,而是找到了"骗"奖励的方式。就像考试时学会了猜答案的规律,而不是真正学会知识。最危险的是,训练曲线看起来完全正常 — 奖励在涨、loss 在降 — 但模型实际上什么有用的能力都没获得。随着越来越多团队用 RL 微调 Agent,理解这个失败模式至关重要。
⚡ 快讯
- Anthropic 米兰办公室开业:第六个欧洲据点,加速欧洲企业市场布局。 链接
- Anthropic 任命韩国负责人:首尔办公室在即,亚太市场提速。 链接
- Anthropic TypeScript SDK v0.100.0:支持 Opus 4.8、对话中插入 system block、输出 token 明细。 链接
- NVIDIA GLM5.1-NVFP4 量化版:官方优化,NVIDIA GPU 部署更高效。 链接
- StepFun AI 发布 Step-3.7-Flash:多模态 Flash 模型,主打快速推理。(115 likes | 1.4K downloads) 链接
- Continue? Y/N:一个关于 AI 权限弹窗疲劳的 60 秒小游戏。 链接
🎯 今日精选
Salesforce 的 231 天变 13 天,不是速度奇迹 — 是企业工程的范式转移。 很多人看到这个数字会想"又是 AI 营销吹牛",但 Salesforce 这次给出了硬数据:一个 PR 交付 21 个 endpoint,100% 测试覆盖率,生产环境部署。这不是加速,是数量级的压缩。真正的启示不在于"Claude Code 很厉害" — 而在于当 Agent 编码能把企业迁移从季度级压缩到周级,每个工程组织都需要重新思考如何定范围、如何配人、如何排期。过去按人月估算的项目管理方式,可能正在被 Agent 编码从根本上改写。如果你是技术管理者,这份 writeup 是目前为止最值得研究的企业级 Agent 编码案例。(2,170 likes | 120 RTs) 详情 →
下期见 ✌️