NewsletterBlogLearnCompareTopicsGlossary
English
INSIGHTLAUNCHTOOLTECHNIQUERESEARCH

25 条资讯

Gemini 3.5 来了:Google 最强模型全面押注 Agent

🧠 发布动态

Gemini 3.5 来了:Google 最强模型全面押注 Agent。

Google I/O 的头号主角 — Gemini 3.5 Flash 被定位为 Agent 和编码场景的最强模型,直接对标 Claude 和 GPT 的开发者工作流。从跑分看,Flash 在代码生成和多步推理上都有明显提升。不过 Simon Willison 的独立分析指出,Flash 价格是上一代的 3 倍 — 虽然还是比 GPT-5.5 和 Opus 4.7 便宜,但"最便宜的选择"这个标签快保不住了。开发者该做的:先跑自己的 benchmark,别被发布会 PPT 带节奏。(823 likes) 详情 →

Gemini Omni:Google 第一个"什么都能生成"的模型。

这不是又一个图片生成器 — Gemini Omni 的设计目标是从任意输入创造任意输出,首发能力是视频生成。把 Gemini 的理解能力和生成式媒体系统合二为一,直接杀入多模态创作赛道。对内容创作者来说,这意味着"描述一个场景 → 直接出视频"的工作流离现实又近了一步。(6,246 likes | 879 RTs) 详情 →

Google I/O 2026 全家桶。 Gemini 3.5、Gemini Omni、Project Genie、Chrome DevTools Agent 模式、Workspace AI 升级……Google 今年把所有 AI 弹药一次性打光了。这是 Google 年度最大的 AI 产品发布,覆盖从模型到工具到消费级应用的全栈。建议花 10 分钟扫一遍完整列表,找到跟你相关的。 详情 →

Project Genie 把 Street View 变成了可交互的 3D 世界。 DeepMind 的世界模拟模型 Genie 接入了 Google Street View 数据,能把真实地点生成为可交互的 3D 环境。目前对 Google AI Ultra 订阅用户全球开放。技术上很酷,商业上还需要看落地场景 — 但如果你做虚拟场景、游戏或空间计算,值得关注。 详情 →

OpenAI 卖起了"算力期货"。 OpenAI 推出 Guaranteed Capacity — 企业客户可以预留计算资源,锁定未来的 GPU 容量。这是对限速投诉的直接回应,但更深层的信号是:AI 算力正在像云计算和能源一样变成一个有远期合约的大宗商品市场。如果你的业务依赖稳定的 API 吞吐量,值得评估。(1,701 likes | 133 RTs) 详情 →


🔧 开发者工具

Claude Agent 走出云端:自托管沙箱进入公测。

企业部署 AI Agent 最大的拦路虎一直是"数据不能出我的网络" — 现在这个问题解决了。Claude Managed Agents 新增自托管沙箱(公测)和 MCP 隧道(研究预览),前者让 Agent 跑在你自己的基础设施里,后者让 Agent 连接私有网络的 MCP 服务器而不暴露公网。对有合规要求的团队来说,这是从"能用"到"敢用"的临界点。(6,377 likes | 497 RTs) 详情 →

OpenAI 接入 Google 的 SynthID 水印。 竞争对手在 AI 图片溯源上选择了合作 — OpenAI 将在所有 AI 生成图片中加入 C2PA 内容凭证和 Google 的 SynthID 水印,并开放了公共验证工具。这是行业走向自律的积极信号,也意味着"AI 生成的图到底是不是 AI 生成的"这个问题有了跨平台的标准答案。(3,020 likes | 258 RTs) 详情 →

Chrome DevTools 加了 Agent 模式。 你的编码 Agent 现在可以直接操作浏览器了 — 用 DevTools 的能力测试代码、模拟用户行为、在部署前捕捉 bug。这补上了 Agent 驱动 Web 开发的一个关键缺口:之前 Agent 能写代码但看不到页面,现在它能"看"了。(55 likes | 8 RTs) 详情 →

Gemini for Science 上线。 Google 推出一套面向科研的 AI 专用工具,用 Gemini 的能力扩大科学探索的规模和精度。这不是通用模型加个科研提示词,而是专门为研究者构建的工具链。做学术或科研工程的可以关注。(823 likes | 143 RTs) 详情 →


🔬 研究前沿

DeepMind 的 AI 发现了逆转细胞衰老的基因开关。 这可能是今年最重磅的 AI for Science 成果 — DeepMind 的 Co-Scientist 工具帮助生物学家找到了能让人类细胞恢复年轻状态的新型遗传因子。注意,这不是跑分刷榜,而是实打实的生物学发现。AI 辅助科研正在从"概念验证"走向"真的发现了新东西"。 详情 →

Cloudflare 拿 50 个真实仓库压测 Anthropic 的 Mythos。 Cloudflare 安全团队花了数周时间,用自家真实代码库测试 Mythos 模型的安全审计能力 — 这是 Anthropic 之外第一次大规模独立实战验证。结果基本印证了上周 Anthropic 宣称的 11 倍漏洞发现率。等 Cloudflare 的完整报告出来再下结论,但初步数据很有说服力。(3,785 likes | 671 RTs) 详情 →

HuggingFace 发布 Carbon:比现有最快 DNA 模型还快 275 倍。 Carbon 快到可以高效处理完整的人类基因组。这种级别的加速不只是让现有流程变快 — 它让之前根本跑不动的基因组学应用变成了可能。生物信息学从业者值得第一时间试用。(768 likes | 121 RTs) 详情 →


💡 行业洞察

Karpathy 加入 Anthropic — 今年最大的人才地震。

Andrej Karpathy — 前 Tesla AI 负责人、OpenAI 创始团队成员、YouTube 上拥有数百万粉丝的 AI 教育者 — 官宣加入 Anthropic。这是 2026 年迄今为止最重大的人才流动。Karpathy 的选择本身就是一个信号:他见过 OpenAI 的内部、建过 Tesla 的自动驾驶,最终选了 Anthropic。接下来要看的是他在 Anthropic 做什么 — 基础研究、产品、还是新方向?(115,179 likes | 8,757 RTs) 详情 →

KPMG 把 Claude 部署给了 27.6 万员工。 这是目前公开的最大规模单公司 AI 部署之一。加上昨天 PwC 扩大合作的消息,Anthropic 正在锁定四大会计师事务所。模式很清楚:大企业不再"多供应商对冲",而是选一家 frontier 供应商深度绑定。(337 likes) 详情 →

Anthropic 收购 Stainless — 把开发者工具链收归自有。 Stainless 是 Anthropic SDK 和 MCP 服务器背后的公司,这次收购意味着 Anthropic 在纵向整合开发者接触面。跟 Mistral 收购 Emmi AI 的逻辑一样:光有好模型不够,要把从模型到 SDK 到工具链的整条路都控制住。(337 likes | 235 RTs) 详情 →

Mistral 收购 Emmi AI,欧洲 AI 整合加速。 Mistral 拿下 Emmi AI,目标是构建全栈 AI 平台而不只是做模型。跟 Anthropic 收购 Stainless 如出一辙的剧本 — 2026 年的 AI 公司都在从"模型供应商"变成"平台公司"。欧洲能不能跑出一个完整的 AI 平台,Mistral 是最值得观察的标的。(144 likes | 34 RTs) 详情 →

PwC 扩大 Claude 部署:交易、技术开发、企业运营全覆盖。 两天内,Anthropic 拿下了 KPMG 和 PwC 两家四大。PwC 的用例更具体 — 不只是"提效",而是用 Claude 来执行交易、构建技术方案、重塑企业职能。四大的选择往往是企业 AI 采购的风向标。 详情 →


📝 技术实战

HTML 作为 Claude Code 输出格式,效果好得不讲道理。 Anthropic 官方博客揭示了一个反直觉的发现:让 Claude Code 输出 HTML 而不是纯文本或 Markdown,在很多场景下效果显著提升。原因是 HTML 的结构化语义帮助模型更好地组织输出。实操建议:在你的 Agent 工作流里试一下,改动成本极低,收益可能很大。 详情 →

TLA+ 遇上 LLM:形式化验证进入 AI 编码时代。 一篇实用指南,教你用 AI 来写和验证 TLA+ 形式化规范。核心观点:当 AI 生成的代码越来越多,形式化验证变得更重要而不是更不重要 — 你需要数学级别的保证来兜底 AI 的"大概率正确"。做并发系统的开发者,试试让 Claude 帮你写 TLA+ spec。(103 likes | 25 RTs) 详情 →


🎓 模型小课堂

Multi-Token Prediction(MTP,多 Token 预测):传统的语言模型一次只预测下一个 token — 像打字一样一个字一个字蹦。MTP 让模型一次预测好几个 token,相当于"一目十行"。好处很直观:推理速度大幅提升,因为减少了串行计算的步数。今天 llama.cpp 给 Qwen3.6 加上 MTP 支持后速度明显起飞就是这个原理。关键是,MTP 在提速的同时基本不牺牲输出质量 — 所以当你看到本地模型跑分号称"快了 X 倍",先看看是不是用了 MTP,再决定要不要信。


⚡ 快讯

  • llama.cpp + Qwen3.6 MTP:Multi-Token Prediction 支持上线,本地推理速度显著提升。(1,160 likes | 178 RTs) 链接
  • Claude Code v2.1.145:新增 JSON 格式 session 列表、OTEL trace 改进、状态栏升级,脚本集成更方便了。 链接
  • HuggingFace Ettin Reranker:新的 reranker 模型家族,RAG 管道又多了一个选择。 链接
  • Simon Willison 分析 Gemini 3.5 Flash 定价:价格是上一代的 3 倍,但仍低于 GPT-5.5。 链接
  • ByteDance Lance:字节跳动的全模态生成模型,跟 Gemini Omni 同赛道竞争。(301 likes | 171 downloads) 链接
  • Google Antigravity 2.0:I/O 上发布的新产品,Gemini 生态扩展的一部分。 链接

🎯 今日精选

DeepMind 的细胞逆龄实验:AI for Science 从跑分走向真正的科学发现。 DeepMind 的 Co-Scientist 工具帮助生物学家发现了能逆转细胞衰老的新型遗传因子 — 这不是"AI 在某个 benchmark 上刷了新高分",而是 AI 真的帮人类找到了之前不知道的生物学机制。这个结果的意义远超单篇论文:它标志着 AI 辅助科研正式从"概念验证阶段"毕业,进入"产出真正科学发现"的新阶段。更深层的影响在于,这会改变我们评估和资助 AI 研究的方式 — 当 AI 能直接加速基础科学发现时,"AI 的价值"就不再只是商业效率,而是人类知识的边界扩展。 详情 →


下期见 ✌️