Claude Marketplace 上线:企业预算现在能买第三方 Claude 应用了
🧠 发布动态
Claude Marketplace 上线:企业预算现在能买第三方 Claude 应用了。
Anthropic 正式推出 Claude Marketplace — Augment、Bolt、CodeRabbit、Hebbia、Legora 首批入驻,企业客户可以用已有的 Anthropic 消费承诺直接购买这些第三方产品。这不只是个应用商店,而是一个生态锁定策略:用钱包绑定开发者和企业。对第三方开发者来说,接入 Marketplace 意味着直接触达 Anthropic 的企业客户池。(2,196 likes | 170 RTs) 详情 →
Gemini Embedding 2:一个模型搞定文本、图像和视频。
Google DeepMind 发布 Gemini Embedding 2 白皮书 — 原生多模态 Embedding 模型,文本、图像、视频统一到同一个向量空间。这直接改变了 RAG 和搜索的架构思路 — 以前你需要分别处理不同模态再做对齐,现在一个模型端到端搞定。做多模态检索的,赶紧去跑 benchmark。(955 likes | 145 RTs) 详情 →
RF-DETR 进入 HuggingFace Transformers,YOLO 遇到对手了。 实时目标检测和分割双 SOTA,直接在 Transformers 库里 pip install 就能用,可以作为 YOLO 的 drop-in 替代。做视觉的同学,该跑个对比了。(648 likes | 69 RTs) 详情 →
Android AppFunctions API:你的 App 现在就是 Gemini 的 MCP 服务器。 Google 发布 AppFunctions API — 一个 Jetpack 库,让任何 Android 应用变成设备端的 MCP 服务器,Gemini 和其他助手可以直接调用你 App 的功能。MCP 协议从云端走向了移动端原生。(33 likes) 详情 →
🔧 开发者工具
Claude Code 上线实时安全扫描器 — 几小时内 1.6 万点赞。
Anthropic 给 Claude Code 发布了 security-guidance 插件 — 写代码的同时实时扫描漏洞。不是事后扫描,是你敲代码的时候就在跑。1.6 万点赞说明开发者对 shift-left 安全的需求有多大。安装命令:/plugin install security-guidance。(15,995 likes | 1,482 RTs) 详情 →
OpenAI 支持通过出站 HTTPS 连接私有 MCP 服务器。 你的 MCP 服务器可以留在内网,只需出站连接就能对接 ChatGPT、Codex 和 Responses API。对安全要求高的团队来说,这解决了"用 MCP 就要暴露端口"的痛点。(1,614 likes | 123 RTs) 详情 →
Claude Code 可靠性和响应速度大升级。 一波基础设施优化 — 这种看不见的改进,每天用 Claude Code 的人体感最明显。更新就完事了。(6,601 likes | 183 RTs) 详情 →
Claude Code v2.1.152:/code-review --fix 直接把审查结果改到你的代码里。 新版还加了 disallowed-tools skill 配置和 /reload-skills。但 --fix 才是重点 — 代码审查从"看到问题"变成"看到并修好问题",工作流直接缩短一步。详情 →
📝 技术实战
用大语言模型(LLM)找你代码里的漏洞 — 在攻击者之前。 Anthropic 发布实战指南,教你怎么把 LLM 集成到安全审计流程中。不是"用 AI 扫一下"的泛泛之谈,而是具体的 CI 集成模式和提示词策略。配合昨天的容器化架构帖,Anthropic 这是在系统性地输出安全方法论。详情 →
AI Agent 的零信任架构(Zero Trust):信任边界和凭证管理。 Anthropic 的安全三连第二篇 — 把零信任原则应用到 Agent 系统上。核心论点:Agent 拥有的每一个权限都应该被显式授予、持续验证、最小化范围。如果你在部署能调用工具的 Agent,这篇是必读。详情 →
Delta Weight Sync:训练万亿参数模型不再需要传输万亿参数。 HuggingFace 在 TRL 中引入 delta weight sync — 训练过程中只同步权重变化量,不传完整 checkpoint。存储和带宽成本大幅下降。做大规模训练的团队,升级 TRL 就能用。详情 →
🔬 研究前沿
扩散模型启发的训练方法:把神经网络拆成独立训练的块。
David Ha 分享了一种新训练方法 — 把前向传播当作扩散去噪过程,将网络拆分成可以独立训练的模块。如果这个方法能规模化,它可能打破当前训练基础设施的显存墙。(2,429 likes | 298 RTs) 详情 →
BadHost CVE-2026-48710:临床试验数据库和 MCP 服务器在裸奔。 研究人员扫描公网,发现大量基于 FastAPI/Starlette 的服务 — 包括临床试验数据库、邮箱、MCP 服务器、PII 接口 — 零认证就能访问。整个基于 FastAPI 的 AI 基础设施栈都受影响。立刻升级到 Starlette 0.46.2+,然后审计你的所有部署。(39 likes | 14 RTs) 详情 →
ESMFold2:单序列预测蛋白质结构,不需要多序列比对(MSA)。 Yann LeCun 转发 — ESMFold2 在单序列蛋白质结构预测上达到 SOTA。"苦涩的教训"(Bitter Lesson)再次验证:更多算力和数据胜过精心设计的进化特征。做计算生物学的同学,值得一试。(199 likes | 30 RTs) 详情 →
💡 行业洞察
OpenAI 6 月 2 日下线 GPT-5.2 和 GPT-5.3-Codex — 还剩 5 天。 OpenAI 精简算力集群,Codex 平台上的这两个模型即将停用。如果你的工作流锁定了这些模型,现在就迁移,别等到 6 月 2 号早上发现跑不动了。(3,709 likes | 111 RTs) 详情 →
SynthID 水印突破 1000 亿次,OpenAI 和 ElevenLabs 加入。 Google DeepMind 的 SynthID 已经给超过 1000 亿条内容打了水印,现在 OpenAI、ElevenLabs、Kakao 都在采用。AI 内容水印正在从"单一公司方案"变成行业标准。如果你的内容管线涉及 AI 生成,该考虑接入了。(1,054 likes | 108 RTs) 详情 →
Simon Willison:Anthropic 和 OpenAI 已经跨过产品市场契合线。 核心论点 — Token 经济已经从"实验预算"变成"必要开支"。这不是观点,而是财务事实。对从业者来说,这意味着 AI 工具链不再是可选项,而是基础设施。(590 likes | 719 RTs) 详情 →
Code w/ Claude 伦敦站:团队正在围绕 AI Agent 重构工作流。 Anthropic 伦敦开发者活动回顾 — 主题不是"AI 能干什么",而是"团队怎么重新组织才能用好 AI"。信号很明确:Anthropic 认为开发者体验的下一步是组织变革,不只是工具升级。详情 →
🏗️ 值得一试
CodeRabbit 的 Claude 多 Agent 编排系统:一个生产级案例。 CodeRabbit 详细分享了他们如何基于 Claude 构建多 Agent 编排层 — 这家公司处理数百万次代码审查,不是 demo 级别的架构。想做多 Agent 系统的,这是目前最好的生产级参考之一。详情 →
自我改进的税务 Agent:当审核员纠错,Codex 追踪并改进。 OpenAI 与 Thrive Holdings 合作构建的税务 Agent — 人工审核员修正错误后,Codex 自动追踪失败链路并优化自身工作流。这里的关键不是"税务",而是这个自我改进的反馈循环模式,可以迁移到任何需要人工审核的 Agent 场景。(808 likes | 67 RTs) 详情 →
🎓 模型小课堂
AI Agent 的零信任架构(Zero Trust Architecture):传统安全思路是"城墙" — 网络边界内的都可以信任。零信任的核心是三个字:不信任。每个请求都要验证身份,每个权限都给最小范围,时刻假设已经被入侵。今天的 Newsletter 完美诠释了为什么这很重要 — Anthropic 发布了 Agent 零信任框架,而 CVE-2026-48710 证明了"边界防护"对 AI 基础设施已经失效。你的 FastAPI 服务器、vLLM 实例、MCP 服务器,如果还在靠"内网所以安全"这个假设运行,今天就该改了。
⚡ 快讯
- DuckDuckGo:Google 推广 AI Mode 后,DuckDuckGo 无 AI 搜索流量暴涨 28%。用脚投票最诚实。(627 likes | 314 RTs) 链接
- OpenAI Foundation:Sam Altman 宣布投入 2.5 亿美元研究 AI 对生活质量的影响。钱到位了,就看怎么花。(3,098 likes | 245 RTs) 链接
- Inside the Transformer:一篇追踪 Token 在 Transformer 中完整生命周期的深度文章,今年最好的单篇 Transformer 科普。(893 likes | 127 RTs) 链接
- ITBench-AA:IBM 发布企业 IT Agent 基准测试,前沿模型得分不到 50%。自动化运维的现实 vs 营销,差距还很大。链接
🎯 今日精选
CVE-2026-48710 是 AI 基础设施安全的当头棒喝:我们在争论 AI 对齐的理论风险时,跑在生产环境中的 AI 基础设施 — FastAPI、vLLM、LiteLLM、MCP 服务器 — 正以零认证的状态暴露在公网上。研究人员扫出了裸奔的临床试验数据库和邮箱系统,这不是假设场景,而是正在发生的事情。有意思的是时间线:Anthropic 同一天密集发布安全扫描器、LLM 代码审计指南、Agent 零信任框架 — 三篇安全内容在一天内出齐,读起来像是他们已经知道了什么。不管是不是巧合,结论很清楚:如果你在部署任何基于 FastAPI/Starlette 的 AI 服务,今天就升级到 Starlette 0.46.2+,然后认真审视你的每一个暴露端口。理论对齐可以慢慢聊,端口认证等不了。详情 →
下期见 ✌️