Anthropic 秘密递交 S-1 — IPO 时钟启动

💡 行业洞察

Anthropic 秘密递交 S-1 — IPO 时钟启动。

这是自 OpenAI 架构重组以来 AI 行业最重大的公司里程碑。Anthropic 向 SEC 提交了保密版 S-1 注册声明，意味着 IPO 进入实质准备阶段。这一举动释放的信号很明确：Anthropic 对自己的营收轨迹和市场地位有足够信心。对开发者来说，一个上市的 Anthropic 意味着更稳定的 API 供应和更激进的产品投入 — 但也意味着更大的商业化压力。(17,361 likes | 1,941 RTs) 详情 →

黑客靠"好好说话"就从 Meta AI 手里拿到了 Instagram 账号。

不需要漏洞利用，不需要零日攻击 — 攻击者只是用有说服力的 prompt 跟 Meta 的 AI 客服"聊了聊"，就拿到了高知名度 Instagram 账号的访问权限。这是迄今为止 AI Agent 作为生产环境攻击面最具体的案例。如果你的产品有 AI 驱动的客服流程，今天就该做一次安全审计。(87 likes | 12 RTs) 详情 →

开源和闭源模型正在不同的指数曲线上增长。 Interconnects 的深度分析指出，开源和闭源模型的扩展逻辑根本不同 — 一边是边际智能提升驱动价值，另一边是"够用就好"。如果你还在用同一个框架评估 Llama 和 GPT-5.5 的竞争力，这篇文章会刷新你的认知。详情 →

佛罗里达州起诉 OpenAI 和 Sam Altman。 州级政府对 AI 安全风险的诉讼 — 这不是又一封公开信，而是有法律约束力的行动。可能为美国各州独立于联邦进行 AI 监管开创先例。(168 likes | 156 RTs) 详情 →

🧠 发布动态

OpenAI 模型和 Codex 在 AWS 上正式 GA。

OpenAI 全系列模型包括 Codex 现在可以通过 Amazon Bedrock 直接使用 — 企业用户能在 AWS 的安全、合规和治理框架内调用 OpenAI。这是 OpenAI 分发能力的重大扩张，也意味着云厂商争夺模型托管的战争进入白热化。如果你的基础设施在 AWS 上，今天就能无缝切换。(2,257 likes | 228 RTs) 详情 →

NVIDIA 发布 Cosmos 3 — 物理 AI 的完全开源全模态模型。

NVIDIA 开源了 Cosmos 3，首个原生支持视频理解、图像生成和机器人动作的全模态模型。在 OpenAI 昨天刚宣布机器人方向之后，这是开源社区的直接回应。模型已上架 HuggingFace，权重完全开放。(2,298 likes | 347 RTs) 详情 →

JetBrains 发布 Mellum2：为 IDE 而生的 12B MoE 模型。 IDE 厂商开始造自己的大脑了。Mellum2 专为代码理解和 IDE 集成优化，12B 参数 MoE 架构，预计在 Kotlin/Java 工具链上的表现会比通用模型强一截。详情 →

OpenAI 演示语音优先的 Agentic 手机 OS。 用户说话，Agent 回应，Agent 跨应用执行操作。这是 OpenAI 要做 OS 级 AI 层的最清晰信号 — 不是 App，是操作系统。(624 likes | 47 RTs) 详情 →

🔧 开发者工具

Anthropic 重置所有 Pro 和 Max 用户的速率限制：如果你最近被 Claude Code 限速卡住了，现在可以回来了。Anthropic 修复了导致部分用户提前触发限制的 bug，并重置了所有 5 小时和周限额。(14,250 likes | 696 RTs) 详情 →

Codex Python SDK 把 Codex 变成了可编程积木：现在你可以在 Python 里直接嵌入 Codex — 启动线程、运行对话、流式进度、恢复会话、传图片、控制沙箱。pip install openai-codex 就行。(255 likes | 23 RTs) 详情 →

OpenAI Python SDK v2.40.0 原生支持 Bedrock Responses：配合今天 OpenAI 上 AWS 的消息，Python 和 Node SDK 都已经支持 Amazon Bedrock Responses — 开发者可以立即用熟悉的 SDK 调用 Bedrock 上的 OpenAI 模型。详情 →

📝 技术实战

Google 详解如何用 Gemini 打造 I/O 2026：从内容创作到技术 Demo，Google 团队公开了 Gemini 在内部大规模"吃自己的狗粮"的全过程。这类一手的内部 AI 采纳实录非常稀缺，值得所有在推动组织内 AI 落地的人细读。详情 →

斯坦福 CS336 发布官方 CLAUDE.md 使用规范：学生使用 AI 编码 Agent 做作业的规则 — 什么能做、什么不能做、如何引用 AI 辅助、学术诚信红线。这基本上是高校 AI 使用政策的模板，其他大学很快会跟进。(298 likes | 108 RTs) 详情 →

🔬 研究前沿

Qwen3.5 用 Agentic RL 训练后工具使用能力追平 GPT-5.5。 在长周期 MCP 服务器环境上做 Agentic RL 后训练，Qwen3.5-122B 的工具调用能力达到了 GPT-5.5 水平 — 更关键的是，这些能力可以迁移到未见过的基准测试上。证据表明：在真实工具环境上做 RL 教会的是通用能力，不只是刷分技巧。(10 likes | 2 RTs) 详情 →

为什么视频 Agent 模型是下一个前沿 — xAI Grok Imagine 内幕。 Latent Space 深度对话 xAI Grok Imagine 负责人 — 3 个月从零到产品。覆盖视频生成 vs 世界模型、为什么视频 Agent 是下一站、Grok Imagine 被低估的原因。来自 xAI 内部的第一手技术洞察。详情 →

IBM Research：企业 AI 的瓶颈不是模型能力，而是 Agent 逻辑。 编排、记忆、决策层 — 这些才是阻碍企业 AI 规模化的真正卡点。IBM 提出了一个框架来思考"到底缺什么"，对正在做企业 Agent 架构的团队很有参考价值。详情 →

🏗️ 值得一试

LangGraph 1.2.3：v3 streaming + 命名子 Agent。 多 Agent 编排现在更可观测、更好调试了。RemoteGraph 支持 v3 streaming，新增的命名工具分发子 Agent 让复杂 Agent 系统的日志终于能看懂了。做 Agent 系统的今天就该升级。详情 →

ai-rules-sync：一个配置文件统治所有 AI 编码工具。 在 CLAUDE.md、.cursorrules、Copilot、Windsurf、Cline、Aider、Gemini 之间自动转换和同步 Agent 配置。零依赖。如果你同时用多个 AI 编码工具，这个能帮你省掉维护多份配置的痛苦。(53 likes) 详情 →

🎓 模型小课堂

Prompt Injection vs. Social Engineering（提示注入与社会工程）：今天 Meta AI 被黑和 Claude Code 供应链攻击这两条新闻，根源是同一个问题：AI 系统分不清"可信指令"和"恶意输入"。提示注入（Prompt Injection）是直接在输入中塞入指令覆盖系统提示词；间接注入是通过外部数据源（网页、文件）植入指令；而针对 AI Agent 的社会工程则是利用 Agent 的"乐于助人"特性，用自然语言说服它做不该做的事。随着 Agent 获得越来越多的真实权限（发邮件、改账号、执行代码），理解这三者的区别不再是安全研究者的事 — 每个部署 AI Agent 的团队都必须搞清楚。

⚡ 快讯

Claude Code 供应链攻击：恶意代码藏在 SessionStart hooks 和 VS Code tasks 里，针对 AI 编码工具的供应链攻击正在变多。检查你的 .claude/ 和 .vscode/ 配置。(87 likes | 12 RTs) 链接
从本地 AI 之梦到 PewDiePie 发布 vibecoded AI 套件：swyx 复盘了 16 个月内"AI 研究愿景"到"任何人都能发布"之间的鸿沟是如何消失的。(257 likes | 13 RTs) 链接
Mollick：AI 有没有用的辩论结束了：企业领导层已经确认 AI 有真实价值，问题从"能不能用"变成了"怎么从个人用到组织级规模化"。(339 likes | 31 RTs) 链接

🎯 今日精选

当你的 AI 客服本身就是安全漏洞时，传统威胁模型就失效了：Meta AI 被社工这件事之所以重要，不是因为 Instagram 账号被盗 — 而是因为它暴露了一个结构性问题：每家急着部署客户面向 AI Agent 的公司，都刚刚看到了"当攻击面变成一段对话"时会发生什么。传统安全模型假设攻击者需要技术手段突破边界，但 AI Agent 的边界就是自然语言 — 而自然语言没有防火墙。更危险的是，这类攻击几乎不留传统日志痕迹，因为从系统角度看一切操作都是"合法的"。如果你正在部署有真实权限的 AI Agent（改账号、发邮件、处理退款），今天就该重新审视你的权限模型和人工审核环节。详情 →

下期见 ✌️