Anthropic 秘密递交 S-1 — IPO 时钟启动
💡 行业洞察
Anthropic 秘密递交 S-1 — IPO 时钟启动。
这是自 OpenAI 架构重组以来 AI 行业最重大的公司里程碑。Anthropic 向 SEC 提交了保密版 S-1 注册声明,意味着 IPO 进入实质准备阶段。这一举动释放的信号很明确:Anthropic 对自己的营收轨迹和市场地位有足够信心。对开发者来说,一个上市的 Anthropic 意味着更稳定的 API 供应和更激进的产品投入 — 但也意味着更大的商业化压力。(17,361 likes | 1,941 RTs) 详情 →
黑客靠"好好说话"就从 Meta AI 手里拿到了 Instagram 账号。
不需要漏洞利用,不需要零日攻击 — 攻击者只是用有说服力的 prompt 跟 Meta 的 AI 客服"聊了聊",就拿到了高知名度 Instagram 账号的访问权限。这是迄今为止 AI Agent 作为生产环境攻击面最具体的案例。如果你的产品有 AI 驱动的客服流程,今天就该做一次安全审计。(87 likes | 12 RTs) 详情 →
开源和闭源模型正在不同的指数曲线上增长。 Interconnects 的深度分析指出,开源和闭源模型的扩展逻辑根本不同 — 一边是边际智能提升驱动价值,另一边是"够用就好"。如果你还在用同一个框架评估 Llama 和 GPT-5.5 的竞争力,这篇文章会刷新你的认知。 详情 →
佛罗里达州起诉 OpenAI 和 Sam Altman。 州级政府对 AI 安全风险的诉讼 — 这不是又一封公开信,而是有法律约束力的行动。可能为美国各州独立于联邦进行 AI 监管开创先例。(168 likes | 156 RTs) 详情 →
🧠 发布动态
OpenAI 模型和 Codex 在 AWS 上正式 GA。
OpenAI 全系列模型包括 Codex 现在可以通过 Amazon Bedrock 直接使用 — 企业用户能在 AWS 的安全、合规和治理框架内调用 OpenAI。这是 OpenAI 分发能力的重大扩张,也意味着云厂商争夺模型托管的战争进入白热化。如果你的基础设施在 AWS 上,今天就能无缝切换。(2,257 likes | 228 RTs) 详情 →
NVIDIA 发布 Cosmos 3 — 物理 AI 的完全开源全模态模型。
NVIDIA 开源了 Cosmos 3,首个原生支持视频理解、图像生成和机器人动作的全模态模型。在 OpenAI 昨天刚宣布机器人方向之后,这是开源社区的直接回应。模型已上架 HuggingFace,权重完全开放。(2,298 likes | 347 RTs) 详情 →
JetBrains 发布 Mellum2:为 IDE 而生的 12B MoE 模型。 IDE 厂商开始造自己的大脑了。Mellum2 专为代码理解和 IDE 集成优化,12B 参数 MoE 架构,预计在 Kotlin/Java 工具链上的表现会比通用模型强一截。 详情 →
OpenAI 演示语音优先的 Agentic 手机 OS。 用户说话,Agent 回应,Agent 跨应用执行操作。这是 OpenAI 要做 OS 级 AI 层的最清晰信号 — 不是 App,是操作系统。(624 likes | 47 RTs) 详情 →
🔧 开发者工具
Anthropic 重置所有 Pro 和 Max 用户的速率限制:如果你最近被 Claude Code 限速卡住了,现在可以回来了。Anthropic 修复了导致部分用户提前触发限制的 bug,并重置了所有 5 小时和周限额。(14,250 likes | 696 RTs) 详情 →
Codex Python SDK 把 Codex 变成了可编程积木:现在你可以在 Python 里直接嵌入 Codex — 启动线程、运行对话、流式进度、恢复会话、传图片、控制沙箱。pip install openai-codex 就行。(255 likes | 23 RTs) 详情 →
OpenAI Python SDK v2.40.0 原生支持 Bedrock Responses:配合今天 OpenAI 上 AWS 的消息,Python 和 Node SDK 都已经支持 Amazon Bedrock Responses — 开发者可以立即用熟悉的 SDK 调用 Bedrock 上的 OpenAI 模型。 详情 →
📝 技术实战
Google 详解如何用 Gemini 打造 I/O 2026:从内容创作到技术 Demo,Google 团队公开了 Gemini 在内部大规模"吃自己的狗粮"的全过程。这类一手的内部 AI 采纳实录非常稀缺,值得所有在推动组织内 AI 落地的人细读。 详情 →
斯坦福 CS336 发布官方 CLAUDE.md 使用规范:学生使用 AI 编码 Agent 做作业的规则 — 什么能做、什么不能做、如何引用 AI 辅助、学术诚信红线。这基本上是高校 AI 使用政策的模板,其他大学很快会跟进。(298 likes | 108 RTs) 详情 →
🔬 研究前沿
Qwen3.5 用 Agentic RL 训练后工具使用能力追平 GPT-5.5。 在长周期 MCP 服务器环境上做 Agentic RL 后训练,Qwen3.5-122B 的工具调用能力达到了 GPT-5.5 水平 — 更关键的是,这些能力可以迁移到未见过的基准测试上。证据表明:在真实工具环境上做 RL 教会的是通用能力,不只是刷分技巧。(10 likes | 2 RTs) 详情 →
为什么视频 Agent 模型是下一个前沿 — xAI Grok Imagine 内幕。 Latent Space 深度对话 xAI Grok Imagine 负责人 — 3 个月从零到产品。覆盖视频生成 vs 世界模型、为什么视频 Agent 是下一站、Grok Imagine 被低估的原因。来自 xAI 内部的第一手技术洞察。 详情 →
IBM Research:企业 AI 的瓶颈不是模型能力,而是 Agent 逻辑。 编排、记忆、决策层 — 这些才是阻碍企业 AI 规模化的真正卡点。IBM 提出了一个框架来思考"到底缺什么",对正在做企业 Agent 架构的团队很有参考价值。 详情 →
🏗️ 值得一试
LangGraph 1.2.3:v3 streaming + 命名子 Agent。 多 Agent 编排现在更可观测、更好调试了。RemoteGraph 支持 v3 streaming,新增的命名工具分发子 Agent 让复杂 Agent 系统的日志终于能看懂了。做 Agent 系统的今天就该升级。 详情 →
ai-rules-sync:一个配置文件统治所有 AI 编码工具。 在 CLAUDE.md、.cursorrules、Copilot、Windsurf、Cline、Aider、Gemini 之间自动转换和同步 Agent 配置。零依赖。如果你同时用多个 AI 编码工具,这个能帮你省掉维护多份配置的痛苦。(53 likes) 详情 →
🎓 模型小课堂
Prompt Injection vs. Social Engineering(提示注入与社会工程):今天 Meta AI 被黑和 Claude Code 供应链攻击这两条新闻,根源是同一个问题:AI 系统分不清"可信指令"和"恶意输入"。提示注入(Prompt Injection)是直接在输入中塞入指令覆盖系统提示词;间接注入是通过外部数据源(网页、文件)植入指令;而针对 AI Agent 的社会工程则是利用 Agent 的"乐于助人"特性,用自然语言说服它做不该做的事。随着 Agent 获得越来越多的真实权限(发邮件、改账号、执行代码),理解这三者的区别不再是安全研究者的事 — 每个部署 AI Agent 的团队都必须搞清楚。
⚡ 快讯
- Claude Code 供应链攻击:恶意代码藏在 SessionStart hooks 和 VS Code tasks 里,针对 AI 编码工具的供应链攻击正在变多。检查你的
.claude/和.vscode/配置。(87 likes | 12 RTs) 链接 - 从本地 AI 之梦到 PewDiePie 发布 vibecoded AI 套件:swyx 复盘了 16 个月内"AI 研究愿景"到"任何人都能发布"之间的鸿沟是如何消失的。(257 likes | 13 RTs) 链接
- Mollick:AI 有没有用的辩论结束了:企业领导层已经确认 AI 有真实价值,问题从"能不能用"变成了"怎么从个人用到组织级规模化"。(339 likes | 31 RTs) 链接
🎯 今日精选
当你的 AI 客服本身就是安全漏洞时,传统威胁模型就失效了:Meta AI 被社工这件事之所以重要,不是因为 Instagram 账号被盗 — 而是因为它暴露了一个结构性问题:每家急着部署客户面向 AI Agent 的公司,都刚刚看到了"当攻击面变成一段对话"时会发生什么。传统安全模型假设攻击者需要技术手段突破边界,但 AI Agent 的边界就是自然语言 — 而自然语言没有防火墙。更危险的是,这类攻击几乎不留传统日志痕迹,因为从系统角度看一切操作都是"合法的"。如果你正在部署有真实权限的 AI Agent(改账号、发邮件、处理退款),今天就该重新审视你的权限模型和人工审核环节。 详情 →
下期见 ✌️