OpenAI Agent 容器启动速度提升 10 倍

🧠 发布动态

OpenAI Agent 容器启动速度提升 10 倍。

你的 Agent 工作流感觉迟钝？瓶颈很可能在容器冷启动。OpenAI 给 Responses API 加了容器池化 — skills、shell、代码解释器的启动速度直接快了 10 倍。原理很简单：预热好的容器复用，不再每次从零拉起。对跑复杂多步 Agent 任务的开发者来说，这是体感最明显的一次基础设施升级。(2,014 likes | 142 RTs) 详情 →

阿里 Z-Image-Turbo 在 HuggingFace 上爆了。 通义实验室的文生图模型 Z-Image-Turbo 下载量冲到 79.3 万，在开源图像生成赛道上势头很猛。如果你在用 SDXL 或 Flux 做图像管线，值得跑个对比。(4,300 likes | 793.1K downloads) 详情 →

Map-Anything v1：浏览器里就能跑的通用 3D 重建。 不需要逐场景优化，任意输入直接生成度量级 3D 地图。HuggingFace Spaces 上有 demo，前馈式架构意味着速度比传统方法快得多。(392 likes | 58 RTs) 详情 →

Google AI 一周密集发布：从 Vibe Coding 到 Vibe Designing。 Google AI Studio 现在支持全栈 vibe coding，Stitch 进化成 AI 设计画布，平台服务集成全面扩展。Google 的策略很清楚 — 把 AI 能力铺到创作流程的每个环节。(458 likes | 53 RTs) 详情 →

IBM 发布 Granite Libraries，开源模型终于好用了。 Mellea 0.4.0 + Granite Libraries 一起发布，给 Granite 模型家族提供了标准化工具链。IBM 的开源模型一直被吐槽"模型不错但上手太麻烦"，这次算是正式补课。详情 →

🔧 开发者工具

Claude Code 的 /init 大改版 — 它现在会"面试"你。

以前 /init 就是生成个 CLAUDE.md 完事。新版完全不同 — 它会主动问你项目用什么框架、偏好什么风格、需要什么 hooks，然后自动配置 skills 和项目规则。设置环境变量 CLAUDE_CODE_NEW_INIT=1 就能体验。这个方向对了：Agent 的初始化质量直接决定后续所有交互的质量。(2,717 likes | 162 RTs) 详情 →

延伸阅读：我们之前整理过 Claude Code Skills 最佳实践，配合新版 /init 效果更好。

Claude Code Skills 现在支持按命令设定思考深度。 在 skill 配置里加 effort level，简单任务用 low 秒回，复杂任务用 high 深度推理。终于不用在速度和质量之间做全局取舍了。(2,535 likes | 129 RTs) 详情 →

Chrome 远程调试 + MCP = 告别 CAPTCHA 地狱。 用 Chrome DevTools MCP 直接复用你已登录的浏览器会话做 Agent 测试 — 不用重新登录，不用处理验证码。做 Web Agent 的都懂这个痛点有多大。(1,003 likes | 68 RTs) 详情 →

Unusual Whales 发布 MCP Server：实时市场数据直通 AI Agent。 期权流、暗池交易、国会议员持仓、13F 报告 — 全部通过 MCP 协议流入 Claude 或任何 MCP 客户端。做量化或金融工具的，这是个很好的参考实现。(838 likes | 81 RTs) 详情 →

📝 技术实战

Simon Willison 写了 Git + 编码 Agent 的"缺失手册"。

当你的 Agent 能改代码、提 PR、跑测试时，Git 工作流该怎么设计？Simon Willison 的这篇实操指南填了一个很大的空白 — 分支策略、审查流程、回滚机制，所有在用 Claude Code 或 Codex 的团队都该读。(719 likes | 62 RTs) 详情 →

Anthropic 工程师的 Claude Code 深度文章索引。 trq212 把自己写过的所有 Claude Code 技术文章整理成了一个置顶帖 — skills、hooks、agent patterns、高级用法，一站式补课。(6,534 likes | 645 RTs) 详情 →

延伸阅读：想了解 hooks 的具体用法，可以看什么是 Claude Code Hooks。

用 Claude 做移动端 QA — 不用写测试脚本。 一篇实战文章，演示如何让 Claude 看截图、理解交互流程、检测回归 — 全程不写一行测试代码。对小团队来说，这可能比搭完整的自动化测试框架更实际。(66 likes) 详情 →

🔬 研究前沿

小模型学会了"品味" — 能预测哪些论文会火。

一个在引用数据上训练的小模型，能预测论文的影响力。这不是简单的引用计数预测 — 而是证明了"质量判断"本身可以从 engagement 信号中被学习。对做内容推荐、论文筛选的团队，这个思路值得深挖。(407 likes | 54 RTs) 详情 →

Willison 展示 LLM 如何从公开评论拼出完整用户画像。 给 LLM 喂 1000 条 Hacker News 评论，它能推断出你的职业、技术栈、政治倾向、甚至生活习惯。这不是理论风险 — 任何人现在就能对你做这件事。审视一下自己的数字足迹。(291 likes) 详情 →

Transformer 电路的直觉入门指南。 机械可解释性（Mechanistic Interpretability）听起来很学术，但这篇文章从直觉出发，让工程师也能理解模型内部到底在发生什么。想搞懂"为什么模型这样回答"的，推荐阅读。(13 likes) 详情 →

💡 行业洞察

Codex vs Claude Code：两种截然不同的 Agent 学习哲学。

Emollick 点出了一个关键分歧：OpenAI Codex 把 skills 当功能参考手册，Claude Code 把 skills 当问题解决思路。前者是"告诉 Agent 该调什么 API"，后者是"教 Agent 怎么思考问题"。这不是功能对比 — 这是两家公司对"Agent 该如何积累专业知识"的根本分歧。(119 likes) 详情 →

延伸阅读：我们之前深入对比过本地运行 AI 编程 Agent 的不同路径。

Anthropic 把 claude.ai 从 SSR 换成了静态 Vite — TTFB 直降 65%。 没错，做 AI 的公司自己的前端也在卷性能。从 SSR 迁移到 Vite + TanStack Router + 边缘 Worker 的静态架构，p75 TTFB 降了 65%，prompt 显示快了 50%。如果你还在纠结 SSR vs 静态，这是一个来自生产环境的真实数据点。(2,316 likes | 87 RTs) 详情 →

NVIDIA 超越 Google，成为 HuggingFace 最大组织。 3,881 名团队成员。芯片公司？不，NVIDIA 正在变成全栈 AI 平台公司。从硬件到模型到工具链，黄仁勋的野心比你想的大得多。(786 likes | 86 RTs) 详情 →

Anthropic 的日更节奏本身就是 AI 开发的最佳论据。 Emollick 观察到 Anthropic 团队从社区反馈（OpenClaw）到功能上线的速度 — 每天都在发版。这不只是"敏捷开发"，这是 AI 驱动的编码团队能达到的节奏。(1,233 likes | 80 RTs) 详情 →

🏗️ 值得一试

怎么让你的开源项目对 AI Agent 友好？ 结构化文档、机器可读的元数据、Agent 能理解的贡献规范 — 这篇指南讲的是当越来越多的 PR 来自 AI Agent 时，维护者该怎么准备。(81 likes | 13 RTs) 详情 →

一个工业管道承包商在用 Claude Code 干活。 没有编程背景，但在用 Claude Code 处理真实业务任务。AI 编码工具正在从"开发者专属"走向"所有专业人士可用"的阶段。(61 likes | 21 RTs) 详情 →

🎓 模型小课堂

容器池化（Container Pooling）vs 冷启动（Cold Start）：想象你每次叫外卖，骑手都要先去仓库取车、调导航、登录系统才能出发 — 这就是"冷启动"。容器池化的做法是：提前让一批骑手骑着车在路上待命，订单一来直接就近派送。OpenAI 这次的 10 倍提速就是这个原理 — Agent 不再每次从零启动一个容器，而是复用已经预热好的环境。这也解释了为什么之前复杂的多步 Agent 工作流总感觉卡顿 — 每一步都在等冷启动。

⚡ 快讯

Dreamer：Stripe 前 CTO 推出的"个人 Agent 操作系统"，$10K 奖金招募工具开发者。链接
Paradigm AI：AI 原生重写的新版本上线，不是给旧软件加 AI，而是从头为 AI 工作流设计。(703 likes | 102 RTs) 链接

🎯 今日精选

Codex vs Claude Code 的 Skill 哲学之争，决定的是 Agent 的未来形态：这不是"哪家功能多"的问题。OpenAI Codex 把 skills 设计成功能性参考 — Agent 查手册、调 API、完成任务。Claude Code 把 skills 设计成解题思路 — Agent 学习的是"遇到这类问题该怎么思考"。一个是工具箱模型，一个是学徒模型。哪种方式能让 Agent 更好地积累专业知识、跨项目复用经验，将直接决定下一代开发者工具长什么样。对开发者来说，现在就值得两边都试 — 你选择用哪种方式组织 skills，本质上是在押注 Agent 的进化方向。详情 →

下期见 ✌️