OpenAI Agent 容器启动速度提升 10 倍
🧠 发布动态
OpenAI Agent 容器启动速度提升 10 倍。
你的 Agent 工作流感觉迟钝?瓶颈很可能在容器冷启动。OpenAI 给 Responses API 加了容器池化 — skills、shell、代码解释器的启动速度直接快了 10 倍。原理很简单:预热好的容器复用,不再每次从零拉起。对跑复杂多步 Agent 任务的开发者来说,这是体感最明显的一次基础设施升级。(2,014 likes | 142 RTs) 详情 →
阿里 Z-Image-Turbo 在 HuggingFace 上爆了。 通义实验室的文生图模型 Z-Image-Turbo 下载量冲到 79.3 万,在开源图像生成赛道上势头很猛。如果你在用 SDXL 或 Flux 做图像管线,值得跑个对比。(4,300 likes | 793.1K downloads) 详情 →
Map-Anything v1:浏览器里就能跑的通用 3D 重建。 不需要逐场景优化,任意输入直接生成度量级 3D 地图。HuggingFace Spaces 上有 demo,前馈式架构意味着速度比传统方法快得多。(392 likes | 58 RTs) 详情 →
Google AI 一周密集发布:从 Vibe Coding 到 Vibe Designing。 Google AI Studio 现在支持全栈 vibe coding,Stitch 进化成 AI 设计画布,平台服务集成全面扩展。Google 的策略很清楚 — 把 AI 能力铺到创作流程的每个环节。(458 likes | 53 RTs) 详情 →
IBM 发布 Granite Libraries,开源模型终于好用了。 Mellea 0.4.0 + Granite Libraries 一起发布,给 Granite 模型家族提供了标准化工具链。IBM 的开源模型一直被吐槽"模型不错但上手太麻烦",这次算是正式补课。 详情 →
🔧 开发者工具
Claude Code 的 /init 大改版 — 它现在会"面试"你。
以前 /init 就是生成个 CLAUDE.md 完事。新版完全不同 — 它会主动问你项目用什么框架、偏好什么风格、需要什么 hooks,然后自动配置 skills 和项目规则。设置环境变量 CLAUDE_CODE_NEW_INIT=1 就能体验。这个方向对了:Agent 的初始化质量直接决定后续所有交互的质量。(2,717 likes | 162 RTs) 详情 →
延伸阅读:我们之前整理过 Claude Code Skills 最佳实践,配合新版 /init 效果更好。
Claude Code Skills 现在支持按命令设定思考深度。 在 skill 配置里加 effort level,简单任务用 low 秒回,复杂任务用 high 深度推理。终于不用在速度和质量之间做全局取舍了。(2,535 likes | 129 RTs) 详情 →
Chrome 远程调试 + MCP = 告别 CAPTCHA 地狱。 用 Chrome DevTools MCP 直接复用你已登录的浏览器会话做 Agent 测试 — 不用重新登录,不用处理验证码。做 Web Agent 的都懂这个痛点有多大。(1,003 likes | 68 RTs) 详情 →
Unusual Whales 发布 MCP Server:实时市场数据直通 AI Agent。 期权流、暗池交易、国会议员持仓、13F 报告 — 全部通过 MCP 协议流入 Claude 或任何 MCP 客户端。做量化或金融工具的,这是个很好的参考实现。(838 likes | 81 RTs) 详情 →
📝 技术实战
Simon Willison 写了 Git + 编码 Agent 的"缺失手册"。
当你的 Agent 能改代码、提 PR、跑测试时,Git 工作流该怎么设计?Simon Willison 的这篇实操指南填了一个很大的空白 — 分支策略、审查流程、回滚机制,所有在用 Claude Code 或 Codex 的团队都该读。(719 likes | 62 RTs) 详情 →
Anthropic 工程师的 Claude Code 深度文章索引。 trq212 把自己写过的所有 Claude Code 技术文章整理成了一个置顶帖 — skills、hooks、agent patterns、高级用法,一站式补课。(6,534 likes | 645 RTs) 详情 →
延伸阅读:想了解 hooks 的具体用法,可以看 什么是 Claude Code Hooks。
用 Claude 做移动端 QA — 不用写测试脚本。 一篇实战文章,演示如何让 Claude 看截图、理解交互流程、检测回归 — 全程不写一行测试代码。对小团队来说,这可能比搭完整的自动化测试框架更实际。(66 likes) 详情 →
🔬 研究前沿
小模型学会了"品味" — 能预测哪些论文会火。
一个在引用数据上训练的小模型,能预测论文的影响力。这不是简单的引用计数预测 — 而是证明了"质量判断"本身可以从 engagement 信号中被学习。对做内容推荐、论文筛选的团队,这个思路值得深挖。(407 likes | 54 RTs) 详情 →
Willison 展示 LLM 如何从公开评论拼出完整用户画像。 给 LLM 喂 1000 条 Hacker News 评论,它能推断出你的职业、技术栈、政治倾向、甚至生活习惯。这不是理论风险 — 任何人现在就能对你做这件事。审视一下自己的数字足迹。(291 likes) 详情 →
Transformer 电路的直觉入门指南。 机械可解释性(Mechanistic Interpretability)听起来很学术,但这篇文章从直觉出发,让工程师也能理解模型内部到底在发生什么。想搞懂"为什么模型这样回答"的,推荐阅读。(13 likes) 详情 →
💡 行业洞察
Codex vs Claude Code:两种截然不同的 Agent 学习哲学。
Emollick 点出了一个关键分歧:OpenAI Codex 把 skills 当功能参考手册,Claude Code 把 skills 当问题解决思路。前者是"告诉 Agent 该调什么 API",后者是"教 Agent 怎么思考问题"。这不是功能对比 — 这是两家公司对"Agent 该如何积累专业知识"的根本分歧。(119 likes) 详情 →
延伸阅读:我们之前深入对比过 本地运行 AI 编程 Agent 的不同路径。
Anthropic 把 claude.ai 从 SSR 换成了静态 Vite — TTFB 直降 65%。 没错,做 AI 的公司自己的前端也在卷性能。从 SSR 迁移到 Vite + TanStack Router + 边缘 Worker 的静态架构,p75 TTFB 降了 65%,prompt 显示快了 50%。如果你还在纠结 SSR vs 静态,这是一个来自生产环境的真实数据点。(2,316 likes | 87 RTs) 详情 →
NVIDIA 超越 Google,成为 HuggingFace 最大组织。 3,881 名团队成员。芯片公司?不,NVIDIA 正在变成全栈 AI 平台公司。从硬件到模型到工具链,黄仁勋的野心比你想的大得多。(786 likes | 86 RTs) 详情 →
Anthropic 的日更节奏本身就是 AI 开发的最佳论据。 Emollick 观察到 Anthropic 团队从社区反馈(OpenClaw)到功能上线的速度 — 每天都在发版。这不只是"敏捷开发",这是 AI 驱动的编码团队能达到的节奏。(1,233 likes | 80 RTs) 详情 →
🏗️ 值得一试
怎么让你的开源项目对 AI Agent 友好? 结构化文档、机器可读的元数据、Agent 能理解的贡献规范 — 这篇指南讲的是当越来越多的 PR 来自 AI Agent 时,维护者该怎么准备。(81 likes | 13 RTs) 详情 →
一个工业管道承包商在用 Claude Code 干活。 没有编程背景,但在用 Claude Code 处理真实业务任务。AI 编码工具正在从"开发者专属"走向"所有专业人士可用"的阶段。(61 likes | 21 RTs) 详情 →
🎓 模型小课堂
容器池化(Container Pooling)vs 冷启动(Cold Start):想象你每次叫外卖,骑手都要先去仓库取车、调导航、登录系统才能出发 — 这就是"冷启动"。容器池化的做法是:提前让一批骑手骑着车在路上待命,订单一来直接就近派送。OpenAI 这次的 10 倍提速就是这个原理 — Agent 不再每次从零启动一个容器,而是复用已经预热好的环境。这也解释了为什么之前复杂的多步 Agent 工作流总感觉卡顿 — 每一步都在等冷启动。
⚡ 快讯
- Dreamer:Stripe 前 CTO 推出的"个人 Agent 操作系统",$10K 奖金招募工具开发者。 链接
- Paradigm AI:AI 原生重写的新版本上线,不是给旧软件加 AI,而是从头为 AI 工作流设计。(703 likes | 102 RTs) 链接
🎯 今日精选
Codex vs Claude Code 的 Skill 哲学之争,决定的是 Agent 的未来形态:这不是"哪家功能多"的问题。OpenAI Codex 把 skills 设计成功能性参考 — Agent 查手册、调 API、完成任务。Claude Code 把 skills 设计成解题思路 — Agent 学习的是"遇到这类问题该怎么思考"。一个是工具箱模型,一个是学徒模型。哪种方式能让 Agent 更好地积累专业知识、跨项目复用经验,将直接决定下一代开发者工具长什么样。对开发者来说,现在就值得两边都试 — 你选择用哪种方式组织 skills,本质上是在押注 Agent 的进化方向。 详情 →
下期见 ✌️