NewsletterBlogLearnCompareTopicsGlossary
English
LAUNCHTOOLRESEARCHBUILDTECHNIQUEINSIGHT

22 条资讯

Claude Code 上线 /ultrareview — 一群 Agent 在云端帮你审代码

🧠 发布动态

Claude Code 上线 /ultrareview — 一群 Agent 在云端帮你审代码。

不是一个 Agent 看你的代码,是一支舰队。Claude Code 新功能 /ultrareview 会在云端并行启动多个专注不同方向的 bug 猎手,同时扫描你的代码库。从单 Agent 到多 Agent 并行审查,这是 Claude Code 能力的质变 — 本地跑不动的大项目,现在扔给云端几分钟出结果。当前分支直接 /ultrareview 就能用。(延伸阅读:Claude Code subagents 实战案例)(9,561 likes | 595 RTs) 详情 →

谷歌发布第八代 TPU 双芯片 — 训练和推理各一块。

TPU v8 分成 8T(训练专用)和 8I(推理专用),谷歌终于承认了一个事实:跑 Agent 的推理负载和训练大模型根本是两种工作。8I 针对的就是 Agent 场景 — 百万级小请求、低延迟、高并发。这个拆分会直接影响云端定价和 Agent 架构设计,后面展开讲。 详情 →

Qwen3.6-27B 来了 — 27B 参数干翻 Opus 4.5。

阿里放出 dense 27B 模型,LiveBench 跑分超过 Opus 4.5,编程任务逼近 frontier 水平。量化到 16GB 就能在消费级显卡上跑 — Simon Willison 实测多模态表现也很能打。开源编程模型的天花板又被推高了一截,有卡的直接 Ollama 拉下来试。(628 likes | 318 RTs) 详情 →

OpenAI 开源 PII 检测模型 — Privacy Filter 上线。 罕见操作 — OpenAI 发布了一个开源的双向 token 分类模型,专门做个人隐私信息(PII)的检测和脱敏。已经集成进 HuggingFace Transformers v5.6.0,支持本地部署、高吞吐。做数据管道的,这是现成的合规工具。 详情 →

谷歌把 Vertex AI 升级成全栈企业 Agent 平台。 不只是改名 — 新的 Vertex AI 集成了模型选择、Agent 构建、工具编排和企业安全,直接对标 Anthropic Managed Agents 和 OpenAI 的 Agent 基础设施。Agent 平台战争正式三方混战。(970 likes | 105 RTs) 详情 →

Claude Cowork 上线交互式图表和可视化(Beta)。 付费用户现在可以在 Cowork 里生成可交互的图表和流程图 — 不是静态截图,是真能点、能拖、能缩放的。从"帮你出个图"到"帮你做个 dashboard",Cowork 的定位又清晰了一步。(3,314 likes | 207 RTs) 详情 →

OpenAI 在 ChatGPT 工作区里加了持久化团队 Agent。 ChatGPT 不再只是聊天窗口 — 现在你可以在工作区里创建常驻 Agent,整个团队共享。这是 OpenAI 把 ChatGPT 从个人工具推向企业平台的关键一步,直接和 Claude Cowork 的企业版抢市场。(89 likes | 31 RTs) 详情 →


🔧 开发者工具

Anthropic 发布 MCP 生产环境集成权威指南:如果你还在把 MCP 当开发玩具,该认真了。Anthropic 官方博客详细拆解了 MCP 在生产系统中的接入模式 — 从架构设计到安全考量。这种"canonical reference"级别的文档一旦出来,整个社区的实现方式都会往这个方向靠。下次做 Agent 集成前先读一遍。(延伸阅读:如何集成 MCP 服务器详情 →

Ollama v0.21.1 — 支持 Kimi CLI 直接启动,采样速度更快ollama launch kimi 一行命令跑 Kimi,加上 MLX logprobs 和 fused top-P/top-K 加速。本地跑开源模型的体验越来越丝滑了。 详情 →


📝 技术实战

79% 的 Claude API 用户没开 Prompt Caching — 你可能在白花钱。 Anthropic 公布了一个扎心的数据:绝大多数 API 客户根本没用 prompt caching,而做得好的集成方 cache 命中率高达 92-96%。现在 Anthropic 上线了一个 adoption dashboard,你可以直接看自己的命中率。用 Claude API 的,今天就去查一下,省下来的可能不是小数目。(36 likes | 3 RTs) 详情 →

VS Code Copilot 支持自带模型和 API Key 了。 这一刀砍向的是 Cursor 和 Windsurf — GitHub Copilot 终于打破了模型锁定,你可以在 VS Code 里接入任何 LLM。很多开发者当初换编辑器就是为了模型自由度,现在这个理由不存在了。(253 likes | 32 RTs) 详情 →


🔬 研究前沿

Karpathy 转发的 demo:屏幕上每个像素都是模型实时生成的。 没有 HTML,没有布局引擎,没有代码 — 整个界面逐像素从模型输出流式渲染。如果这个方向跑通了,整个前端技术栈都可以扔了。现阶段还是 demo 级别,但 7,130 个赞说明这个想法击中了很多人的想象力。(7,130 likes | 764 RTs) 详情 →

Anthropic 发布 81,000 人 AI 经济影响调研。 目前最大规模的公开调研,聚焦普通人对 AI 经济影响的期待和担忧。做 AI 产品的,这份数据能帮你理解用户对"AI 取代工作"的真实焦虑在哪 — 产品定位和沟通策略都用得上。(1,415 likes | 126 RTs) 详情 →


💡 行业洞察

Shopify CTO 揭底:工程师 Opus 4.6 额度无上限,内部造了三个 Agent 工具。

Shopify CTO 在 Latent Space 播客上详细讲了公司的 AI 策略 — 每个工程师都有无上限的 Opus 4.6 token 预算,内部开发了 Tangle、Tangent、SimGym 三个 AI 原生开发工具。这是目前公开信息里,一家千亿美元级公司 all-in agentic coding 最详细的案例。当一家公司愿意给工程师烧无限 token,说明他们算过 ROI — 这个信号比任何跑分都能说明 Agent 编程的未来走向。 详情 →

OpenAI 正在谈一个 100 亿美元的企业部署合资公司。 代号"DeployCo",OpenAI 初期投入 5 亿美元,估值 100 亿。信号很明确:OpenAI 不满足于卖模型,要亲自下场做企业 AI 部署。从模型公司到部署公司,这是一条新的竞争赛道。 详情 →


🏗️ 值得一试

HuggingFace ml-intern — 一句话完成微调全流程:开源 Agent,从数据集选择到训练到评估全自动。已经有人用一句 prompt 微调了医学 SAM 模型。微调的门槛从"需要 ML 工程师"降到了"会写 prompt"。(2,901 likes | 360 RTs) 详情 →

Google Cloud 开源 13 个 Agent Skills — 跨平台通用:这批 Skills 同时支持 Gemini CLI、Codex、Claude Code 等多个 harness。谷歌有意思的地方在于:它发布的技能刻意兼容竞品工具,走的是生态渗透路线而不是围墙花园。(37 likes | 7 RTs) 详情 →


🎓 模型小课堂

训练专用芯片 vs. 推理专用芯片(Training-Optimized vs. Inference-Optimized Silicon):谷歌 TPU v8 分成 8T 和 8I 两款,背后反映的是整个行业的一个认知转变。训练大模型需要的是海量计算、高带宽、大批量并行 — 像建一座大工厂,一次性投入巨大但产出一个成品。而 Agent 时代的推理负载完全不同 — 百万级的小请求、每个都要低延迟返回、并发量巨大 — 更像经营一家快餐连锁,追求的是每单的速度和效率。用训练芯片跑推理就像用炼钢炉烤面包,能用但浪费。这个拆分意味着云端定价、模型部署策略、甚至 Agent 架构设计都会随之改变。


⚡ 快讯

  • Claude Code v2.1.117:支持 forked subagents(环境变量启用)和 Agent 会话内加载 MCP 服务器,模型选择跨重启保持。 链接
  • Gemma 4 VLA:在 $249 的 Jetson Orin Nano Super 上实时跑机器人视觉-语言-动作模型,边缘端 AI 又近了一步。 链接
  • Claude Code 获 Webby 奖:创始人 Boris Cherny 官宣,Agent 原生开发工具正式从小众走向主流。(405 likes | 13 RTs) 链接
  • DeepMind 牵手四大咨询:与 Accenture、BCG、Deloitte、McKinsey 合作推动企业 AI 落地,目前只有 25% 的企业做到了生产级 AI 部署。 链接
  • Google Ads Advisor 加入三项 Agent 安全功能:Agent 在高风险商业系统中自主运行的安全护栏案例,模式比产品本身更值得学。 链接

🎯 今日精选

Shopify 的无限 Token 预算,是 Agent 编程时代最有力的信号:当一家 1000 亿美元市值的公司决定给每个工程师发无上限的 Opus 4.6 额度,并且自研了三个内部 Agent 工具(Tangle 做代码生成、Tangent 做调试、SimGym 做模拟测试),这不是在"试试 AI" — 这是在重建整个工程文化。Shopify CTO 在播客里说的核心逻辑很简单:一个工程师 + 无限 AI 算力 > 三个工程师。这个 ROI 计算比任何跑分都能说明问题。联系今天谷歌拆分 TPU、Claude Code 上线多 Agent 审查、Copilot 开放模型接入 — 整个产业链从芯片到工具到企业实践都在朝同一个方向跑:Agent 不是功能,是基础设施。还在观望的团队,窗口期可能比你想的短。 详情 →


下期见 ✌️