Claude Code 桌面端从头重建

🧠 发布动态

Claude Code 桌面端从头重建。

Anthropic 发布了全新设计的 Claude Code 桌面应用 — 不是小修小补，是从底层重写的体验升级。对于每天泡在 Claude Code 里的开发者来说，交互效率直接上了一个台阶。(3,944 likes | 220 RTs) 详情 →

Gemini 3.1 Flash TTS 来了，Audio Tags 是亮点。 谷歌发布迄今最具表现力的文字转语音模型 — 支持 70+ 语言，新增 Audio Tags 功能，用自然语言指令就能控制语速、语气和情感表达。做语音产品的，这个 API 值得第一时间试。(1,145 likes | 135 RTs) 详情 →

Humwork 上线 MCP Server：AI Agent 卡住了，花钱请人类帮忙。 YC 新项目 Humwork 的思路很野 — 当 AI Agent 遇到搞不定的问题，30 秒内接入一个经过验证的领域专家（高级工程师、设计师、营销人员）。Agent 付费，人类赚钱。这可能是"人机协作"最字面意义的实现。(878 likes | 101 RTs) 详情 →

百度 ERNIE-Image 登陆 Hugging Face。 百度把文生图模型 ERNIE-Image 开源到了 HuggingFace，国产大模型的开源动作越来越快。(287 likes | 445 downloads) 详情 →

🔧 开发者工具

OpenAI Agents SDK 加入沙盒、记忆控制和开源 Harness。

OpenAI 给 Agents SDK 做了三项关键升级：Agent 可以跑在受控沙盒里（安全性大幅提升）、开源了底层 Harness 供你自定义、记忆的创建和存储位置完全可控。对比 Claude Code Routines 的"配置即运行"路线，OpenAI 走的是"给你全部零件自己组装"的路线 — 两种哲学，都在抢 Agent 基础设施的定义权。(1,568 likes | 143 RTs) 详情 →

Claude Code Routines 支持 GitHub 事件和 API 触发。 除了定时调度，Routines 现在可以被 GitHub 事件（PR、Issue 等）或 API 调用触发。这意味着 Claude Code 可以监听你的仓库动态并自主响应 — 比如新 PR 一开就自动 review、Issue 标签变更就自动分类处理。从"你喊它做事"变成"它自己知道该做什么"。(3,525 likes | 314 RTs) 详情 →

延伸阅读：想深入了解 Claude Code 的自动化能力？可以看看 Claude Code Hooks 完全指南。

HoloTab：HCompany 的 AI 浏览器伴侣登陆 Hugging Face。 HCompany 发布了 HoloTab — 一个在浏览器里跟你并肩工作的 AI 助手。定位不是搜索增强，而是"边浏览边理解"的上下文感知伴侣。感兴趣的可以去 HuggingFace 试试。详情 →

📝 技术实战

Claude Code Routines：配置一次，永远自主运行。

这是今天最值得细看的发布 — Claude Code Routines 进入 Research Preview。你定义一个 Routine（一段 Prompt + 一个仓库 + 你的连接器），它就能按计划、按事件、按 API 调用自主执行。不需要你在线，不需要你盯着。这不是"AI 辅助编码"，这是"AI 自主运维"。对于维护多个仓库的团队来说，日常的依赖更新、安全扫描、代码规范检查都可以变成后台自动完成的事。(17,585 likes | 1,406 RTs) 详情 →

把 Claude 从聊天机器人变成系统的 MCP 接线指南。 大多数人用 Claude 还是"一个聊天窗口" — 没接 MCP Server，没有工具连接，没有持久记忆。这篇指南手把手教你怎么把 Claude 接入你的实际技术栈。差距不在模型能力，在于你有没有给它接上手脚。(193 likes) 详情 →

🔬 研究前沿

Gemini Robotics-ER 1.6：教机器人理解物理空间。

Google DeepMind 发布 Gemini Robotics-ER 1.6 — 显著提升了机器人的视觉和空间理解能力。机器人不再只是"看到物体"，而是能推理物体之间的空间关系并据此规划动作。这是通用机器人从实验室走向实用的关键一步。(1,577 likes | 257 RTs) 详情 →

TIPSv2：DeepMind 空间理解模型将亮相 CVPR 2026。 真正的多模态 AI 需要空间理解能力 — TIPSv2 就是 DeepMind 在这个方向的最新成果，即将在 CVPR 2026 发表。和 Robotics-ER 配合来看，谷歌在"AI 理解物理世界"这条线上投入很重。(559 likes | 66 RTs) 详情 →

VAKRA 基准测试揭示 AI Agent 工具调用的真实失败模式。 IBM Research 发布的 VAKRA 分析了 Agent 在推理、工具使用中到底哪里会翻车。结论：大多数失败不是模型能力不够，而是工具调用链路中的边界情况处理不当。做 Agent 产品的，这篇值得对照自查。详情 →

💡 行业洞察

Notion 的 5 次重建之路：从 MCP 到 AI 软件工厂。 Notion 联合创始人和 AI 负责人在 Latent Space 播客里复盘了 AI 功能的开发历程 — 5 次重建、100+ 工具、MCP vs CLI 的取舍。核心观点：AI 不是加个功能，而是重新思考整个产品架构。对于同样在产品里集成 AI 的团队，这期播客全是干货。详情 →

Latent Space 发问：这是人类最后的平静时刻吗？ 一个难得的安静日子让 Latent Space 编辑部停下来反思 — 在 AI 加速改变一切的时代，"工作"的意义正在被重新定义。不是技术文章，但值得在忙碌中花 10 分钟读一读。详情 →

🏗️ 值得一试

2026 年零成本搭建生产级 AI 系统的完整技术栈。 一份实用清单：LLM 用 Ollama + Gemma 4 / Llama 3.3（本地免费）、编排用 LangGraph / CrewAI（开源）、RAG 用 LlamaIndex + ChromaDB（本地）、工具层用 MCP、前端 Next.js + Vercel 免费额度、数据库 SQLite / DuckDB。预算为零但想做 AI 产品的独立开发者，这就是你的起点。(187 likes) 详情 →

🎓 模型小课堂

事件驱动 Agent 架构（Event-Driven Agent Architecture）：今天最大的两个发布 — Claude Code Routines 和 OpenAI Agents SDK — 都在把 Agent 从"请求-响应"模式推向"事件触发"模式。传统的 AI 助手是你问一句它答一句；事件驱动的 Agent 则监听特定事件（定时任务、Webhook 回调、API 触发），条件满足就自主执行。这就像把 AI 从"随叫随到的实习生"升级成"值班的运维工程师" — 它不需要你在场就能干活。理解 cron 调度、webhook 触发、API 驱动这三种模式，就理解了 AI 工具从"聊天机器人"进化到"AI 同事"的关键路径。

⚡ 快讯

ERNIE-Image-Turbo：百度同步开源的轻量版文生图模型，也已上线 Hugging Face。(215 likes | 419 downloads) 链接
Gemini Flash TTS Audio Tags 深度解析：DeepMind 官方博客详解 Audio Tags 的技术细节和使用方法。链接
谷歌 AI for the Economy Forum：谷歌在华盛顿特区举办 AI 经济论坛，聚焦 AI 对就业和经济的影响。链接
OpenAI 网络防御可信访问计划：OpenAI 发布面向网络安全领域的可信访问方案。链接
Datasette 1.0a27：Simon Willison 的轻量级数据探索工具发布新 alpha 版本。链接

🎯 今日精选

Claude Code Routines 标志着 AI 编码工具从聊天助手跨入自主基础设施：今天 Claude Code 发布的 Routines 不只是一个新功能 — 它改变了开发者和 AI 工具的交互范式。以前你要写代码，得打开 Claude Code，描述需求，等它输出，检查结果。现在你配置一个 Routine — 定义触发条件、绑定仓库、接好连接器 — 然后它自己跑。你不需要在线。这个转变的意义在于：AI 编码工具的竞争焦点正在从"谁的模型更聪明"转向"谁的编排层更好用"。OpenAI 同一天推出 Agents SDK 的沙盒和开源 Harness，走的是同一个方向。长期来看，赢家不会是最好的模型，而是最好的编排层 — 让开发者用最少的配置实现最强的自动化。(17,585 likes | 1,406 RTs) 详情 →

下期见 ✌️