NewsletterBlogLearnCompareTopicsGlossary
English
TECHNIQUELAUNCHTOOLINSIGHT

22 条资讯

Claude Code 桌面端从头重建

🧠 发布动态

Claude Code 桌面端从头重建。

Anthropic 发布了全新设计的 Claude Code 桌面应用 — 不是小修小补,是从底层重写的体验升级。对于每天泡在 Claude Code 里的开发者来说,交互效率直接上了一个台阶。(3,944 likes | 220 RTs) 详情 →

Gemini 3.1 Flash TTS 来了,Audio Tags 是亮点。 谷歌发布迄今最具表现力的文字转语音模型 — 支持 70+ 语言,新增 Audio Tags 功能,用自然语言指令就能控制语速、语气和情感表达。做语音产品的,这个 API 值得第一时间试。(1,145 likes | 135 RTs) 详情 →

Humwork 上线 MCP Server:AI Agent 卡住了,花钱请人类帮忙。 YC 新项目 Humwork 的思路很野 — 当 AI Agent 遇到搞不定的问题,30 秒内接入一个经过验证的领域专家(高级工程师、设计师、营销人员)。Agent 付费,人类赚钱。这可能是"人机协作"最字面意义的实现。(878 likes | 101 RTs) 详情 →

百度 ERNIE-Image 登陆 Hugging Face。 百度把文生图模型 ERNIE-Image 开源到了 HuggingFace,国产大模型的开源动作越来越快。(287 likes | 445 downloads) 详情 →


🔧 开发者工具

OpenAI Agents SDK 加入沙盒、记忆控制和开源 Harness。

OpenAI 给 Agents SDK 做了三项关键升级:Agent 可以跑在受控沙盒里(安全性大幅提升)、开源了底层 Harness 供你自定义、记忆的创建和存储位置完全可控。对比 Claude Code Routines 的"配置即运行"路线,OpenAI 走的是"给你全部零件自己组装"的路线 — 两种哲学,都在抢 Agent 基础设施的定义权。(1,568 likes | 143 RTs) 详情 →

Claude Code Routines 支持 GitHub 事件和 API 触发。 除了定时调度,Routines 现在可以被 GitHub 事件(PR、Issue 等)或 API 调用触发。这意味着 Claude Code 可以监听你的仓库动态并自主响应 — 比如新 PR 一开就自动 review、Issue 标签变更就自动分类处理。从"你喊它做事"变成"它自己知道该做什么"。(3,525 likes | 314 RTs) 详情 →

延伸阅读:想深入了解 Claude Code 的自动化能力?可以看看 Claude Code Hooks 完全指南

HoloTab:HCompany 的 AI 浏览器伴侣登陆 Hugging Face。 HCompany 发布了 HoloTab — 一个在浏览器里跟你并肩工作的 AI 助手。定位不是搜索增强,而是"边浏览边理解"的上下文感知伴侣。感兴趣的可以去 HuggingFace 试试。详情 →


📝 技术实战

Claude Code Routines:配置一次,永远自主运行。

这是今天最值得细看的发布 — Claude Code Routines 进入 Research Preview。你定义一个 Routine(一段 Prompt + 一个仓库 + 你的连接器),它就能按计划、按事件、按 API 调用自主执行。不需要你在线,不需要你盯着。这不是"AI 辅助编码",这是"AI 自主运维"。对于维护多个仓库的团队来说,日常的依赖更新、安全扫描、代码规范检查都可以变成后台自动完成的事。(17,585 likes | 1,406 RTs) 详情 →

把 Claude 从聊天机器人变成系统的 MCP 接线指南。 大多数人用 Claude 还是"一个聊天窗口" — 没接 MCP Server,没有工具连接,没有持久记忆。这篇指南手把手教你怎么把 Claude 接入你的实际技术栈。差距不在模型能力,在于你有没有给它接上手脚。(193 likes) 详情 →


🔬 研究前沿

Gemini Robotics-ER 1.6:教机器人理解物理空间。

Google DeepMind 发布 Gemini Robotics-ER 1.6 — 显著提升了机器人的视觉和空间理解能力。机器人不再只是"看到物体",而是能推理物体之间的空间关系并据此规划动作。这是通用机器人从实验室走向实用的关键一步。(1,577 likes | 257 RTs) 详情 →

TIPSv2:DeepMind 空间理解模型将亮相 CVPR 2026。 真正的多模态 AI 需要空间理解能力 — TIPSv2 就是 DeepMind 在这个方向的最新成果,即将在 CVPR 2026 发表。和 Robotics-ER 配合来看,谷歌在"AI 理解物理世界"这条线上投入很重。(559 likes | 66 RTs) 详情 →

VAKRA 基准测试揭示 AI Agent 工具调用的真实失败模式。 IBM Research 发布的 VAKRA 分析了 Agent 在推理、工具使用中到底哪里会翻车。结论:大多数失败不是模型能力不够,而是工具调用链路中的边界情况处理不当。做 Agent 产品的,这篇值得对照自查。详情 →


💡 行业洞察

Notion 的 5 次重建之路:从 MCP 到 AI 软件工厂。 Notion 联合创始人和 AI 负责人在 Latent Space 播客里复盘了 AI 功能的开发历程 — 5 次重建、100+ 工具、MCP vs CLI 的取舍。核心观点:AI 不是加个功能,而是重新思考整个产品架构。对于同样在产品里集成 AI 的团队,这期播客全是干货。详情 →

Latent Space 发问:这是人类最后的平静时刻吗? 一个难得的安静日子让 Latent Space 编辑部停下来反思 — 在 AI 加速改变一切的时代,"工作"的意义正在被重新定义。不是技术文章,但值得在忙碌中花 10 分钟读一读。详情 →


🏗️ 值得一试

2026 年零成本搭建生产级 AI 系统的完整技术栈。 一份实用清单:LLM 用 Ollama + Gemma 4 / Llama 3.3(本地免费)、编排用 LangGraph / CrewAI(开源)、RAG 用 LlamaIndex + ChromaDB(本地)、工具层用 MCP、前端 Next.js + Vercel 免费额度、数据库 SQLite / DuckDB。预算为零但想做 AI 产品的独立开发者,这就是你的起点。(187 likes) 详情 →


🎓 模型小课堂

事件驱动 Agent 架构(Event-Driven Agent Architecture):今天最大的两个发布 — Claude Code Routines 和 OpenAI Agents SDK — 都在把 Agent 从"请求-响应"模式推向"事件触发"模式。传统的 AI 助手是你问一句它答一句;事件驱动的 Agent 则监听特定事件(定时任务、Webhook 回调、API 触发),条件满足就自主执行。这就像把 AI 从"随叫随到的实习生"升级成"值班的运维工程师" — 它不需要你在场就能干活。理解 cron 调度、webhook 触发、API 驱动这三种模式,就理解了 AI 工具从"聊天机器人"进化到"AI 同事"的关键路径。


⚡ 快讯

  • ERNIE-Image-Turbo:百度同步开源的轻量版文生图模型,也已上线 Hugging Face。(215 likes | 419 downloads) 链接
  • Gemini Flash TTS Audio Tags 深度解析:DeepMind 官方博客详解 Audio Tags 的技术细节和使用方法。 链接
  • 谷歌 AI for the Economy Forum:谷歌在华盛顿特区举办 AI 经济论坛,聚焦 AI 对就业和经济的影响。 链接
  • OpenAI 网络防御可信访问计划:OpenAI 发布面向网络安全领域的可信访问方案。 链接
  • Datasette 1.0a27:Simon Willison 的轻量级数据探索工具发布新 alpha 版本。 链接

🎯 今日精选

Claude Code Routines 标志着 AI 编码工具从聊天助手跨入自主基础设施:今天 Claude Code 发布的 Routines 不只是一个新功能 — 它改变了开发者和 AI 工具的交互范式。以前你要写代码,得打开 Claude Code,描述需求,等它输出,检查结果。现在你配置一个 Routine — 定义触发条件、绑定仓库、接好连接器 — 然后它自己跑。你不需要在线。这个转变的意义在于:AI 编码工具的竞争焦点正在从"谁的模型更聪明"转向"谁的编排层更好用"。OpenAI 同一天推出 Agents SDK 的沙盒和开源 Harness,走的是同一个方向。长期来看,赢家不会是最好的模型,而是最好的编排层 — 让开发者用最少的配置实现最强的自动化。(17,585 likes | 1,406 RTs) 详情 →


下期见 ✌️