Claude Code 能看你的屏幕、点你的 UI、验证自己写的代码了

🧠 发布动态

Claude Code 能看你的屏幕、点你的 UI、验证自己写的代码了。

这不是"加了个截图功能" — Claude 现在可以直接打开你的应用、点击界面元素、测试它刚生成的代码，整个循环在 CLI 里闭合。代码写完 → 打开浏览器 → 看渲染结果 → 发现问题 → 回来改，全自动。Research preview 阶段，Pro 和 Max 用户可用，通过 /mcp 启用。这是 Claude Code 近几周最大的功能升级，Agent 从"只会敲键盘"进化到了"有眼睛有手"。(40,041 likes | 3,024 RTs) 详情 →

Claude Code Auto Mode 向企业用户和 API 用户开放。

多步任务不用逐步审批了 — Auto Mode 让 Claude Code 自主执行完整任务链，中间不停下来问你"可以吗"。对信任 Agent 循环的团队来说，这是工作流提速的关键一步。更新安装后 claude --enable-auto-mode 即可体验。(2,521 likes | 166 RTs) 详情 →

Qwen3.5-9B-Uncensored 成了本地模型圈的新宠。 9B 参数、无审查、本地可跑 — 对需要不受限输出的研究和创意场景，这是目前最热门的选择。开源社区下载量飙升，如果你在做本地部署方案，值得测一测。(2,570 likes | 236 RTs) 详情 →

Mistral 一口气亮出 Voxtral TTS、Forge 平台和 Mistral 4 路线图。 Latent Space 对 Mistral 核心团队的深度访谈，覆盖语音合成策略、新开发平台 Forge、以及 Mistral 4 的方向。欧洲唯一持续交付 frontier 模型的实验室，动向值得跟。详情 →

🔧 开发者工具

OpenAI 的 Codex 现在能在 Claude Code 里跑了。

你没看错 — /plugin marketplace add openai/codex-plugin-cc，然后你就能在 Claude Code 里用 /codex:review（代码审查）、/codex:adversarial-review（对抗性审查）、/codex:rescue（代码抢救）。OpenAI 把自家模型做成插件塞进竞争对手的 CLI 里，这不是慷慨，这是赌注 — 赌的是"谁的模型跑不重要，开发者在哪个终端里工作才重要"。AI 工具正在从孤岛走向互操作。(2,764 likes | 203 RTs) 详情 →

延伸阅读：想了解 Codex 的定位和演进？→ Codex 是什么

ARC — 任何本地 AI Agent 的浏览器控制台。 在工作站上启动 Agent 任务，然后用手机、平板、任何浏览器远程监控和交互。开源，原生支持 Nous Hermes。解决了"Agent 在我台式机上跑，但我人在外面"的痛点。(83 likes) 详情 →

Unusual Whales 发布 MCP Server，实时金融数据直通 AI Agent。 期权流、股票行情、预测市场数据 — 通过 MCP 协议流式接入任何 AI 助手。对做金融分析的开发者来说，这是让 AI 助手真正有用的那种实时数据集成。(321 likes) 详情 →

HuggingFace 把 arXiv 变成了 Agent 可读的研究基础设施。 hf papers [search, read] 让 AI Agent 可以程序化地搜索和阅读论文 — 结构化输出，不用再自己爬 PDF 解析。做研究向 Agent 工作流的，这是必备工具。(783 likes | 95 RTs) 详情 →

📝 技术实战

一位 Anthropic 工程师分享了你大概率没用过的 Claude Code 功能。

20K 点赞说明了一切 — 大多数人可能只用了 Claude Code 30% 的能力。这个帖子覆盖了隐藏功能和低估技巧，从工作流快捷方式到调试模式，每一条都值得试。(19,827 likes | 2,088 RTs) 详情 →

延伸阅读：想系统了解 Claude Code 能做什么？→ Claude Code 不只是编程工具

Perplexity 分享了大规模语音 Agent 的生产经验。 用 OpenAI Realtime API 跑语音 Agent 的实战教训 — 上下文管理、音频管道架构、轮次切换（turn-taking）模式。这不是 demo 级别的分享，是真正在生产环境里踩过坑的团队写的。(260 likes) 详情 →

每天 20 万+ vibe coding 项目被创建，几乎没有一个找到用户。 Vibe coding 时代的分发问题比创建问题大得多。这个帖子列了 7 个实际可用的分发策略，包括用 MCP Server 当分发渠道和程序化 SEO 模式。造东西容易，让人用才难。(492 likes) 详情 →

🔬 研究前沿

两项随机对照实验证实：AI 当导师有用，AI 当捷径有害。 同样的技术，结果截然相反 — 区别完全在于 AI 被如何配置。不限制地让学生使用 AI，他们会无意中跳过学习过程；但把 AI 提示为苏格拉底式导师，学习效果显著提升。做教育产品的，prompt 设计就是产品设计。(363 likes | 55 RTs) 详情 →

AI 如何重塑数学推理与人类认知。 一篇严肃的学术论文，分析当机器接管计算层后，人类的数学思维发生了什么变化。不是炒作，而是结构化地讨论人机认知协作的框架。想深入理解"AI 改变了我们怎么想"的，推荐读原文。(190 likes | 74 RTs) 详情 →

💡 行业洞察

Anthropic 承认 Claude Code 用户撞限速比预期快得多。 很可能是 computer use 和 auto mode 同时上线导致需求暴涨。如果你的工作流重度依赖 Claude Code，短期内要做好被限流的准备，重度任务尽量错峰。(8,237 likes | 405 RTs) 详情 →

Redpoint 数据：46% 的企业 CIO 愿意用 AI 原生创业公司替换现有供应商。 这个数字远高于预期。Redpoint 甚至发布了一份"值得用 AI 从头重做"的 SaaS 企业排名。企业级软件的替换窗口正在打开，如果你有垂直领域经验，现在是动手的时候。(416 likes) 详情 →

工程师职业阶梯的中间几级正在消失。 当 AI 接手了中级工程师的日常任务，传统的晋升路径断裂了 — 初级没法通过"做中级的活"来成长，高级面临完全不同的技能要求。带团队的管理者，是时候重新设计成长路径了。(68 likes) 详情 →

🏗️ 值得一试

本地模型硬件对照指南：8GB 到 64GB 怎么选。 HuggingFace 整理的实用硬件-模型映射表 — 64GB 跑什么、32GB 跑什么、16GB 跑什么、8GB 还能跑什么，附具体模型推荐（包括 Qwen3-coder 配 Claude Code）。收藏当购物清单。(3,131 likes | 228 RTs) 详情 →

Sebastian Raschka 的《从零构建推理模型》全部章节上线。 继《从零构建 LLM》之后，Raschka 的新书覆盖链式思维（Chain-of-Thought）和推理能力的底层实现。想真正理解推理模型怎么工作而不只是调 API 的，这可能是目前最好的动手教程。(2,425 likes | 246 RTs) 详情 →

🎓 模型小课堂

GUI Agent（计算机视觉操控）：传统的 AI 编程助手只能通过 API 和文本跟你的代码交互 — 它"看不见"你的屏幕。GUI Agent 不一样，它能像人一样看到屏幕上的像素、识别按钮和输入框、然后点击操作。Claude Code 这次上线的 computer use 就是这个能力 — Agent 写完代码后可以打开浏览器，看到渲染结果，发现 UI 问题再回去改。核心区别在于：API Agent 操作的是结构化数据（DOM、JSON），GUI Agent 操作的是视觉信息（像素、截图）。前者快但只能处理有接口的东西，后者慢但什么都能操作。知道这个区别，你就能判断什么场景用 computer use 有价值，什么场景纯属浪费 token。

⚡ 快讯

Mollick：金融市场会最先感受到超人 AI：逻辑很简单 — 金融是纯智力直接兑换价值最快的领域。(1,544 likes) 链接
反向观点：MCP 正在死亡，团队在回归 OAuth + API：不是所有人都对 MCP 买账 — 不稳定、功能有限、鉴权拉胯。值得在你的场景里重新评估。(528 likes) 链接
Claude Code 互动教程上线：通过动手练习学 Claude Code，不是读文档。这周功能大爆发，新用户正需要这个。(109 likes) 链接
AI Agent 能让自由软件重新崛起吗？：当 AI 能以接近零成本维护开源项目，让商业软件占主导的经济逻辑可能逆转。(73 likes) 链接

🎯 今日精选

OpenAI 把 Codex 做成插件塞进 Claude Code — 这步棋的真正意图：OpenAI 主动把自家产品做成竞争对手 CLI 里的插件，这不是大度，这是战略。赌的是：默认的 AI 工作空间比模型层更重要 — 谁拥有开发者的终端，谁就赢了，不管底下跑的是谁的模型权重。这和 Chrome 的逻辑一样：浏览器比搜索引擎重要，因为浏览器决定了默认搜索引擎是谁。如果 Claude Code 成为 AI 编程的默认终端，那 OpenAI 要么在里面占个位置，要么被完全边缘化。所以与其被排除在外，不如主动进去 — 用对抗性审查和代码抢救这些差异化功能争取开发者的注意力。这标志着 AI 工具竞争进入了新阶段：不再是"用我的模型还是你的"，而是"在谁的平台上用"。(2,764 likes | 203 RTs) 详情 →

下期见 ✌️