Claude Code 能看你的屏幕、点你的 UI、验证自己写的代码了
🧠 发布动态
Claude Code 能看你的屏幕、点你的 UI、验证自己写的代码了。
这不是"加了个截图功能" — Claude 现在可以直接打开你的应用、点击界面元素、测试它刚生成的代码,整个循环在 CLI 里闭合。代码写完 → 打开浏览器 → 看渲染结果 → 发现问题 → 回来改,全自动。Research preview 阶段,Pro 和 Max 用户可用,通过 /mcp 启用。这是 Claude Code 近几周最大的功能升级,Agent 从"只会敲键盘"进化到了"有眼睛有手"。(40,041 likes | 3,024 RTs) 详情 →
Claude Code Auto Mode 向企业用户和 API 用户开放。
多步任务不用逐步审批了 — Auto Mode 让 Claude Code 自主执行完整任务链,中间不停下来问你"可以吗"。对信任 Agent 循环的团队来说,这是工作流提速的关键一步。更新安装后 claude --enable-auto-mode 即可体验。(2,521 likes | 166 RTs) 详情 →
Qwen3.5-9B-Uncensored 成了本地模型圈的新宠。 9B 参数、无审查、本地可跑 — 对需要不受限输出的研究和创意场景,这是目前最热门的选择。开源社区下载量飙升,如果你在做本地部署方案,值得测一测。(2,570 likes | 236 RTs) 详情 →
Mistral 一口气亮出 Voxtral TTS、Forge 平台和 Mistral 4 路线图。 Latent Space 对 Mistral 核心团队的深度访谈,覆盖语音合成策略、新开发平台 Forge、以及 Mistral 4 的方向。欧洲唯一持续交付 frontier 模型的实验室,动向值得跟。 详情 →
🔧 开发者工具
OpenAI 的 Codex 现在能在 Claude Code 里跑了。
你没看错 — /plugin marketplace add openai/codex-plugin-cc,然后你就能在 Claude Code 里用 /codex:review(代码审查)、/codex:adversarial-review(对抗性审查)、/codex:rescue(代码抢救)。OpenAI 把自家模型做成插件塞进竞争对手的 CLI 里,这不是慷慨,这是赌注 — 赌的是"谁的模型跑不重要,开发者在哪个终端里工作才重要"。AI 工具正在从孤岛走向互操作。(2,764 likes | 203 RTs) 详情 →
延伸阅读:想了解 Codex 的定位和演进?→ Codex 是什么
ARC — 任何本地 AI Agent 的浏览器控制台。 在工作站上启动 Agent 任务,然后用手机、平板、任何浏览器远程监控和交互。开源,原生支持 Nous Hermes。解决了"Agent 在我台式机上跑,但我人在外面"的痛点。(83 likes) 详情 →
Unusual Whales 发布 MCP Server,实时金融数据直通 AI Agent。 期权流、股票行情、预测市场数据 — 通过 MCP 协议流式接入任何 AI 助手。对做金融分析的开发者来说,这是让 AI 助手真正有用的那种实时数据集成。(321 likes) 详情 →
HuggingFace 把 arXiv 变成了 Agent 可读的研究基础设施。 hf papers [search, read] 让 AI Agent 可以程序化地搜索和阅读论文 — 结构化输出,不用再自己爬 PDF 解析。做研究向 Agent 工作流的,这是必备工具。(783 likes | 95 RTs) 详情 →
📝 技术实战
一位 Anthropic 工程师分享了你大概率没用过的 Claude Code 功能。
20K 点赞说明了一切 — 大多数人可能只用了 Claude Code 30% 的能力。这个帖子覆盖了隐藏功能和低估技巧,从工作流快捷方式到调试模式,每一条都值得试。(19,827 likes | 2,088 RTs) 详情 →
延伸阅读:想系统了解 Claude Code 能做什么?→ Claude Code 不只是编程工具
Perplexity 分享了大规模语音 Agent 的生产经验。 用 OpenAI Realtime API 跑语音 Agent 的实战教训 — 上下文管理、音频管道架构、轮次切换(turn-taking)模式。这不是 demo 级别的分享,是真正在生产环境里踩过坑的团队写的。(260 likes) 详情 →
每天 20 万+ vibe coding 项目被创建,几乎没有一个找到用户。 Vibe coding 时代的分发问题比创建问题大得多。这个帖子列了 7 个实际可用的分发策略,包括用 MCP Server 当分发渠道和程序化 SEO 模式。造东西容易,让人用才难。(492 likes) 详情 →
🔬 研究前沿
两项随机对照实验证实:AI 当导师有用,AI 当捷径有害。 同样的技术,结果截然相反 — 区别完全在于 AI 被如何配置。不限制地让学生使用 AI,他们会无意中跳过学习过程;但把 AI 提示为苏格拉底式导师,学习效果显著提升。做教育产品的,prompt 设计就是产品设计。(363 likes | 55 RTs) 详情 →
AI 如何重塑数学推理与人类认知。 一篇严肃的学术论文,分析当机器接管计算层后,人类的数学思维发生了什么变化。不是炒作,而是结构化地讨论人机认知协作的框架。想深入理解"AI 改变了我们怎么想"的,推荐读原文。(190 likes | 74 RTs) 详情 →
💡 行业洞察
Anthropic 承认 Claude Code 用户撞限速比预期快得多。 很可能是 computer use 和 auto mode 同时上线导致需求暴涨。如果你的工作流重度依赖 Claude Code,短期内要做好被限流的准备,重度任务尽量错峰。(8,237 likes | 405 RTs) 详情 →
Redpoint 数据:46% 的企业 CIO 愿意用 AI 原生创业公司替换现有供应商。 这个数字远高于预期。Redpoint 甚至发布了一份"值得用 AI 从头重做"的 SaaS 企业排名。企业级软件的替换窗口正在打开,如果你有垂直领域经验,现在是动手的时候。(416 likes) 详情 →
工程师职业阶梯的中间几级正在消失。 当 AI 接手了中级工程师的日常任务,传统的晋升路径断裂了 — 初级没法通过"做中级的活"来成长,高级面临完全不同的技能要求。带团队的管理者,是时候重新设计成长路径了。(68 likes) 详情 →
🏗️ 值得一试
本地模型硬件对照指南:8GB 到 64GB 怎么选。 HuggingFace 整理的实用硬件-模型映射表 — 64GB 跑什么、32GB 跑什么、16GB 跑什么、8GB 还能跑什么,附具体模型推荐(包括 Qwen3-coder 配 Claude Code)。收藏当购物清单。(3,131 likes | 228 RTs) 详情 →
Sebastian Raschka 的《从零构建推理模型》全部章节上线。 继《从零构建 LLM》之后,Raschka 的新书覆盖链式思维(Chain-of-Thought)和推理能力的底层实现。想真正理解推理模型怎么工作而不只是调 API 的,这可能是目前最好的动手教程。(2,425 likes | 246 RTs) 详情 →
🎓 模型小课堂
GUI Agent(计算机视觉操控):传统的 AI 编程助手只能通过 API 和文本跟你的代码交互 — 它"看不见"你的屏幕。GUI Agent 不一样,它能像人一样看到屏幕上的像素、识别按钮和输入框、然后点击操作。Claude Code 这次上线的 computer use 就是这个能力 — Agent 写完代码后可以打开浏览器,看到渲染结果,发现 UI 问题再回去改。核心区别在于:API Agent 操作的是结构化数据(DOM、JSON),GUI Agent 操作的是视觉信息(像素、截图)。前者快但只能处理有接口的东西,后者慢但什么都能操作。知道这个区别,你就能判断什么场景用 computer use 有价值,什么场景纯属浪费 token。
⚡ 快讯
- Mollick:金融市场会最先感受到超人 AI:逻辑很简单 — 金融是纯智力直接兑换价值最快的领域。(1,544 likes) 链接
- 反向观点:MCP 正在死亡,团队在回归 OAuth + API:不是所有人都对 MCP 买账 — 不稳定、功能有限、鉴权拉胯。值得在你的场景里重新评估。(528 likes) 链接
- Claude Code 互动教程上线:通过动手练习学 Claude Code,不是读文档。这周功能大爆发,新用户正需要这个。(109 likes) 链接
- AI Agent 能让自由软件重新崛起吗?:当 AI 能以接近零成本维护开源项目,让商业软件占主导的经济逻辑可能逆转。(73 likes) 链接
🎯 今日精选
OpenAI 把 Codex 做成插件塞进 Claude Code — 这步棋的真正意图:OpenAI 主动把自家产品做成竞争对手 CLI 里的插件,这不是大度,这是战略。赌的是:默认的 AI 工作空间比模型层更重要 — 谁拥有开发者的终端,谁就赢了,不管底下跑的是谁的模型权重。这和 Chrome 的逻辑一样:浏览器比搜索引擎重要,因为浏览器决定了默认搜索引擎是谁。如果 Claude Code 成为 AI 编程的默认终端,那 OpenAI 要么在里面占个位置,要么被完全边缘化。所以与其被排除在外,不如主动进去 — 用对抗性审查和代码抢救这些差异化功能争取开发者的注意力。这标志着 AI 工具竞争进入了新阶段:不再是"用我的模型还是你的",而是"在谁的平台上用"。(2,764 likes | 203 RTs) 详情 →
下期见 ✌️