GPT-5.4 登场，原生支持 Computer Use

2026年3月9日星期一

今日 AI 圈 3 条值得关注的动态。

今日看点：GPT-5.4 原生支持 Computer Use、字节 AI 野心遇算力和版权夹击、五角大楼标记 Anthropic。

🧠 发布动态

GPT-5.4 登场，OpenAI 第一次原生支持 Computer Use。

这不只是又一个模型升级 — GPT-5.4 融合了 Codex 的代码能力和思维链推理，上下文翻倍到 100 万 token，还加了"极限推理"模式。最关键的是原生 Computer Use：AI 可以直接操作你的电脑，跨应用完成任务。OpenAI 的意图很明确 — 不只是聊天助手，而是能替你干活的自主 Agent。GDPval 跑分大幅提升，Sam Altman 直接转发说"看不到天花板"。(2,377 likes | 234 RTs) 详情 →

GPT-5.4 的 Computer Use 表现惊艳。 早期测试者的反馈很一致：Computer Use 能力"ridiculously good"。对开发者来说，这意味着基于屏幕操作的 Agent 工作流不再只是 Anthropic 的专利，竞争格局正在改变。(156 likes | 7 RTs) 详情 →

Anthropic 这边也没闲着。 有员工发推"今天为在 Anthropic 工作感到骄傲" — 结合最近 Claude Opus 4.6 的发布节奏，两家的正面交锋只会越来越密集。开发者最好两边都跟紧。(2,675 likes | 74 RTs) 详情 →

🔧 开发者工具

Claude Code Remote Control 上线：在手机上继续你的 Claude Code 会话 — 跑 /remote-control 就能远程接管正在运行的编码任务。对于那些下班路上还想盯着 Agent 跑长任务的开发者，这个功能太实用了。(647 likes | 30 RTs) 详情 →

Claude Code 一波 UX 改进：Shell 模式支持 Tab 自动补全、macOS 原生通知提醒、长时间 MCP 工具调用显示进度条、Plan 模式支持外部编辑器编辑。都是小改进，但日常使用体验提升明显。(26 likes | 4 RTs) 详情 →

Langflow 冲到 14.5 万 Star：构建和部署 AI Agent 工作流的可视化平台，持续占据 GitHub trending。如果你还在用代码硬写 Agent 编排逻辑，可以考虑试试这种低代码方案。(145,291 likes) 详情 →

Dify 持续领跑 Agent 平台赛道：13 万+ Star，定位"生产级 Agent 工作流开发平台"。和 Langflow 的区别在于更偏向企业场景和多模型编排。两个都值得关注。(131,361 likes) 详情 →

📝 技术实战

AI 编码 Agent 能通过"洁净室"实现给开源代码换协议吗？ Simon Willison 抛出一个尖锐问题：如果 AI Agent 从零重写了一个开源库的功能，算不算"洁净室实现"？能不能因此换用更宽松的协议？这个问题在法律上还没有答案，但随着 Agent 代码生成能力越来越强，它迟早要被正面回答。所有依赖开源组件的项目都该关注。详情 →

🔬 研究前沿

FiftyOne：高质量数据集和视觉 AI 的瑞士军刀：Voxel51 的开源工具持续登上 GitHub trending，专注数据集管理、标注质量检查和视觉模型调优。做 CV 项目的，这个工具能帮你在数据层面省大量时间。(10,424 likes) 详情 →

Qwen3.5-9B 无审查版本上线 HuggingFace：社区用户发布了基于 Qwen 3.5 9B 的无限制微调版本，下载量已破万。国产模型的开源生态正在被社区推向更多元的方向。(75 likes | 10.1K downloads) 详情 →

💡 行业洞察

字节跳动的 AI 野心被算力和版权两面夹击。

Seedance 2.0 AI 视频模型发布后看似势不可挡，但很快暴露两个致命短板：用户涌入导致算力扛不住，版权投诉也开始堆积。对中国 AI 公司来说，这是个典型缩影 — 模型能力到了，但基础设施和合规跟不上。尤其是算力限制，在出口管制的大背景下，这个瓶颈短期内很难突破。详情 →

摩根大通 AI 投入加速，技术预算逼近 200 亿美元：AI 正从"试点项目"变成大企业的核心业务系统。摩根大通 2026 年技术预算约 198 亿美元，其中 AI 占比持续攀升。这不是个案 — 金融行业正在从"看 AI demo"转向"AI 进生产"。详情 →

Dyna.Ai 拿下八位数 A 轮，专攻金融 Agent：新加坡公司 Dyna.Ai 拿到大额融资，目标是解决金融行业 AI"只做 POC 不进生产"的老问题。AI-as-a-Service 模式在金融领域越来越有市场。详情 →

🏗️ 值得一试

Kedro：给数据科学加上软件工程的纪律：QuantumBlack（麦肯锡旗下）开源的数据管线框架，用软件工程最佳实践管理数据科学工作流 — 可复现、可维护、模块化。如果你的 ML pipeline 已经变成一坨 notebook，Kedro 能帮你理清楚。(10,775 likes) 详情 →

🎓 模型小课堂

Computer Use（计算机操控）：传统 AI 只能在聊天框里回答问题，Computer Use 让 AI 直接操作你的电脑 — 移动鼠标、点击按钮、输入文字、切换应用。它通过截屏"看"屏幕内容，然后决定下一步操作，就像一个远程控制你电脑的助手。这项能力是实现真正自主 Agent 的关键一步 — AI 不再局限于 API 调用，而是能像人一样在任意软件界面上完成任务。

⚡ 快讯

Anthropic 招 Multi-Agent 团队工程师：如果你在 LLM 上有可量化的性能提升经验，机会来了。(596 likes | 31 RTs) 链接
OpenAI 曾禁止军事用途，五角大楼通过微软绕道测试：Wired 曝光国防部在 OpenAI 解禁军事应用前就已通过微软渠道使用其技术。链接

🎯 今日精选

GPT-5.4 标志着 AI 竞赛进入 Agent 主战场：OpenAI 这次不只是刷跑分 — 原生 Computer Use、100 万 token 上下文、极限推理模式，每一项都指向同一个方向：自主 Agent。和 Anthropic 的 Claude Computer Use 正面碰上了。但两家的路线有微妙差异：Anthropic 更强调安全可控的 Agent Teams 协作，OpenAI 则激进地推"AI 替你操作电脑"。对开发者来说，选边站为时尚早，但现在就该开始在两个平台上试验 Agent 工作流 — 谁的生态更适合你的场景，用了才知道。竞争越激烈，开发者手里的筹码越多。详情 →

下期见 ✌️