GPT-5.4 登场,原生支持 Computer Use
2026年3月9日星期一
今日 AI 圈 3 条值得关注的动态。
今日看点:GPT-5.4 原生支持 Computer Use、字节 AI 野心遇算力和版权夹击、五角大楼标记 Anthropic。
🧠 发布动态
GPT-5.4 登场,OpenAI 第一次原生支持 Computer Use。
这不只是又一个模型升级 — GPT-5.4 融合了 Codex 的代码能力和思维链推理,上下文翻倍到 100 万 token,还加了"极限推理"模式。最关键的是原生 Computer Use:AI 可以直接操作你的电脑,跨应用完成任务。OpenAI 的意图很明确 — 不只是聊天助手,而是能替你干活的自主 Agent。GDPval 跑分大幅提升,Sam Altman 直接转发说"看不到天花板"。(2,377 likes | 234 RTs) 详情 →
GPT-5.4 的 Computer Use 表现惊艳。 早期测试者的反馈很一致:Computer Use 能力"ridiculously good"。对开发者来说,这意味着基于屏幕操作的 Agent 工作流不再只是 Anthropic 的专利,竞争格局正在改变。(156 likes | 7 RTs) 详情 →
Anthropic 这边也没闲着。 有员工发推"今天为在 Anthropic 工作感到骄傲" — 结合最近 Claude Opus 4.6 的发布节奏,两家的正面交锋只会越来越密集。开发者最好两边都跟紧。(2,675 likes | 74 RTs) 详情 →
🔧 开发者工具
Claude Code Remote Control 上线:在手机上继续你的 Claude Code 会话 — 跑 /remote-control 就能远程接管正在运行的编码任务。对于那些下班路上还想盯着 Agent 跑长任务的开发者,这个功能太实用了。(647 likes | 30 RTs) 详情 →
Claude Code 一波 UX 改进:Shell 模式支持 Tab 自动补全、macOS 原生通知提醒、长时间 MCP 工具调用显示进度条、Plan 模式支持外部编辑器编辑。都是小改进,但日常使用体验提升明显。(26 likes | 4 RTs) 详情 →
Langflow 冲到 14.5 万 Star:构建和部署 AI Agent 工作流的可视化平台,持续占据 GitHub trending。如果你还在用代码硬写 Agent 编排逻辑,可以考虑试试这种低代码方案。(145,291 likes) 详情 →
Dify 持续领跑 Agent 平台赛道:13 万+ Star,定位"生产级 Agent 工作流开发平台"。和 Langflow 的区别在于更偏向企业场景和多模型编排。两个都值得关注。(131,361 likes) 详情 →
📝 技术实战
AI 编码 Agent 能通过"洁净室"实现给开源代码换协议吗? Simon Willison 抛出一个尖锐问题:如果 AI Agent 从零重写了一个开源库的功能,算不算"洁净室实现"?能不能因此换用更宽松的协议?这个问题在法律上还没有答案,但随着 Agent 代码生成能力越来越强,它迟早要被正面回答。所有依赖开源组件的项目都该关注。详情 →
🔬 研究前沿
FiftyOne:高质量数据集和视觉 AI 的瑞士军刀:Voxel51 的开源工具持续登上 GitHub trending,专注数据集管理、标注质量检查和视觉模型调优。做 CV 项目的,这个工具能帮你在数据层面省大量时间。(10,424 likes) 详情 →
Qwen3.5-9B 无审查版本上线 HuggingFace:社区用户发布了基于 Qwen 3.5 9B 的无限制微调版本,下载量已破万。国产模型的开源生态正在被社区推向更多元的方向。(75 likes | 10.1K downloads) 详情 →
💡 行业洞察
字节跳动的 AI 野心被算力和版权两面夹击。
Seedance 2.0 AI 视频模型发布后看似势不可挡,但很快暴露两个致命短板:用户涌入导致算力扛不住,版权投诉也开始堆积。对中国 AI 公司来说,这是个典型缩影 — 模型能力到了,但基础设施和合规跟不上。尤其是算力限制,在出口管制的大背景下,这个瓶颈短期内很难突破。详情 →
摩根大通 AI 投入加速,技术预算逼近 200 亿美元:AI 正从"试点项目"变成大企业的核心业务系统。摩根大通 2026 年技术预算约 198 亿美元,其中 AI 占比持续攀升。这不是个案 — 金融行业正在从"看 AI demo"转向"AI 进生产"。详情 →
Dyna.Ai 拿下八位数 A 轮,专攻金融 Agent:新加坡公司 Dyna.Ai 拿到大额融资,目标是解决金融行业 AI"只做 POC 不进生产"的老问题。AI-as-a-Service 模式在金融领域越来越有市场。详情 →
🏗️ 值得一试
Kedro:给数据科学加上软件工程的纪律:QuantumBlack(麦肯锡旗下)开源的数据管线框架,用软件工程最佳实践管理数据科学工作流 — 可复现、可维护、模块化。如果你的 ML pipeline 已经变成一坨 notebook,Kedro 能帮你理清楚。(10,775 likes) 详情 →
🎓 模型小课堂
Computer Use(计算机操控):传统 AI 只能在聊天框里回答问题,Computer Use 让 AI 直接操作你的电脑 — 移动鼠标、点击按钮、输入文字、切换应用。它通过截屏"看"屏幕内容,然后决定下一步操作,就像一个远程控制你电脑的助手。这项能力是实现真正自主 Agent 的关键一步 — AI 不再局限于 API 调用,而是能像人一样在任意软件界面上完成任务。
⚡ 快讯
- Anthropic 招 Multi-Agent 团队工程师:如果你在 LLM 上有可量化的性能提升经验,机会来了。(596 likes | 31 RTs) 链接
- OpenAI 曾禁止军事用途,五角大楼通过微软绕道测试:Wired 曝光国防部在 OpenAI 解禁军事应用前就已通过微软渠道使用其技术。 链接
🎯 今日精选
GPT-5.4 标志着 AI 竞赛进入 Agent 主战场:OpenAI 这次不只是刷跑分 — 原生 Computer Use、100 万 token 上下文、极限推理模式,每一项都指向同一个方向:自主 Agent。和 Anthropic 的 Claude Computer Use 正面碰上了。但两家的路线有微妙差异:Anthropic 更强调安全可控的 Agent Teams 协作,OpenAI 则激进地推"AI 替你操作电脑"。对开发者来说,选边站为时尚早,但现在就该开始在两个平台上试验 Agent 工作流 — 谁的生态更适合你的场景,用了才知道。竞争越激烈,开发者手里的筹码越多。详情 →
下期见 ✌️