NewsletterBlogLearnCompareTopicsGlossary
English
INSIGHTRESEARCHTECHNIQUETOOLLAUNCHBUILD

24 条资讯

MiniMax M3 开源 428B 参数 MoE,只激活 23B

🧠 发布动态

MiniMax M3 开源 428B 参数 MoE,只激活 23B。

你没看错 — 428B 总参数,每个 token 只激活 23B。MiniMax 把这个庞然大物直接扔上了 HuggingFace,开源可用。效率什么概念?参数量是 Llama 3.1 405B 的量级,推理成本却只有零头。HuggingFace Transformers v5.12 已经同步支持,pip install --upgrade transformers 就能跑。对于想在本地部署大模型又不想烧卡的团队,这可能是目前性价比最高的选择。(2,123 likes | 248 RTs) 详情 →

Moonshot AI 开源 Kimi K2.7 Code。 月之暗面的专用代码模型来了 — 开源阵营的编码模型赛道又多一个选手,和 Cohere、小米的方案正面竞争。中国 AI 实验室在开源代码模型上的投入越来越凶,开发者的选择也越来越多。(331 likes) 详情 →

Google Project Genie 全球开放。 谷歌最高端 AI 能力层 — Project Genie — 面向 Ultra 5X 订阅用户全球上线。这个分层策略跟 Anthropic 的高级能力分级一个思路:最强的模型能力,只给付费最多的用户。(688 likes | 100 RTs) 详情 →


🔧 开发者工具

Codex 接入 Chrome DevTools Protocol — Agent 能真正调试前端了。

OpenAI 给 Codex 加了个杀手级功能:直接通过 Chrome DevTools Protocol 做 JavaScript 性能分析、网络请求调试、页面状态检查。这不是"帮你写 CSS"级别的 AI 辅助 — 而是 Agent 可以像你打开 F12 一样看到浏览器里发生的一切。前端开发者,拿一个真实的调试场景试试。(2,825 likes | 192 RTs) 详情 →

GitHub Copilot Code Review 支持 MCP 和自定义 Agent 技能。 Public preview 阶段。意味着你可以把公司内部的代码规范、安全检查工具直接接入 PR review 流程 — 对企业团队来说,这是 Copilot 从"通用助手"变成"懂你团队规矩的 reviewer"的关键一步。(122 likes | 14 RTs) 详情 →

Claude Code 一天发三个版本。 v2.1.174 到 v2.1.176,会话标题本地化、Bedrock 凭证缓存、滚动加速控制、模型选择器修复 — Fable 发布后 Anthropic 的迭代节奏肉眼可见地加快了。claude update 走起。详情 →

Transformers v5.12 当天支持 MiniMax M3 视觉语言版。 MiniMax M3 上午发布,HuggingFace 下午就 ship 了原生支持 — 包括 CLIP 视觉塔和 3D 旋转位置编码。开源生态的速度:从模型发布到 pip install 可用,几个小时。详情 →


📝 技术实战

Simon Willison 从 Fable 怀疑论者变成了"真香党"。

上周还在挑 Fable 5 毛病的 Simon Willison,用了两天后的评价是"relentlessly proactive(主动到令人发指)"。他分享了一个例子:给 Fable 一张截图,它自动启了个自定义 CORS Python 服务器来调试。从批评者到印象深刻的用户 — 这个转变本身就是信号。试试用截图驱动 Fable 调试 bug。(667 likes | 44 RTs) 详情 →

如何管理 Fable 在长对话中的"信息轰炸"。 Anthropic 开发者关系负责人 Alex Albert 分享了一个实用技巧:在长 Agent 会话中,Fable 的输出量可能多到你跟不上。他给了一个具体的 prompt 片段来控制输出节奏 — 加到你的 CLAUDE.md 里。(676 likes) 详情 →


🔬 研究前沿

Fable 5 在 FrontierMath 拿下 87-88% — 它甚至不是推理专用模型。

Epoch AI 的独立数学基准测试确认:Fable 5 在 Tier 1-3 达到 87%,Tier 4 达到 88%。关键在于 — Fable 不是像 o3 那样专门优化推理的模型,但数学能力已经到了这个水平。如果你的应用涉及数学推理,现在有了一个不牺牲通用能力的选择。(684 likes | 93 RTs) 详情 →

通用大模型全面碾压专用临床 AI。 一篇论文显示,frontier LLM(大语言模型)在所有三项评测中都打败了专门为医疗场景构建的 AI 工具。启示很残酷:如果你在用 2024 年架构构建的垂直 AI 产品,通用模型可能已经比你强了。该重新评估技术栈了。(315 likes | 33 RTs) 详情 →

微软研究院发布 Arbor — 通用自主研究 Agent。 Arbor 用持久化假设树(hypothesis tree)做自主研究,不是线性的 Agent 链条,而是可以分支、回溯、持续精炼的树状结构。微软出手做通用研究 Agent,说明业界已经在从"任务型 Agent"向"研究型 Agent"升级。(220 likes | 37 RTs) 详情 →


💡 行业洞察

48 小时 Fable 5 社区作品展 — 跑分测不出来的东西。

Claude 官方账号整理了 Fable 5 发布 48 小时内社区构建的项目集锦。跑分告诉你模型"能做什么",但社区项目告诉你"人们真的在用它做什么"。刷一遍这个帖子,找找灵感。(29,885 likes | 1,596 RTs) 详情 →

LeCun 开炮:Amodei 的 AI 治理方案就是要干掉开源。 Yann LeCun 对 Dario Amodei 的 AI 政策文章发出了迄今最尖锐的批评 — "先宣布 AI 太危险不能竞争,再提出一个只有你家实验室能活下来的监管方案"。不管你站哪边,这场辩论的实质已经从"安全 vs 开放"变成了"市场结构之争"。在选边站之前,两边的论述都该读。(1,985 likes | 167 RTs) 详情 →

TCS 联手 Anthropic,Claude 进军银行和政府。 TCS 是全球最大的 IT 服务公司之一,这次合作给了 Claude 一条直通银行、保险、政府机构的通道。加上昨天的 DXC 联盟,Anthropic 正在系统性地锁定企业咨询层。对于受监管行业的技术团队 — 是时候评估 Claude 了。详情 →

Anthropic 发布首份"公共记录" — Chris Olah 谈教皇的 AI 通谕。 一种新的透明度实验:Anthropic 的 Chris Olah 对教皇的 AI 伦理通谕发表评论,以"公共记录"形式发布。AI 安全与更广泛的社会话语结合 — 这个方向值得关注。详情 →

Richard Socher 声称 Recursive 实现了 AI 自我改进研究。 AI 做 AI 研究 — Agent 在做让 Agent 更好的研究。不管你信不信这个说法,严肃的研究者公开宣称这件事,本身就说明 frontier 实验室认为自己离这个目标已经很近了。等独立验证。(578 likes | 83 RTs) 详情 →


🏗️ 值得一试

Extend CLI 开源文档解析。 从终端直接做文档解析和提取,自带 Agent 技能 — Claude Code 和 Codex 可以原生调用。CLI 工具出厂自带 Agent 技能正在成为标准模式,这就是工具生态适应 Agent 工作流的方式。npm install -g @extend-ai/cli。(128 likes | 14 RTs) 详情 →

architect-loop:Fable 做架构师,Codex 做码农。 一个跨供应商的 Agent 协作工具 — 让 Fable 5 做架构决策,把编码任务路由给 GPT-5.5 Codex。这是第一个把"模型套利"(用不同模型做不同层次工作)落地到实用开发工具的实现。Claude Code 技能,直接安装可用。(77 likes | 5 RTs) 详情 →

手把手:在 macOS 上搭建本地编码 Agent。 HN 热帖,226 赞。填补了"编码 Agent 存在"和"具体怎么在自己电脑上跑起来"之间的空白。从零到可用,一步步来。(226 likes | 68 RTs) 详情 →


🎓 模型小课堂

混合专家模型(MoE)— 总参数 vs 激活参数:MiniMax M3 有 428B 总参数,但每个 token 只激活 23B — 这就是 MoE(Mixture of Experts)的魔法。想象一个公司有 400 名员工,但每个项目只需要 23 人参与。模型把参数分成很多"专家组",每次推理时只调用最相关的几组。这就是为什么 M3 可以很大却不贵 — 参数量决定模型"知道多少",激活量决定"每次推理花多少钱"。以后看模型别只看总参数了,激活参数才是你真正要付费的部分。


⚡ 快讯

  • MiniMax M3 权重上线 HuggingFace:428B/23B-active MoE,245 likes,已可下载。(245 likes | 442 downloads) 链接
  • Google 一周 AI 汇总:Live Translate GA、NotebookLM 升级 Agent 对话、Genie 全球扩展。(466 likes | 34 RTs) 链接
  • OpenAI API 平台加入 ⌘K 搜索:跨页面、设置和文档的快速搜索。(814 likes | 52 RTs) 链接
  • Ollama v0.30.8:prompt 缓存优化,MLX 推理稳定性提升,本地跑模型的更新一下。链接

🎯 今日精选

LeCun vs Amodei — 当最大声的安全倡导者提出只有自己能活的治理方案,"安全 vs 开放"的本质就暴露了。 Dario Amodei 写了篇长文论述 AI 治理,核心主张是 frontier 模型需要严格监管。LeCun 的反驳一针见血:"先把 AI 说成太危险不能自由竞争,再提出一个只有你家实验室能通过审批的监管框架。" 这场辩论表面上是安全之争,实质上是市场结构之争。对开发者来说,关键问题不是"谁更关心安全",而是"什么样的治理框架既保护公众又不扼杀创新"。MiniMax M3 今天的开源发布就是最好的注脚 — 428B 参数的模型说开源就开源了,这在 Amodei 的治理框架下还能存在吗?在你选边站之前,先问自己:你支持的"安全"方案,是真的在保护公众,还是在保护某几家公司的市场地位?(1,985 likes | 167 RTs) 详情 →


下期见 ✌️