NewsletterBlogGlossary

中国 AI 军团全面出击,开源模型矩阵碾压式扩张

2026-03-02 至 2026-03-06

这一周属于中国 AI 公司。Qwen 一口气铺开四条产品线,Kimi 新模型下载量破百万,DeepSeek-R1 继续霸榜。当闭源实验室还在比单点跑分的时候,开源阵营已经开始比谁的生态更完整了。


1. Qwen3.5 全家桶:阿里不是在发模型,是在铺生态

阿里 Qwen 团队本周放了一个大招 — 不是一个模型,而是一整个模型家族。Qwen3.5-397B-A17B MoE 旗舰、Qwen3.5-35B-A3B 轻量多模态版、专攻代码的 Coder-Next、还有一个 TTS 语音模型。四条线同时推进,覆盖文本、视觉、代码、语音。(1,152 likes | 103 万下载)

这个发布策略值得注意。Qwen 不再追求"一个模型打天下",而是像搭积木一样构建模型矩阵 — 大的给云端推理,小的给端侧部署,专用的给垂直场景。35B-A3B 的 MoE 架构尤其聪明:总参数 35B 但激活仅 3B,意味着消费级显卡就能跑,同时多模态能力(图文理解)直接内置。(846 likes | 68 万下载)

为什么重要: 这不只是模型发布,这是平台战略。当你的生态能覆盖开发者从原型到上线的全部需求,迁移成本就变成了护城河。Qwen 正在成为中文开源 AI 的"默认选项"。

接下来看什么: Coder-Next 的实际编码跑分。如果代码能力追上 DeepSeek-Coder 的水准,Qwen 就补上了生态里最后一块短板。

详情 ->


2. Kimi-K2.5:月之暗面的多模态突围

月之暗面(Moonshot AI)Kimi-K2.5 本周在 HuggingFace 上爆发,下载量达到 171 万,点赞 2200+,成为本周平台上最受关注的新模型之一。(2,200 likes | 171 万下载)

Kimi 这次走的是多模态路线。K2.5 不只是文本模型加个视觉模块的缝合怪 — 从架构层面就是原生多模态设计。社区反馈显示,图表理解、文档解析、多步视觉推理这几个场景表现亮眼,正好是企业落地最刚需的能力。

为什么重要: 月之暗面一直被外界定义为"长上下文玩家",K2.5 标志着他们在主动拓宽能力边界。更关键的是,171 万的下载量说明开发者在用脚投票 — 开源社区对中国多模态模型的接受度比很多人想象的高得多。

接下来看什么: 企业级 API 定价和部署方案。模型开源只是第一步,能不能把社区热度转化成商业收入才是月之暗面下半年的关键考题。

详情 ->


3. DeepSeek-R1 持续霸榜:推理模型的长尾效应

DeepSeek-R1 发布已经有一段时间了,但本周依然以 13,096 likes 和 92.8 万下载稳坐 HuggingFace 榜首。一个"老"模型还能持续吸引这个量级的流量,这本身就是信号。(13,096 likes | 92.8 万下载)

R1 的持续热度背后有两个驱动力。第一,推理能力(reasoning)正在从"加分项"变成"必选项" — 越来越多的 Agent 框架和 RAG 管线发现,换上推理模型后端到端效果直接跳一个台阶。第二,R1 的开源协议和部署友好度让它成了很多公司微调的首选底座,围绕它的工具链和社区资源已经形成了滚雪球效应。

为什么重要: 模型竞争不只是发布日的跑分比拼。R1 证明了一件事 — 在开源世界里,生态黏性比性能领先更持久。即便 Qwen3.5 和 Kimi-K2.5 在某些维度已经追上甚至超过 R1,开发者的迁移惯性是真实存在的。

接下来看什么: DeepSeek 下一代推理模型的时间表。R1 的社区地位给了他们充足的时间窗口,但 Qwen 和 Kimi 的追赶速度不容忽视。

详情 ->


4. 中国开源三强格局初现:DeepSeek、Qwen、Kimi

把前三个故事放在一起看,画面就清晰了:中国开源 AI 的三足鼎立格局正在成型。

DeepSeek 占据推理高地,R1 系列是行业公认的推理模型标杆。Qwen 走全家桶路线,从文本到视觉到代码到语音全覆盖,要做中文 AI 的"一站式供应商"。Kimi 在多模态方向发力,K2.5 的社区反响证明它有能力在特定维度做到最好。

三家的竞争策略各不相同,但有一个共同点:全部选择了开源。 这不是巧合。在中国市场,开源不只是社区贡献精神,更是获客策略 — 用免费模型建立开发者黏性,再通过 API 服务和企业方案变现。

为什么重要: 半年前还在讨论"中国 AI 能不能追上 OpenAI"。现在这个问题已经过时了。真正的问题是:当三家中国公司同时在开源领域全速推进,闭源模型的溢价还能维持多久?对开发者来说,这是最好的时代 — 选择多、质量高、成本低。

接下来看什么: 三家的商业化路径分化。技术竞争已经白热化,2026 下半年的关键词是"谁先跑通收入模型"。


5. TensorFlow 回归热榜:老兵不死,只是在等风口

一个意想不到的名字出现在本周 GitHub 趋势榜:TensorFlow。Google 的老牌框架以 19.4 万 stars 重新登上 ML 热门榜。(193,955 stars)

这不是怀旧情绪。TensorFlow 近期在边缘部署和生产推理场景持续发力,TF Lite 和 TF Serving 的更新节奏明显加快。当 PyTorch 统治了研究和训练领域之后,TensorFlow 找到了自己的生态位 — 大规模生产环境的推理部署。特别是在移动端和 IoT 场景,TensorFlow 的工具链成熟度依然领先。

为什么重要: AI 行业正在从"训练为王"转向"部署为王"。当每家公司都在想怎么把模型塞进产品里的时候,部署侧的基础设施重新获得关注是必然的。TensorFlow 的回归热度折射出行业重心的转移。

接下来看什么: Google I/O 上 TensorFlow 和 Gemini 生态的整合方案。如果 Google 能把 TF Serving 和 Gemini API 无缝打通,对企业部署会是个有吸引力的组合。

详情 ->


速览

  • Qwen3.5 Coder-Next:Qwen 家族的代码专用模型,MoE 架构,早期测试显示在中文代码生成场景表现突出。做国内项目的开发者值得关注。 链接
  • Qwen3.5 TTS:阿里同步放出的语音合成模型,中文自然度评分据称达到新高。语音 AI 创业者的新基线。 链接
  • HuggingFace 本周趋势:中国模型占据下载量 Top 5 中的三席。开源 AI 的重心正在肉眼可见地东移。 链接

本周 AI 要闻就到这里。订阅 AI News 获取每日速递。