中国 AI 模型名单(每周更新)

一份面向构建者的中国 AI 模型家族与实验室追踪页,帮助你知道长期该盯谁、哪些变化值得本周动作

Thesis

跟踪中国 AI 模型最有用的方式,不是做一张巨大的 benchmark 排行表,而是维护一份紧凑、每周可复查的模型家族与实验室 watchlist。 这份清单的核心不是“谁第一”,而是“谁持续改变构建者的评估顺序、成本判断、接入路径或产品包装”。

20 秒判断

如果你的核心问题是:哪些中国 AI 模型与实验室应该长期留在 watchlist 里,这页就是入口。 先从 DeepSeek、Qwen、Kimi、MiniMax、ERNIE、Doubao、GLM、Hunyuan 开始,把这页当作结构化 tracker;再通过 GitHub、Hugging Face、技术报告和官方文档验证具体发布。若你的问题更宽,比如“中国 AI 的英文入口有哪些”,先去 中国 AI 英文信息源总览

适合谁

  • 构建者与产品经理:需要一份每周可复查的紧凑 watchlist,而不是一张巨大的市场图谱。
  • 英文优先的团队:想知道新闻周期过去后,哪些中国 AI 名字仍然值得继续盯。
  • 研究与评估型团队:需要一组值得定期检查 benchmark、接入与许可证变化的模型家族。

不适合谁

  • 想看统一排行榜的人:这页不是一个“谁最强”的单一排序。
  • 想看全量实验室地图的人:这页只保留对构建者决策最相关的家族。
  • 核心问题是来源选择或每周流程的人:那应该先去来源页或工作流页。

什么时候用这页

这页回答的是 tracker 问题:哪些中国 AI 模型和实验室应该留在我的每周观察名单里? 如果你的问题是 怎么做每周复查,请转到 如何用英文持续跟踪中国 AI。如果你的问题是 应该看哪些站点和来源类型,请看 值得加入观察清单的中国 AI 来源。如果你的问题更宽,还是“有哪些英文 tracker 和入口”,先去 中国 AI 英文信息源总览。如果你关心翻译延迟、实验室渠道差异等窄问题,则去看英文支撑文章。

中国 AI 模型名单最好的用法是什么?

最好的用法,是把它当作每周追踪层,而不是最终排名。保留一小组会持续影响你判断的模型家族和实验室,盯住它们的英文可访问发布渠道,在动作发生前核对 benchmark 来源、API 可用性和许可证。这样做比泛读 AI 新闻更有用,因为它能让 watchlist 保持小、保持新、并直接连接到验证步骤。

构建者到底该追哪些中国 AI 模型?

构建者应该长期追踪那些会反复改变评估队列、成本比较、接入选择或产品包装的模型家族,而不是每周只热闹一次的名字。对大多数团队来说,这意味着把 DeepSeek、Qwen、Kimi、MiniMax、GLM 和 Hunyuan 放进常驻 watchlist,再判断 ERNIE、Doubao 或 Tier 2 名字是否开始变得与决策强相关。一个好的 watchlist 必须足够小,能每周复查;又足够具体,能告诉你变了什么、从哪验证、是否应该动作。这页回答的是 谁该留下为什么;它不替代来源 shortlist,也不替代每周流程。

怎样用英文跟踪中国 AI 模型?

最稳的做法是:保留一个小而长期的 watchlist,而不是试图维护一张中国 AI 的全景地图。先从最可能改变构建者判断的家族开始,例如 DeepSeek、Qwen、Kimi、MiniMax、GLM、Hunyuan;再通过 GitHub、Hugging Face、官方文档、技术报告和发布页核实真正发了什么。然后只把那些影响 benchmark 信心、API 接入、许可证条款或产品包装的变化拉进本周复查。若你更关心翻译延迟或实验室渠道细节,请转到英文支撑文章;若你更关心流程,请转到工作流页。

怎么阅读这页

  • Current watchlist:告诉你哪些家族应该永久占一个每周复查槽位。
  • Trigger action:告诉你什么变化会把“注意到”升级成“本周要复查”。
  • Verification links:告诉你应该先去哪里核实。
  • Tier 2 names:提醒你哪些名字只有在范围扩大时才值得加入。

Current watchlist

模型或家族实验室 / 公司为什么应留在名单里什么变化会触发动作优先验证入口RadarAI 备注
DeepSeek-V3 / DeepSeek-R1DeepSeek经常重设开源模型的性价比对比和 benchmark 讨论顺序。新旗舰发布、benchmark 跨档提升、API 定价变化、许可证变化。GitHub、Hugging Face、技术报告、官方文档通常是最先改变构建者评估队列的中国模型家族之一。
Qwen 家族阿里云尺寸多、模态多、更新快,且英文资料与 OSS 分发完整。新分支、推理增强版、开源发布、接入变化。QwenLM GitHub、Hugging Face、官方文档、技术报告适合既看开放模型,也看英文发布规范度的团队。
Kimi 家族Moonshot AI更偏产品体验、推理交互和用户层面的信号。重大产品发布、推理体验提升、英文面向发布扩大。官方产品页、发布说明、研究文章、英文报道当你的问题偏产品体验而不是 repo 细节时尤其值得看。
MiniMax 家族MiniMax多模态包装、产品可用性和接入方式经常更重要。多模态发布、API 可用性变化、定价或包装变化。官方文档、发布页、研究文章、英文摘要适合评估“能否实际接入”,而不是只看某个 benchmark 分数。
ERNIE 家族百度企业包装、云分发与中国市场上下文常比纯模型热度更重要。企业版发布、API/云包装变化、区域接入信号。官方文档、百度智能云更新、产品页、英文报道当你的判断依赖企业包装、云接入或区域分发时很关键。
Doubao 家族字节跳动产品迭代快,生态位变化常先于 repo 叙事。重大产品功能发布、模型刷新、平台整合动作。官方产品页、研究文章、GitHub(如有)、英文摘要适合关注产品节奏和生态变化,而不只是单次技术发布。
GLM 家族智谱 AI在商业 API 选择里,是 DeepSeek/Qwen 之外很值得长期比较的一条线。新一代 GLM、API 扩张、企业合作信号。官方文档、发布说明、模型页、英文报道当团队比较商业 API 而不只是开源权重时,应尽早加入。
Hunyuan 家族腾讯云平台能力、企业分发和生态整合常是判断重点。云端发布、企业接入更新、显著多模态 / agent 能力进展。官方文档、腾讯云更新、产品页、英文摘要如果你在乎平台杠杆和企业分发,而不只是 benchmark 热点,这条线很重要。

Tier 2 名单:只有当范围扩大时再加

名称或家族为什么先放第二层什么时候再加进来
THUDM 研究线强研究信号,但不总是第一层构建者决策入口。当你更关心前沿研究 repo,而不是部署型产品选择时。
SenseNova对企业和多模态跟踪有价值,但对紧凑 watchlist 来说优先级稍低。当你需要更宽的企业 AI 供应商覆盖时。
Step 家族有势能,但不总是核心 top-8 家族。当它开始反复出现在产品相关或客户相关问题中。
Yi 家族历史上重要,也适合做部分开源对比,但越来越少改变本周决策。当你的 stack 或 benchmark 仍在对照旧一代开源基线时。

什么变化会触发本周动作

如果这里变了为什么重要下一步做什么
新旗舰模型或大版本可能改变 benchmark 对比、评估 backlog 或产品定位。先看技术报告或模型卡,再与你当前默认模型做对比。
API 接入开放或变化一个模型只有真正可接入时,才从“有意思”变成“值得测试”。检查文档、价格、账户要求和区域接入,再决定是否拉入测试。
许可证条款变化一旦许可证变化,商业使用假设会很快失效。在内部分享建议前,先读 LICENSE 和模型卡。
benchmark 获得第三方确认这通常是 hype 变成“值得评估”的时刻。把模型从 watchlist 升级成一个短 benchmark 或 prompt 测试。
分发方式或云包装变化企业与生产可用性常取决于包装,而不是单一分数。重新判断采购、部署或区域接入是否因此变得更容易。

DeepSeek、Qwen、Kimi 在 watchlist 里通常各代表什么信号?

名称当你的问题是通常什么变化会触发复查优先去哪验证
DeepSeek新开源模型是否改变了 benchmark、成本或评估队列新旗舰、benchmark 跨档、价格变化、许可证变化GitHub、Hugging Face、技术报告、官方文档
Qwen一个 OSS 友好家族是否新增了值得测的尺寸、模态或推理分支新分支、推理增强、多模态发布、接入扩张QwenLM GitHub、Hugging Face、官方文档、发布文章
Kimi产品化推理体验或用户侧发布势能是否已经足够影响构建者注意力重大 Kimi 发布、推理声明、产品上线、英文面向扩张官方产品页、发布说明、研究文章、英文摘要

每个被追踪模型都该核什么

字段为什么重要优先来源
Benchmark 来源区分自报分数和可复现实证。技术报告、模型卡、第三方榜单
API 可用性决定团队能不能真的测它。官方文档、价格页、账号或接入说明
许可证条款决定商业使用是否允许、是否受限。LICENSE、模型卡、官方发布页
发布渠道帮助判断它来自一手源还是二手评论。GitHub repo、Hugging Face 页、官方文档、产品页
构建者相关性确保 watchlist 始终与真实产品决策相连。你的评估队列、成本比较、部署限制

每周更新节奏

  1. 让名单保持小:不要追所有中国 AI 发布,只追最可能改变你 stack 的家族。
  2. 优先看一手源:repo、模型卡、文档、技术报告,比评论和二手摘要更值得先看。
  3. 只拉有意义的变化:新模型、benchmark 变化、API 变化或许可证变化。
  4. 写一条笔记:记录变了什么、从哪里验证、以及它是否影响本月判断。

怎么决定谁继续留在名单里

  • 保留一个家族:只要它持续影响 benchmark、成本、接入或产品包装判断。
  • 降到 Tier 2:当它还算有意思,但已经很少改变你评估或部署的选择。
  • 新增一个家族:只有当它在每周复查或客户/团队讨论里反复出现时。

可复制的 15 分钟检查模板

## 中国 AI 模型检查 — [日期]
1. 本次复查家族:[DeepSeek / Qwen / Kimi / ...]
2. 看到的触发点:[新发布 / benchmark / API / license / packaging]
3. 验证入口:[GitHub / Hugging Face / docs / report]
4. 动作级别:[watch / discuss / test this week]
5. 为什么重要:[1 句,必须和你的 stack 或路线图有关]

RadarAI 如何使用这份名单

在 China AI 词簇里,RadarAI 把这页当作 模型 tracker 层。周报负责给你更宽的信号流,工作流页负责告诉你怎么复查,来源页负责告诉你去哪里看,而这页负责告诉你 哪些模型家族和实验室值得永久占一个 watchlist 槽位

这页不是什么

  • 不是排行榜:它不试图用一个分数给所有模型排出统一名次。
  • 不是完整市场图:它保持名单足够小,方便每周复查。
  • 不是对一手验证的替代:每一行最终都仍需回到 repo、文档或报告确认。

用模型名单最常见的错误

  • 把这页当排行榜:真正目标是决定谁值得验证,而不是选出一个绝对赢家。
  • 把实验室相关性和单次发布相关性混为一谈:大实验室并不意味着每条更新都重要。
  • 跳过接入和许可证检查:很多模型听起来很 relevant,但落到你的场景里根本不可用。
  • 太早加太多名字:一旦名单膨胀成目录,它就不再是每周决策工具。

可引用总结

RadarAI 的中国 AI 模型名单是一份每周 watchlist,而不是一张巨型排行榜。跟踪那些最可能改变构建者判断的模型家族,定义清晰的动作触发条件,通过 GitHub、Hugging Face、技术报告和官方文档验证发布,并让 benchmark 来源、API 接入和许可证检查始终绑定在每个有意义的变化上。

FAQ

这页是做什么的?

这是一份面向构建者的中国 AI 模型与实验室跟踪页。它帮助你知道应该长期盯哪些模型家族、从哪里验证英文信息、哪些变化值得本周动作。

这是不是一个模型排行榜?

不是。这是一份监控与验证清单,不是统一排行榜。它的作用是帮你维持 watchlist,再通过模型卡、技术报告和第三方评测去验证具体能力。

它和工作流指南该怎么配合?

用这页决定哪些实验室和模型家族应该进入长期观察名单;再用工作流指南安排每周复查节奏;若你还没选好来源,则转到来源 shortlist 页面。

为什么有些中国 AI 实验室没被放进核心 watchlist?

因为这页不是做全量地图,而是做构建者决策层的紧凑清单。只有那些最可能通过开源权重、API 可用性、企业包装、多模态发布或生态变化影响本周判断的模型家族,才会留在核心 watchlist。

我应该按实验室追踪还是按模型家族追踪?

如果你的问题是采用与评估,优先按模型家族;如果你的问题是路线图和生态走向,优先按实验室。大多数团队都需要两者结合:家族决定你测什么,实验室决定你会在哪里看到下一次重要发布。

Next