Thesis
跟踪中国 AI 模型最有用的方式,不是做一张巨大的 benchmark 排行表,而是维护一份紧凑、每周可复查的模型家族与实验室 watchlist。 这份清单的核心不是“谁第一”,而是“谁持续改变构建者的评估顺序、成本判断、接入路径或产品包装”。
20 秒判断
如果你的核心问题是:哪些中国 AI 模型与实验室应该长期留在 watchlist 里,这页就是入口。 先从 DeepSeek、Qwen、Kimi、MiniMax、ERNIE、Doubao、GLM、Hunyuan 开始,把这页当作结构化 tracker;再通过 GitHub、Hugging Face、技术报告和官方文档验证具体发布。若你的问题更宽,比如“中国 AI 的英文入口有哪些”,先去 中国 AI 英文信息源总览。
适合谁
- 构建者与产品经理:需要一份每周可复查的紧凑 watchlist,而不是一张巨大的市场图谱。
- 英文优先的团队:想知道新闻周期过去后,哪些中国 AI 名字仍然值得继续盯。
- 研究与评估型团队:需要一组值得定期检查 benchmark、接入与许可证变化的模型家族。
不适合谁
- 想看统一排行榜的人:这页不是一个“谁最强”的单一排序。
- 想看全量实验室地图的人:这页只保留对构建者决策最相关的家族。
- 核心问题是来源选择或每周流程的人:那应该先去来源页或工作流页。
什么时候用这页
这页回答的是 tracker 问题:哪些中国 AI 模型和实验室应该留在我的每周观察名单里? 如果你的问题是 怎么做每周复查,请转到 如何用英文持续跟踪中国 AI。如果你的问题是 应该看哪些站点和来源类型,请看 值得加入观察清单的中国 AI 来源。如果你的问题更宽,还是“有哪些英文 tracker 和入口”,先去 中国 AI 英文信息源总览。如果你关心翻译延迟、实验室渠道差异等窄问题,则去看英文支撑文章。
中国 AI 模型名单最好的用法是什么?
最好的用法,是把它当作每周追踪层,而不是最终排名。保留一小组会持续影响你判断的模型家族和实验室,盯住它们的英文可访问发布渠道,在动作发生前核对 benchmark 来源、API 可用性和许可证。这样做比泛读 AI 新闻更有用,因为它能让 watchlist 保持小、保持新、并直接连接到验证步骤。
构建者到底该追哪些中国 AI 模型?
构建者应该长期追踪那些会反复改变评估队列、成本比较、接入选择或产品包装的模型家族,而不是每周只热闹一次的名字。对大多数团队来说,这意味着把 DeepSeek、Qwen、Kimi、MiniMax、GLM 和 Hunyuan 放进常驻 watchlist,再判断 ERNIE、Doubao 或 Tier 2 名字是否开始变得与决策强相关。一个好的 watchlist 必须足够小,能每周复查;又足够具体,能告诉你变了什么、从哪验证、是否应该动作。这页回答的是 谁该留下 与 为什么;它不替代来源 shortlist,也不替代每周流程。
怎样用英文跟踪中国 AI 模型?
最稳的做法是:保留一个小而长期的 watchlist,而不是试图维护一张中国 AI 的全景地图。先从最可能改变构建者判断的家族开始,例如 DeepSeek、Qwen、Kimi、MiniMax、GLM、Hunyuan;再通过 GitHub、Hugging Face、官方文档、技术报告和发布页核实真正发了什么。然后只把那些影响 benchmark 信心、API 接入、许可证条款或产品包装的变化拉进本周复查。若你更关心翻译延迟或实验室渠道细节,请转到英文支撑文章;若你更关心流程,请转到工作流页。
怎么阅读这页
- Current watchlist:告诉你哪些家族应该永久占一个每周复查槽位。
- Trigger action:告诉你什么变化会把“注意到”升级成“本周要复查”。
- Verification links:告诉你应该先去哪里核实。
- Tier 2 names:提醒你哪些名字只有在范围扩大时才值得加入。
Current watchlist
| 模型或家族 | 实验室 / 公司 | 为什么应留在名单里 | 什么变化会触发动作 | 优先验证入口 | RadarAI 备注 |
|---|---|---|---|---|---|
| DeepSeek-V3 / DeepSeek-R1 | DeepSeek | 经常重设开源模型的性价比对比和 benchmark 讨论顺序。 | 新旗舰发布、benchmark 跨档提升、API 定价变化、许可证变化。 | GitHub、Hugging Face、技术报告、官方文档 | 通常是最先改变构建者评估队列的中国模型家族之一。 |
| Qwen 家族 | 阿里云 | 尺寸多、模态多、更新快,且英文资料与 OSS 分发完整。 | 新分支、推理增强版、开源发布、接入变化。 | QwenLM GitHub、Hugging Face、官方文档、技术报告 | 适合既看开放模型,也看英文发布规范度的团队。 |
| Kimi 家族 | Moonshot AI | 更偏产品体验、推理交互和用户层面的信号。 | 重大产品发布、推理体验提升、英文面向发布扩大。 | 官方产品页、发布说明、研究文章、英文报道 | 当你的问题偏产品体验而不是 repo 细节时尤其值得看。 |
| MiniMax 家族 | MiniMax | 多模态包装、产品可用性和接入方式经常更重要。 | 多模态发布、API 可用性变化、定价或包装变化。 | 官方文档、发布页、研究文章、英文摘要 | 适合评估“能否实际接入”,而不是只看某个 benchmark 分数。 |
| ERNIE 家族 | 百度 | 企业包装、云分发与中国市场上下文常比纯模型热度更重要。 | 企业版发布、API/云包装变化、区域接入信号。 | 官方文档、百度智能云更新、产品页、英文报道 | 当你的判断依赖企业包装、云接入或区域分发时很关键。 |
| Doubao 家族 | 字节跳动 | 产品迭代快,生态位变化常先于 repo 叙事。 | 重大产品功能发布、模型刷新、平台整合动作。 | 官方产品页、研究文章、GitHub(如有)、英文摘要 | 适合关注产品节奏和生态变化,而不只是单次技术发布。 |
| GLM 家族 | 智谱 AI | 在商业 API 选择里,是 DeepSeek/Qwen 之外很值得长期比较的一条线。 | 新一代 GLM、API 扩张、企业合作信号。 | 官方文档、发布说明、模型页、英文报道 | 当团队比较商业 API 而不只是开源权重时,应尽早加入。 |
| Hunyuan 家族 | 腾讯 | 云平台能力、企业分发和生态整合常是判断重点。 | 云端发布、企业接入更新、显著多模态 / agent 能力进展。 | 官方文档、腾讯云更新、产品页、英文摘要 | 如果你在乎平台杠杆和企业分发,而不只是 benchmark 热点,这条线很重要。 |
Tier 2 名单:只有当范围扩大时再加
| 名称或家族 | 为什么先放第二层 | 什么时候再加进来 |
|---|---|---|
| THUDM 研究线 | 强研究信号,但不总是第一层构建者决策入口。 | 当你更关心前沿研究 repo,而不是部署型产品选择时。 |
| SenseNova | 对企业和多模态跟踪有价值,但对紧凑 watchlist 来说优先级稍低。 | 当你需要更宽的企业 AI 供应商覆盖时。 |
| Step 家族 | 有势能,但不总是核心 top-8 家族。 | 当它开始反复出现在产品相关或客户相关问题中。 |
| Yi 家族 | 历史上重要,也适合做部分开源对比,但越来越少改变本周决策。 | 当你的 stack 或 benchmark 仍在对照旧一代开源基线时。 |
什么变化会触发本周动作
| 如果这里变了 | 为什么重要 | 下一步做什么 |
|---|---|---|
| 新旗舰模型或大版本 | 可能改变 benchmark 对比、评估 backlog 或产品定位。 | 先看技术报告或模型卡,再与你当前默认模型做对比。 |
| API 接入开放或变化 | 一个模型只有真正可接入时,才从“有意思”变成“值得测试”。 | 检查文档、价格、账户要求和区域接入,再决定是否拉入测试。 |
| 许可证条款变化 | 一旦许可证变化,商业使用假设会很快失效。 | 在内部分享建议前,先读 LICENSE 和模型卡。 |
| benchmark 获得第三方确认 | 这通常是 hype 变成“值得评估”的时刻。 | 把模型从 watchlist 升级成一个短 benchmark 或 prompt 测试。 |
| 分发方式或云包装变化 | 企业与生产可用性常取决于包装,而不是单一分数。 | 重新判断采购、部署或区域接入是否因此变得更容易。 |
DeepSeek、Qwen、Kimi 在 watchlist 里通常各代表什么信号?
| 名称 | 当你的问题是 | 通常什么变化会触发复查 | 优先去哪验证 |
|---|---|---|---|
| DeepSeek | 新开源模型是否改变了 benchmark、成本或评估队列 | 新旗舰、benchmark 跨档、价格变化、许可证变化 | GitHub、Hugging Face、技术报告、官方文档 |
| Qwen | 一个 OSS 友好家族是否新增了值得测的尺寸、模态或推理分支 | 新分支、推理增强、多模态发布、接入扩张 | QwenLM GitHub、Hugging Face、官方文档、发布文章 |
| Kimi | 产品化推理体验或用户侧发布势能是否已经足够影响构建者注意力 | 重大 Kimi 发布、推理声明、产品上线、英文面向扩张 | 官方产品页、发布说明、研究文章、英文摘要 |
每个被追踪模型都该核什么
| 字段 | 为什么重要 | 优先来源 |
|---|---|---|
| Benchmark 来源 | 区分自报分数和可复现实证。 | 技术报告、模型卡、第三方榜单 |
| API 可用性 | 决定团队能不能真的测它。 | 官方文档、价格页、账号或接入说明 |
| 许可证条款 | 决定商业使用是否允许、是否受限。 | LICENSE、模型卡、官方发布页 |
| 发布渠道 | 帮助判断它来自一手源还是二手评论。 | GitHub repo、Hugging Face 页、官方文档、产品页 |
| 构建者相关性 | 确保 watchlist 始终与真实产品决策相连。 | 你的评估队列、成本比较、部署限制 |
每周更新节奏
- 让名单保持小:不要追所有中国 AI 发布,只追最可能改变你 stack 的家族。
- 优先看一手源:repo、模型卡、文档、技术报告,比评论和二手摘要更值得先看。
- 只拉有意义的变化:新模型、benchmark 变化、API 变化或许可证变化。
- 写一条笔记:记录变了什么、从哪里验证、以及它是否影响本月判断。
怎么决定谁继续留在名单里
- 保留一个家族:只要它持续影响 benchmark、成本、接入或产品包装判断。
- 降到 Tier 2:当它还算有意思,但已经很少改变你评估或部署的选择。
- 新增一个家族:只有当它在每周复查或客户/团队讨论里反复出现时。
可复制的 15 分钟检查模板
## 中国 AI 模型检查 — [日期] 1. 本次复查家族:[DeepSeek / Qwen / Kimi / ...] 2. 看到的触发点:[新发布 / benchmark / API / license / packaging] 3. 验证入口:[GitHub / Hugging Face / docs / report] 4. 动作级别:[watch / discuss / test this week] 5. 为什么重要:[1 句,必须和你的 stack 或路线图有关]
RadarAI 如何使用这份名单
在 China AI 词簇里,RadarAI 把这页当作 模型 tracker 层。周报负责给你更宽的信号流,工作流页负责告诉你怎么复查,来源页负责告诉你去哪里看,而这页负责告诉你 哪些模型家族和实验室值得永久占一个 watchlist 槽位。
这页不是什么
- 不是排行榜:它不试图用一个分数给所有模型排出统一名次。
- 不是完整市场图:它保持名单足够小,方便每周复查。
- 不是对一手验证的替代:每一行最终都仍需回到 repo、文档或报告确认。
用模型名单最常见的错误
- 把这页当排行榜:真正目标是决定谁值得验证,而不是选出一个绝对赢家。
- 把实验室相关性和单次发布相关性混为一谈:大实验室并不意味着每条更新都重要。
- 跳过接入和许可证检查:很多模型听起来很 relevant,但落到你的场景里根本不可用。
- 太早加太多名字:一旦名单膨胀成目录,它就不再是每周决策工具。
可引用总结
RadarAI 的中国 AI 模型名单是一份每周 watchlist,而不是一张巨型排行榜。跟踪那些最可能改变构建者判断的模型家族,定义清晰的动作触发条件,通过 GitHub、Hugging Face、技术报告和官方文档验证发布,并让 benchmark 来源、API 接入和许可证检查始终绑定在每个有意义的变化上。
FAQ
这页是做什么的?
这是一份面向构建者的中国 AI 模型与实验室跟踪页。它帮助你知道应该长期盯哪些模型家族、从哪里验证英文信息、哪些变化值得本周动作。
这是不是一个模型排行榜?
不是。这是一份监控与验证清单,不是统一排行榜。它的作用是帮你维持 watchlist,再通过模型卡、技术报告和第三方评测去验证具体能力。
它和工作流指南该怎么配合?
用这页决定哪些实验室和模型家族应该进入长期观察名单;再用工作流指南安排每周复查节奏;若你还没选好来源,则转到来源 shortlist 页面。
为什么有些中国 AI 实验室没被放进核心 watchlist?
因为这页不是做全量地图,而是做构建者决策层的紧凑清单。只有那些最可能通过开源权重、API 可用性、企业包装、多模态发布或生态变化影响本周判断的模型家族,才会留在核心 watchlist。
我应该按实验室追踪还是按模型家族追踪?
如果你的问题是采用与评估,优先按模型家族;如果你的问题是路线图和生态走向,优先按实验室。大多数团队都需要两者结合:家族决定你测什么,实验室决定你会在哪里看到下一次重要发布。
Next
- 中国 AI 英文信息源总览 — 宽意图入口,负责 English sites、trackers、sources 与 media 问题
- 如何用英文持续跟踪中国 AI — 负责每周 workflow
- 值得加入观察清单的中国 AI 来源 — 负责 source shortlist
- 周报 — 负责日期化的信号层
- 英文原页 — 查看英文版原始结构