更多文章

AI 与开发者相关深度内容

国产大模型商用许可怎么排查:Qwen、GLM、DeepSeek、Kimi 的 7 个检查点

很多团队判断一个模型能不能接,不是卡在效果,而是卡在一句模糊的话: “这个应该能商用吧?”

真正危险的地方就在“应该”两个字。因为你接入的可能不是一个单一对象,而是一整套东西:

  • 模型权重
  • 在线 API 服务
  • 模型卡与补充条款
  • 微调后的衍生权重
  • 推理框架与依赖组件
  • 数据留存与输出归属规则

所以,商用许可排查不是看一眼 License 文件就结束,而是一次小型的上线前审查。下面这 7 个检查点,适合产品负责人、技术负责人、法务或采购一起过一遍。

先说结论:你真正要回答的不是“能不能商用”,而是 4 个更具体的问题

在看 Qwen、GLM、DeepSeek、Kimi 这类模型前,先把问题改写成下面 4 句:

  1. 我们是只做内部使用,还是要对外提供收费服务?
  2. 我们是调用 API,还是下载权重自己部署?
  3. 我们会不会做微调、蒸馏、二次封装或再分发?
  4. 我们的数据会不会涉及用户隐私、客户资料或受监管行业?

这 4 个问题不先写清楚,后面看再多协议也容易看偏。

7 个检查点

1. 先找“真源文件”,不要看二手解读

第一步不是搜文章,而是把每个模型的官方约束文件找齐。至少要收集下面几类材料:

  • 官方模型页或模型卡
  • GitHub / Hugging Face 仓库中的 LICENSE
  • API 服务条款或平台服务协议
  • 商业授权补充说明
  • FAQ、公告、版本变更说明

很多误判都出在这里: 团队看了一篇“某模型可商用”的二手总结,就直接进入接入阶段。结果真正约束你的,可能是 API 平台协议,而不是仓库里的开源协议。

实操建议:给每个候选模型建一页内部记录,只贴官方链接,不贴转述文章。

2. 区分“API 可用”与“权重可商用”,它们不是一回事

这是最常见的坑之一。

  • API 可用:你通过官方平台调用,通常受服务协议、计费规则、数据条款约束
  • 权重可用:你把模型下载到自己环境里部署,通常受开源协议或商业授权约束
  • 私有化部署可用:往往还有单独合同,不一定等同于前两者

很多团队会把“这个模型能在线调用”误以为“这个模型也能下载后自己商用部署”。这是两套完全不同的判断。

判断动作:你必须在内部文档里写清楚当前方案到底是哪一种,不要用“已获得使用权”这种模糊表达。

3. 把“商用”拆成 5 个场景逐项确认

“允许商用”这句话本身太粗,至少要拆成下面 5 类:

场景 要确认什么
内部效率工具 是否允许公司内部业务使用
对外 SaaS 功能 是否允许嵌入你的产品并对客户开放
付费能力售卖 是否允许作为收费功能或套餐卖点
客户交付项目 是否允许在乙方项目、定制系统中交付
再封装 / 渠道分发 是否允许做 API 转售、平台封装或代理分发

有的条款允许内部使用,但不明确允许“对外作为产品能力售卖”;有的允许你调用,但不允许再包装成自己的模型服务。这些差别,到了签单或上线阶段才暴露,代价会很高。

4. 微调、蒸馏、再训练,往往是第二层风险

团队最容易忽略的,不是原始模型,而是“你改过以后还能不能商用”。

这里要重点问 4 个问题:

  1. 是否允许微调?
  2. 微调后的权重是否可以部署到生产环境?
  3. 是否允许基于该模型输出继续训练别的模型?
  4. 是否要求保留原始声明、署名或附加说明?

如果你的路线里包含 LoRA 微调、蒸馏、RAG 再训练、模型路由拼装,这一步一定要单独确认,不能默认“原模型能用,改过也能用”。

5. 数据与输出权属,决定你能不能放心接客户场景

很多团队把许可理解成“只看模型”,但真正上线时,客户最关心的往往是数据。

至少要确认下面 5 件事:

  • 输入数据是否会被平台留存
  • 数据是否会被用于模型优化
  • 是否支持关闭训练使用或申请退出
  • 输出内容的权利归属怎么界定
  • 是否有面向企业或隐私场景的额外承诺

如果你要做企业知识库、客服、法务、医疗、金融等场景,这一步的重要性可能比“模型到底是不是第一名”更高。

简单判断法:凡是协议里没有明确写清楚数据留存和输出归属的,默认当成高风险方案处理。

6. 别只审模型本身,整条依赖链都要看

真正上线的不是一个裸模型,而是一整条技术链。比如:

  • 推理框架
  • 向量库
  • 重排模型
  • OCR / ASR / TTS 模块
  • 安全审核组件
  • 前端 SDK 或商用 UI 组件

如果主模型本身没问题,但你搭配的某个组件有更严格的商业限制,最终项目依然可能不能安全上线。

建议动作

  • 生成一份依赖清单
  • 标出每个组件的协议来源
  • 把“主模型合规”改成“整条方案合规”

7. 把排查结果变成“可复核记录”,不要靠口头判断

最稳的做法,不是某个同事说“我看过了,应该可以”,而是留下可复核记录。

建议最少记录这 6 项:

  • 模型名称与具体版本
  • 排查日期
  • 参考的官方链接
  • 当前使用方式(API / 本地 / 私有化)
  • 当前允许场景与不允许场景
  • 负责人和下一次复核时间

因为模型版本、平台条款、服务策略都会变。今天能用,不代表 3 个月后升级版本还能照用。

一张可直接落地的内部评审表

你可以直接把下面这张表贴到团队 Wiki 或 Notion:

项目 需要填写的内容
候选模型 例如 Qwen / GLM / DeepSeek / Kimi 的具体版本
使用方式 API、下载权重、本地部署、私有化
业务场景 内部工具、对外 SaaS、客户交付、渠道分发
是否微调 是 / 否,若是写清方式
数据敏感级别 普通、客户资料、隐私数据、受监管数据
官方依据链接 License、模型卡、API 条款、FAQ
初步结论 可推进 / 需补确认 / 暂不接入
未决问题 需要法务、采购或厂商回复的点

什么时候应该直接停下来,不要继续推进

遇到下面 4 种情况,建议先暂停,而不是边做边猜:

  • 官方文件之间互相冲突
  • 找不到明确的商业授权描述
  • API 条款和权重协议说法不一致
  • 团队计划做的事情,协议里完全没有覆盖

这时候继续推进,技术上可能很快,业务上却是在埋雷。

这篇文章真正想帮你避免的,不是“看不懂协议”,而是“太快下判断”

对产品团队来说,商用许可排查的价值不在于把每个法律词都研究透,而在于尽早知道:

  • 哪些模型可以进入测试池
  • 哪些模型只能先观察,不能急着接
  • 哪些模型必须先拿厂商书面回复再动

如果你把这件事做成一套稳定流程,后面不管是看 Qwen、GLM、DeepSeek 还是 Kimi,新模型进来都能快速判断,而不是每次重来一遍。

工具与资源

用途 建议做法
跟踪模型版本与授权变化 订阅厂商公告 + 用 RadarAI 这类聚合源做变更监控
保存证据链 内部 Wiki / Notion 统一沉淀官方链接
依赖许可证盘点 用 SBOM 或依赖清单工具辅助盘点
升级复核 每次大版本切换前重新过一遍 7 个检查点

延伸阅读:如果你还在判断“哪些模型值得持续追踪”,可以先看你的信息流和监控栈是不是足够稳定,因为很多授权变化、版本切换和部署条件变化,最怕的不是复杂,而是你根本没看到。


本文用于产品与技术团队的上线前排查,不构成法律意见。涉及高风险行业、对外收费能力或客户交付时,建议把排查结果交给法务或采购做最终确认。

延伸阅读

RadarAI 聚合 AI 优质更新与开源信息,帮助开发者高效追踪 AI 行业动态,快速判断哪些方向具备了落地条件。

← 返回更多文章