3月21日 AI 速报 · 第 132 期

2026-03-21 08:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方 AI动态开源

## 🔍 核心洞察 **Kimi K2.5** 成为 Cursor Composer 2 的核心基座模型，其在**困惑度指标**上的显著优势直接驱动产品技术选型；与此同时，**开源基座模型**（尤其中国开源生态）正被明确视为重塑全球 AI 栈的关键变量 [4][5][9][12][15]。NVIDIA 则以 **SOL-ExecBench** 新基准和 **Nemotron-Cascade-2** 模型双线推进硬件与模型效率革命 [6][7]。 ## 🚀 重点动态 - **Cursor 确认 Kimi K2.5 为 Composer 2 基座模型** [4]：联合创始人 Aman Sanger 明确其在困惑度评估中表现最强，并将事件定性为「沟通事故」而非许可证纠纷 - **Moonshot AI 官方确认 Cursor 合作关系** [5]：发布推文祝贺 Composer 2 上线，证实 Kimi K2.5 提供基础模型能力，并声明通过 Fireworks 获得商业授权 - **NVIDIA 推出 SOL-ExecBench 光速基准测试** [6]：将 GPU 性能转化为「光速分数」，用于量化硬件性能余量与推理吞吐潜力 - **Nemotron-Cascade-2 登陆 Ollama** [7]：支持即开即用，以更小参数量实现媲美参数多至 20 倍模型的推理与智能体任务能力 - **Google Gemini API 新增 OpenAI 兼容层** [11]：仅需修改 3 行代码，即可无缝接入 Nano Banana 和 Veo 模型 - **Devin 新增自调度能力** [16]：Cognition 推出自动化工作流功能，支持将一次性任务转化为可重复执行的智能代理流程 - **LiteParse 发布面向编码代理的即用型技能** [23]：LlamaIndex 新工具使 Claude Code 等代理可在本地实时解析 PDF/HTML 文档，提升 RAG 与代码生成可靠性 - **Perplexity Computer 整合高端市场研究数据源** [14]：正式接入 PitchBook、Statista 与 CB Insights，强化 VC/PE 场景下的结构化情报分析能力 ## 🔗 Sources [1] 不可信监控：额外要点 — LessWrong — https://www.bestblogs.dev/article/20cb1d28 [2] PM 方法论需要为 AI 时代演进 — https://www.bestblogs.dev/status/2035104384007422347 [3] 发现 Transformer 中的特征：对比方向在比基线更小的扰动幅度下引发更强的低层次扰动响应 — LessWrong — https://www.bestblogs.dev/article/0ad52483 [4] Cursor 联合创始人解释技术选型路径，事件定性为「沟通事故」 — https://www.bestblogs.dev/status/2035098758783148061 [5] Moonshot AI 官方正式确认 Cursor 合作关系，扭转此前质询态度 — https://www.bestblogs.dev/status/2035098528658112704 [6] NVIDIA 推出 SOL-ExecBench：GPU 性能'光速'基准测试 — https://www.bestblogs.dev/status/2035089525702369584 [

Kimi K2.5 成为 Cursor Composer 2 的核心基座模型，其在困惑度指标上的显著优势直接驱动产品技术选型；与此同时，开源基座模型（尤其中国开源生态）正被明确视为重塑全球 AI 栈的关键变量 [4][5][9][12][15]。NVIDIA 则以 SOL-ExecBench 新基准和 Nemotron-Cascade-2 模型双线推进硬件与模型效率革命 [6][7]。

🚀 重点动态

Cursor 确认 Kimi K2.5 为 Composer 2 基座模型 [4]：联合创始人 Aman Sanger 明确其在困惑度评估中表现最强，并将事件定性为「沟通事故」而非许可证纠纷
Moonshot AI 官方确认 Cursor 合作关系 [5]：发布推文祝贺 Composer 2 上线，证实 Kimi K2.5 提供基础模型能力，并声明通过 Fireworks 获得商业授权
NVIDIA 推出 SOL-ExecBench 光速基准测试 [6]：将 GPU 性能转化为「光速分数」，用于量化硬件性能余量与推理吞吐潜力
Nemotron-Cascade-2 登陆 Ollama [7]：支持即开即用，以更小参数量实现媲美参数多至 20 倍模型的推理与智能体任务能力
Google Gemini API 新增 OpenAI 兼容层 [11]：仅需修改 3 行代码，即可无缝接入 Nano Banana 和 Veo 模型
Devin 新增自调度能力 [16]：Cognition 推出自动化工作流功能，支持将一次性任务转化为可重复执行的智能代理流程
LiteParse 发布面向编码代理的即用型技能 [23]：LlamaIndex 新工具使 Claude Code 等代理可在本地实时解析 PDF/HTML 文档，提升 RAG 与代码生成可靠性
Perplexity Computer 整合高端市场研究数据源 [14]：正式接入 PitchBook、Statista 与 CB Insights，强化 VC/PE 场景下的结构化情报分析能力

🔗 Sources

[1] 不可信监控：额外要点 — LessWrong — https://www.bestblogs.dev/article/20cb1d28
[2] PM 方法论需要为 AI 时代演进 — https://www.bestblogs.dev/status/2035104384007422347
[3] 发现 Transformer 中的特征：对比方向在比基线更小的扰动幅度下引发更强的低层次扰动响应 — LessWrong — https://www.bestblogs.dev/article/0ad52483
[4] Cursor 联合创始人解释技术选型路径，事件定性为「沟通事故」 — https://www.bestblogs.dev/status/2035098758783148061
[5] Moonshot AI 官方正式确认 Cursor 合作关系，扭转此前质询态度 — https://www.bestblogs.dev/status/2035098528658112704
[6] NVIDIA 推出 SOL-ExecBench：GPU 性能'光速'基准测试 — https://www.bestblogs.dev/status/2035089525702369584
[

← 返回更新速报