## 🔍 核心洞察 **Kimi K2.5** 成为 Cursor Composer 2 的核心基座模型,其在**困惑度指标**上的显著优势直接驱动产品技术选型;与此同时,**开源基座模型**(尤其中国开源生态)正被明确视为重塑全球 AI 栈的关键变量 [4][5][9][12][15]。NVIDIA 则以 **SOL-ExecBench** 新基准和 **Nemotron-Cascade-2** 模型双线推进硬件与模型效率革命 [6][7]。 ## 🚀 重点动态 - **Cursor 确认 Kimi K2.5 为 Composer 2 基座模型** [4]:联合创始人 Aman Sanger 明确其在困惑度评估中表现最强,并将事件定性为「沟通事故」而非许可证纠纷 - **Moonshot AI 官方确认 Cursor 合作关系** [5]:发布推文祝贺 Composer 2 上线,证实 Kimi K2.5 提供基础模型能力,并声明通过 Fireworks 获得商业授权 - **NVIDIA 推出 SOL-ExecBench 光速基准测试** [6]:将 GPU 性能转化为「光速分数」,用于量化硬件性能余量与推理吞吐潜力 - **Nemotron-Cascade-2 登陆 Ollama** [7]:支持即开即用,以更小参数量实现媲美参数多至 20 倍模型的推理与智能体任务能力 - **Google Gemini API 新增 OpenAI 兼容层** [11]:仅需修改 3 行代码,即可无缝接入 Nano Banana 和 Veo 模型 - **Devin 新增自调度能力** [16]:Cognition 推出自动化工作流功能,支持将一次性任务转化为可重复执行的智能代理流程 - **LiteParse 发布面向编码代理的即用型技能** [23]:LlamaIndex 新工具使 Claude Code 等代理可在本地实时解析 PDF/HTML 文档,提升 RAG 与代码生成可靠性 - **Perplexity Computer 整合高端市场研究数据源** [14]:正式接入 PitchBook、Statista 与 CB Insights,强化 VC/PE 场景下的结构化情报分析能力 ## 🔗 Sources [1] 不可信监控:额外要点 — LessWrong — https://www.bestblogs.dev/article/20cb1d28 [2] PM 方法论需要为 AI 时代演进 — https://www.bestblogs.dev/status/2035104384007422347 [3] 发现 Transformer 中的特征:对比方向在比基线更小的扰动幅度下引发更强的低层次扰动响应 — LessWrong — https://www.bestblogs.dev/article/0ad52483 [4] Cursor 联合创始人解释技术选型路径,事件定性为「沟通事故」 — https://www.bestblogs.dev/status/2035098758783148061 [5] Moonshot AI 官方正式确认 Cursor 合作关系,扭转此前质询态度 — https://www.bestblogs.dev/status/2035098528658112704 [6] NVIDIA 推出 SOL-ExecBench:GPU 性能'光速'基准测试 — https://www.bestblogs.dev/status/2035089525702369584 [