## 🔍 核心洞察 **长上下文能力**与**Agent 原生架构**正成为技术竞争新高地:**Deepseek** 实现 **100 万 token** 上下文,**面壁智能**以 **SALA 混合注意力**在消费级显卡跑通 9B 百万级推理;同时,**MiniMax**、**NemoVideo** 和 **Entire** 分别从专家分身、视频剪辑、认知协议维度推动 **Agent 原生化**落地。 ## 🚀 重点动态 - **Deepseek 模型重大更新**:上下文扩展至 **100 万 token**,知识库截止日期同步更新至 **2025 年 5 月** - **面壁智能发布 SALA 架构**:全球首个支持 **9B 端侧模型百万上下文**的稀疏-线性混合注意力方案 - **MiniMax 推出 Agent Desktop**:支持多端部署,用户可基于**私有知识库+指令工程**构建可复用领域专家 Agent - **NemoVideo 正式发布**:首个专业级视频剪辑 AI Agent,支持“对话式交互+自主执行”的爆款视频逆向创作 - **蚂蚁集团开源双千亿模型**:含 MoE 架构多模态模型 **Ming** 与首个千亿级扩散语言模型 **LLaDA2.X** - **模思智能推出 MOSS-TTS Family**:全栈开源语音模型家族,覆盖**长语音、多角色对话、指令驱动、音效合成及实时流式** - **Entire 提出 Checkpoint 协议**:定义 Agent 原生通讯标准,将开发者角色从“写代码”转向“审查认知链” - **量子位智库具身智能报告发布**:2025 年赛道融资达 **554 亿元**,明确 **10 亿元现金流门槛**与四大估值梯队格局