3月13日 AI 速报 · 第 107 期

2026-03-13 00:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方

## 🔍 核心洞察当前 AI 发展正经历从**提示词工程**向**上下文工程**与**记忆架构优化**的范式迁移，**英伟达 Nemotron 3 Super 120B-A12B**、**VAST Tripo P1.0** 等模型突破持续压缩生成延迟与成本边界，而**AI 评估机制的可信度**与**对齐测试的有效性**正遭遇学界系统性质疑。 ## 🚀 重点动态 - **谷歌地图集成 Gemini 实现“询问式导航”**：发布史上最大规模更新，支持个性化路线规划与沉浸式语音交互。 - **Runway 推出 ‘Runway Characters’ 实时互动功能**：支持用户与 AI 角色进行低延迟、上下文连贯的沉浸式模拟对话。 - **英伟达开源 Nemotron 3 Super 120B-A12B 大模型**：1200 亿参数开放权重 LLM，在吞吐量与多项基准测试中显著超越同类竞品。 - **VAST 发布 Tripo P1.0 原生 3D 生成模型**：重构算法范式，实现**2 秒内端到端网格输出**，推动 AI 3D 进入功能性资产驱动时代。 - **Qdrant 完成 5000 万美元 B 轮融资**：加速基于 Rust 的可组合向量搜索引擎研发，聚焦量化 + 套娃式嵌入（MRL）技术，实测降低基础设施成本达 **80%**。 - **OpenAI 发布教育技术报告，重构学习成效评估标准**：转向关注**学习过程质量**（如推理路径、知识迁移），而非单一分数指标。 - **LessWrong 多篇深度分析直指 AI 评估体系缺陷**：指出主流 Evals 存在“安全洗白”倾向，且经典对齐伪装测试实际衡量的是**越狱检测能力**，而非策略性欺骗。 - **Recraft V4 提示词指南强调“结构优于长度”**：由设计师主导验证，明确分层指令、角色锚点与约束嵌套等结构要素对图像生成质量的决定性影响。

当前 AI 发展正经历从提示词工程向上下文工程与记忆架构优化的范式迁移，英伟达 Nemotron 3 Super 120B-A12B、VAST Tripo P1.0 等模型突破持续压缩生成延迟与成本边界，而AI 评估机制的可信度与对齐测试的有效性正遭遇学界系统性质疑。

🚀 重点动态

谷歌地图集成 Gemini 实现“询问式导航”：发布史上最大规模更新，支持个性化路线规划与沉浸式语音交互。
Runway 推出 ‘Runway Characters’ 实时互动功能：支持用户与 AI 角色进行低延迟、上下文连贯的沉浸式模拟对话。
英伟达开源 Nemotron 3 Super 120B-A12B 大模型：1200 亿参数开放权重 LLM，在吞吐量与多项基准测试中显著超越同类竞品。
VAST 发布 Tripo P1.0 原生 3D 生成模型：重构算法范式，实现2 秒内端到端网格输出，推动 AI 3D 进入功能性资产驱动时代。
Qdrant 完成 5000 万美元 B 轮融资：加速基于 Rust 的可组合向量搜索引擎研发，聚焦量化 + 套娃式嵌入（MRL）技术，实测降低基础设施成本达 80%。
OpenAI 发布教育技术报告，重构学习成效评估标准：转向关注学习过程质量（如推理路径、知识迁移），而非单一分数指标。
LessWrong 多篇深度分析直指 AI 评估体系缺陷：指出主流 Evals 存在“安全洗白”倾向，且经典对齐伪装测试实际衡量的是越狱检测能力，而非策略性欺骗。
Recraft V4 提示词指南强调“结构优于长度”：由设计师主导验证，明确分层指令、角色锚点与约束嵌套等结构要素对图像生成质量的决定性影响。

← 返回更新速报