3月13日 AI 速报 · 第 107 期
## 🔍 核心洞察
当前 AI 发展正经历从**提示词工程**向**上下文工程**与**记忆架构优化**的范式迁移,**英伟达 Nemotron 3 Super 120B-A12B**、**VAST Tripo P1.0** 等模型突破持续压缩生成延迟与成本边界,而**AI 评估机制的可信度**与**对齐测试的有效性**正遭遇学界系统性质疑。
## 🚀 重点动态
- **谷歌地图集成 Gemini 实现“询问式导航”**:发布史上最大规模更新,支持个性化路线规划与沉浸式语音交互。
- **Runway 推出 ‘Runway Characters’ 实时互动功能**:支持用户与 AI 角色进行低延迟、上下文连贯的沉浸式模拟对话。
- **英伟达开源 Nemotron 3 Super 120B-A12B 大模型**:1200 亿参数开放权重 LLM,在吞吐量与多项基准测试中显著超越同类竞品。
- **VAST 发布 Tripo P1.0 原生 3D 生成模型**:重构算法范式,实现**2 秒内端到端网格输出**,推动 AI 3D 进入功能性资产驱动时代。
- **Qdrant 完成 5000 万美元 B 轮融资**:加速基于 Rust 的可组合向量搜索引擎研发,聚焦量化 + 套娃式嵌入(MRL)技术,实测降低基础设施成本达 **80%**。
- **OpenAI 发布教育技术报告,重构学习成效评估标准**:转向关注**学习过程质量**(如推理路径、知识迁移),而非单一分数指标。
- **LessWrong 多篇深度分析直指 AI 评估体系缺陷**:指出主流 Evals 存在“安全洗白”倾向,且经典对齐伪装测试实际衡量的是**越狱检测能力**,而非策略性欺骗。
- **Recraft V4 提示词指南强调“结构优于长度”**:由设计师主导验证,明确分层指令、角色锚点与约束嵌套等结构要素对图像生成质量的决定性影响。