2月17日 AI 速报 · 第 39 期
## 🔍 核心洞察
**Qwen 3.5 系列**强势引爆开源大模型生态,**397B 参数**、**原生多模态**与**MoE + Linear Attention 架构**获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持;与此同时,**LlamaIndex**加速向 AI Agent 基建层演进,以 **$LLAMA Token** 替代订阅制,并升级 **PDF→Markdown/JSON** 解析能力,夯实智能体“认知基建”。
## 🚀 重点动态
- **Qwen 3.5-397B-A17B 登陆 LMSYS Arena**:阿里巴巴全新原生多模态开放模型,已开放文本、视觉与代码三类竞技场评测。
- **NVIDIA 与 AMD 同步官宣首日支持 Qwen 3.5**:分别通过 NeMo、SGLang/vLLM 提供免费 API 与 Instinct GPU 加速。
- **Ollama Cloud 与 ZenMux 上线 Qwen 3.5**:前者支持开箱即用推理,后者首发搭载 **Gated DeltaNet + Sparse MoE** 架构的 Qwen 3.5 Plus。
- **mlx-vlm v0.3.12 新增 Mac 本地支持**:首次实现 Qwen 3.5 系列在 Apple Silicon 设备上的视觉语言模型端侧推理。
- **LlamaCloud 推出增强型 PDF 解析引擎**:可高保真提取含表格、图表的复杂 PDF,并输出结构化 Markdown 或 JSON。
- **LlamaIndex 启用 $LLAMA Token 统一 API 计费**:告别月度订阅,转向面向智能体调用的通用 Token 模式。
- **Google Antigravity 发布可视化 UI 编辑 Agent**:用户截图选区 + 自然语言指令,即可实时重构前端界面。
- **傅盛公开 OpenClaw 开源框架并演示 611 份岗位定制拜年消息**:4 分钟完成深度个性化批量触达,验证 AI 助理的“个体即团队”生产力范式。