2月18日 AI 速报 · 第 41 期
## 🔍 核心洞察
**Qwen 3.5 系列**(含 **397B-A17B** 与 **Plus** 版本)正引发全栈生态爆发式适配——从 **NVIDIA NeMo**、**AMD Instinct GPU** 到 **Ollama Cloud**、**ZenMux** 和 **mlx-vlm**,主流硬件平台与开发工具链已实现**首日支持**;与此同时,**LlamaIndex** 加速向 Token 经济演进,以 **$LLAMA Token** 重构 API 访问范式。
## 🚀 重点动态
- **LlamaIndex 推出 $LLAMA Token 通用 API 密钥模式**:正式弃用月度订阅制,以代币化方式统一智能体调用权限。
- **Qwen 3.5-397B-A17B 登陆 LMSYS Chatbot Arena**:作为原生多模态开放权重模型,同步开放文本、视觉与代码三大竞技场评测。
- **NVIDIA 为 Qwen 3.5 提供即时开发支持**:通过免费 API + **NeMo 框架深度集成**,降低企业级部署门槛。
- **AMD 宣布 Instinct GPU 首日支持 Qwen 3.5**:依托 **SGLang/vLLM 软件栈**,实现高性能推理优化。
- **LlamaCloud 上线增强型 PDF 解析功能**:支持含表格与图表的复杂文档一键转结构化 **Markdown/JSON**。
- **Qwen 3.5 Plus 在 ZenMux 发布**:采用 **Gated DeltaNet + Sparse MoE** 架构,宣称性能逼近 GPT-5.2。
- **mlx-vlm v0.3.12 新增对 Qwen 3.5 的本地支持**:首次实现在 **Mac 设备上运行 Qwen 视觉语言模型**。
- **Simon Willison 推出 Showboat 新工具 Chartroom 与 datasette-showboat**:分别强化 CLI 图表可视化与 AI 智能体执行进度实时流式监控。