2月18日 AI 速报 · 第 41 期

2026-02-18 08:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方

Qwen 3.5 系列（含 397B-A17B 与 Plus 版本）正引发全栈生态爆发式适配——从 NVIDIA NeMo、AMD Instinct GPU 到 Ollama Cloud、ZenMux 和 mlx-vlm，主流硬件平台与开发...

## 🔍 核心洞察 **Qwen 3.5 系列**（含 **397B-A17B** 与 **Plus** 版本）正引发全栈生态爆发式适配——从 **NVIDIA NeMo**、**AMD Instinct GPU** 到 **Ollama Cloud**、**ZenMux** 和 **mlx-vlm**，主流硬件平台与开发工具链已实现**首日支持**；与此同时，**LlamaIndex** 加速向 Token 经济演进，以 **$LLAMA Token** 重构 API 访问范式。 ## 🚀 重点动态 - **LlamaIndex 推出 $LLAMA Token 通用 API 密钥模式**：正式弃用月度订阅制，以代币化方式统一智能体调用权限。 - **Qwen 3.5-397B-A17B 登陆 LMSYS Chatbot Arena**：作为原生多模态开放权重模型，同步开放文本、视觉与代码三大竞技场评测。 - **NVIDIA 为 Qwen 3.5 提供即时开发支持**：通过免费 API + **NeMo 框架深度集成**，降低企业级部署门槛。 - **AMD 宣布 Instinct GPU 首日支持 Qwen 3.5**：依托 **SGLang/vLLM 软件栈**，实现高性能推理优化。 - **LlamaCloud 上线增强型 PDF 解析功能**：支持含表格与图表的复杂文档一键转结构化 **Markdown/JSON**。 - **Qwen 3.5 Plus 在 ZenMux 发布**：采用 **Gated DeltaNet + Sparse MoE** 架构，宣称性能逼近 GPT-5.2。 - **mlx-vlm v0.3.12 新增对 Qwen 3.5 的本地支持**：首次实现在 **Mac 设备上运行 Qwen 视觉语言模型**。 - **Simon Willison 推出 Showboat 新工具 Chartroom 与 datasette-showboat**：分别强化 CLI 图表可视化与 AI 智能体执行进度实时流式监控。

Qwen 3.5 系列（含 397B-A17B 与 Plus 版本）正引发全栈生态爆发式适配——从 NVIDIA NeMo、AMD Instinct GPU 到 Ollama Cloud、ZenMux 和 mlx-vlm，主流硬件平台与开发工具链已实现首日支持；与此同时，LlamaIndex 加速向 Token 经济演进，以 $LLAMA Token 重构 API 访问范式。

🚀 重点动态

LlamaIndex 推出 $LLAMA Token 通用 API 密钥模式：正式弃用月度订阅制，以代币化方式统一智能体调用权限。
Qwen 3.5-397B-A17B 登陆 LMSYS Chatbot Arena：作为原生多模态开放权重模型，同步开放文本、视觉与代码三大竞技场评测。
NVIDIA 为 Qwen 3.5 提供即时开发支持：通过免费 API + NeMo 框架深度集成，降低企业级部署门槛。
AMD 宣布 Instinct GPU 首日支持 Qwen 3.5：依托 SGLang/vLLM 软件栈，实现高性能推理优化。
LlamaCloud 上线增强型 PDF 解析功能：支持含表格与图表的复杂文档一键转结构化 Markdown/JSON。
Qwen 3.5 Plus 在 ZenMux 发布：采用 Gated DeltaNet + Sparse MoE 架构，宣称性能逼近 GPT-5.2。
mlx-vlm v0.3.12 新增对 Qwen 3.5 的本地支持：首次实现在 Mac 设备上运行 Qwen 视觉语言模型。
Simon Willison 推出 Showboat 新工具 Chartroom 与 datasette-showboat：分别强化 CLI 图表可视化与 AI 智能体执行进度实时流式监控。

← 返回更新速报