2月17日 AI 速报 · 第 39 期

2026-02-17 16:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方

Qwen 3.5 系列强势引爆开源大模型生态，397B 参数、原生多模态与MoE + Linear Attention 架构获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持；与此同时，Lla...

## 🔍 核心洞察 **Qwen 3.5 系列**强势引爆开源大模型生态，**397B 参数**、**原生多模态**与**MoE + Linear Attention 架构**获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持；与此同时，**LlamaIndex**加速向 AI Agent 基建层演进，以 **$LLAMA Token** 替代订阅制，并升级 **PDF→Markdown/JSON** 解析能力，夯实智能体“认知基建”。 ## 🚀 重点动态 - **Qwen 3.5-397B-A17B 登陆 LMSYS Arena**：阿里巴巴全新原生多模态开放模型，已开放文本、视觉与代码三类竞技场评测。 - **NVIDIA 与 AMD 同步官宣首日支持 Qwen 3.5**：分别通过 NeMo、SGLang/vLLM 提供免费 API 与 Instinct GPU 加速。 - **Ollama Cloud 与 ZenMux 上线 Qwen 3.5**：前者支持开箱即用推理，后者首发搭载 **Gated DeltaNet + Sparse MoE** 架构的 Qwen 3.5 Plus。 - **mlx-vlm v0.3.12 新增 Mac 本地支持**：首次实现 Qwen 3.5 系列在 Apple Silicon 设备上的视觉语言模型端侧推理。 - **LlamaCloud 推出增强型 PDF 解析引擎**：可高保真提取含表格、图表的复杂 PDF，并输出结构化 Markdown 或 JSON。 - **LlamaIndex 启用 $LLAMA Token 统一 API 计费**：告别月度订阅，转向面向智能体调用的通用 Token 模式。 - **Google Antigravity 发布可视化 UI 编辑 Agent**：用户截图选区 + 自然语言指令，即可实时重构前端界面。 - **傅盛公开 OpenClaw 开源框架并演示 611 份岗位定制拜年消息**：4 分钟完成深度个性化批量触达，验证 AI 助理的“个体即团队”生产力范式。

Qwen 3.5 系列强势引爆开源大模型生态，397B 参数、原生多模态与MoE + Linear Attention 架构获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持；与此同时，LlamaIndex加速向 AI Agent 基建层演进，以 $LLAMA Token 替代订阅制，并升级 PDF→Markdown/JSON 解析能力，夯实智能体“认知基建”。

🚀 重点动态

Qwen 3.5-397B-A17B 登陆 LMSYS Arena：阿里巴巴全新原生多模态开放模型，已开放文本、视觉与代码三类竞技场评测。
NVIDIA 与 AMD 同步官宣首日支持 Qwen 3.5：分别通过 NeMo、SGLang/vLLM 提供免费 API 与 Instinct GPU 加速。
Ollama Cloud 与 ZenMux 上线 Qwen 3.5：前者支持开箱即用推理，后者首发搭载 Gated DeltaNet + Sparse MoE 架构的 Qwen 3.5 Plus。
mlx-vlm v0.3.12 新增 Mac 本地支持：首次实现 Qwen 3.5 系列在 Apple Silicon 设备上的视觉语言模型端侧推理。
LlamaCloud 推出增强型 PDF 解析引擎：可高保真提取含表格、图表的复杂 PDF，并输出结构化 Markdown 或 JSON。
LlamaIndex 启用 $LLAMA Token 统一 API 计费：告别月度订阅，转向面向智能体调用的通用 Token 模式。
Google Antigravity 发布可视化 UI 编辑 Agent：用户截图选区 + 自然语言指令，即可实时重构前端界面。
傅盛公开 OpenClaw 开源框架并演示 611 份岗位定制拜年消息：4 分钟完成深度个性化批量触达，验证 AI 助理的“个体即团队”生产力范式。

← 返回更新速报