6月28日 AI 速报 · 第 427 期

2026-06-28 08:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-28 审核状态: 待编辑审核 AI速报速报官方 AI动态开源

## 🔍 核心洞察 **GPT-5.6** 系列正式发布，但受限于美国政府安全审核，实际访问权限高度收紧；与此同时，**DeepSeek-V4** 推出 **DSpark** 推测解码框架，推理速度提升 **60%–85%** [3][20]；AI 基础设施正加速从“算力堆叠”转向“效率优化”，英伟达以太网交换机收入暴增 **193%** 登顶全球第一，而行业 GPU 平均利用率却不足 **20%** [17][18]。 ## 🚀 重点动态 - **GPT-5.6 系列正式发布，含 Sol/Terra/Luna 三款模型及分级安全防护** [2]：基准测试刷新多项纪录，但发布即进入受美国政府审核的受限访问周期。 - **DeepSeek-V4 推出 DSpark 投机解码框架，生成速度提升 60%–85%** [3]：联合北大开源，替代 MTP-1，显著降低线上推理成本。 - **英伟达数据中心以太网交换机收入暴增 192.7%，首次登顶全球第一** [17]：Spectrum-X 平台推动其从 GPU 厂商向全栈 AI 基础设施提供商跃迁。 - **AI 芯片普遍存在结构性浪费，GPU 平均利用率低于 20%** [18]：行业共识正从“规模竞赛”转向“效率优化”，算力调度与缓存机制成新焦点。 - **阿里通义实验室发布 Wan Streamer，实现亚秒级全双工实时音视频对话** [23]：端到端 Transformer 模型同步生成语音与面部视频，具身交互再进一步。 - **开源上下文引擎 Hitmux-Context-Engine（HCE）发布，支持 Qwen3 Embedding + Milvus 自部署** [4]：低成本替代 ACE，强化本地化 RAG 工程能力。 - **Clay AI 负责人指出：增长团队已全面工程化运行 AI Agent** [6]：核心能力建设转向数据闭环构建、信号筛选与可扩展 Agent 基础设施。 - **BrowserBC 开源项目实现“人类点击克隆”** [12]：将单次网页操作转为自然语言技能，赋能轻量模型高效复用，基准成功率显著提升。 ## 🔗 Sources [1] Codex/Claude Code 上下文压缩实际体验与配套功能分享 — https://www.bestblogs.dev/status/2070904833939329477?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [2] 刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了 — https://www.bestblogs.dev/article/9a7132f3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [3] DeepSeek V4 新成果 DSpark 发布：推理速度更快 — https://www.bestblogs.dev/article/08d6d8e7?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [4] Hitmux-Context-Engine——开源替代 ACE — https://www.bestblogs.dev/article/1e6171ca?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [6] Clay AI

GPT-5.6 系列正式发布，但受限于美国政府安全审核，实际访问权限高度收紧；与此同时，DeepSeek-V4 推出 DSpark 推测解码框架，推理速度提升 60%–85% [3][20]；AI 基础设施正加速从“算力堆叠”转向“效率优化”，英伟达以太网交换机收入暴增 193% 登顶全球第一，而行业 GPU 平均利用率却不足 20% [17][18]。

🚀 重点动态

GPT-5.6 系列正式发布，含 Sol/Terra/Luna 三款模型及分级安全防护 [2]：基准测试刷新多项纪录，但发布即进入受美国政府审核的受限访问周期。
DeepSeek-V4 推出 DSpark 投机解码框架，生成速度提升 60%–85% [3]：联合北大开源，替代 MTP-1，显著降低线上推理成本。
英伟达数据中心以太网交换机收入暴增 192.7%，首次登顶全球第一 [17]：Spectrum-X 平台推动其从 GPU 厂商向全栈 AI 基础设施提供商跃迁。
AI 芯片普遍存在结构性浪费，GPU 平均利用率低于 20% [18]：行业共识正从“规模竞赛”转向“效率优化”，算力调度与缓存机制成新焦点。
阿里通义实验室发布 Wan Streamer，实现亚秒级全双工实时音视频对话 [23]：端到端 Transformer 模型同步生成语音与面部视频，具身交互再进一步。
开源上下文引擎 Hitmux-Context-Engine（HCE）发布，支持 Qwen3 Embedding + Milvus 自部署 [4]：低成本替代 ACE，强化本地化 RAG 工程能力。
Clay AI 负责人指出：增长团队已全面工程化运行 AI Agent [6]：核心能力建设转向数据闭环构建、信号筛选与可扩展 Agent 基础设施。
BrowserBC 开源项目实现“人类点击克隆” [12]：将单次网页操作转为自然语言技能，赋能轻量模型高效复用，基准成功率显著提升。

🔗 Sources

[1] Codex/Claude Code 上下文压缩实际体验与配套功能分享 — https://www.bestblogs.dev/status/2070904833939329477?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[2] 刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了 — https://www.bestblogs.dev/article/9a7132f3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[3] DeepSeek V4 新成果 DSpark 发布：推理速度更快 — https://www.bestblogs.dev/article/08d6d8e7?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[4] Hitmux-Context-Engine——开源替代 ACE — https://www.bestblogs.dev/article/1e6171ca?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[6] Clay AI

← 返回更新速报