5月25日 AI 速报 · 第 326 期

2026-05-25 16:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-07-09 审核状态: 待编辑审核 AI速报速报官方 AI动态开源

## 🔍 核心洞察中国AI公司**面壁智能**联合清华与OpenBMB，以**1.58-bit三值量化**技术突破端侧大模型部署瓶颈，在华为昇腾平台实现**600亿参数模型**的端到端训练，显存节省约6倍且保留97%能力 [1]；与此同时，**连续空间语言建模**新范式正挑战传统**token-based自回归架构**的结构性天花板，被视为通向AGI的关键路径演进 [6]。 ## 🚀 重点动态 - **BitCPM-CANN三值大模型系列发布** [1]：面壁智能等实现600亿参数模型在昇腾平台端到端训练，1.58-bit量化下缓存效率与能力保持双优 - **Reasonix工具大幅提升DeepSeek V4推理经济性** [4]：专为V4设计的append-only缓存机制达成**99.82%缓存命中率**，API成本直降80% - **2026智源大会官宣阵容** [5]：图灵奖得主领衔，中国大模型第一梯队集结，聚焦**智能体、世界模型、具身智能**三大前沿方向 - **Kimi正式发布TypeScript版kimi-code** [2]：重构原Python CLI工具，强化工程健壮性与生态兼容性，引发开发者社区热议 - **“Token必须死？”引发范式反思** [6]：何恺明团队与字节Seed实验室提出连续空间语言建模，挑战自回归token范式的根本局限 - **AI Coding时代核心矛盾再定义** [3]：行业共识转向“执行力>想法”，高效落地能力成为产品竞争力分水岭 ## 🔗 Sources [1] 将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了 — https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [2] Kimi 推出 TypeScript 版 kimi-code，调侃当年 Python 版争议 — https://www.bestblogs.dev/status/2058782251886817432?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [3] AI Coding 时代：执行力比想法更重要 — https://www.bestblogs.dev/status/2058782129564340464?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [4] DeepSeek V4 还能更省！新工具缓存命中率高达 99.82%，2 折稳定到手 — https://www.bestblogs.dev/article/b3629108?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [5] 图灵奖得主领衔，中国大模型第一梯队集结！2026 智源大会，看懂 AI 下一程 — https://www.bestblogs.dev/article/00d8987b?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item [6] “Token”必须死？ — https://www.bestblogs.dev/article/3bb425e2?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

中国AI公司面壁智能联合清华与OpenBMB，以1.58-bit三值量化技术突破端侧大模型部署瓶颈，在华为昇腾平台实现600亿参数模型的端到端训练，显存节省约6倍且保留97%能力 [1]；与此同时，连续空间语言建模新范式正挑战传统token-based自回归架构的结构性天花板，被视为通向AGI的关键路径演进 [6]。

🚀 重点动态

BitCPM-CANN三值大模型系列发布 [1]：面壁智能等实现600亿参数模型在昇腾平台端到端训练，1.58-bit量化下缓存效率与能力保持双优
Reasonix工具大幅提升DeepSeek V4推理经济性 [4]：专为V4设计的append-only缓存机制达成99.82%缓存命中率，API成本直降80%
2026智源大会官宣阵容 [5]：图灵奖得主领衔，中国大模型第一梯队集结，聚焦智能体、世界模型、具身智能三大前沿方向
Kimi正式发布TypeScript版kimi-code [2]：重构原Python CLI工具，强化工程健壮性与生态兼容性，引发开发者社区热议
“Token必须死？”引发范式反思 [6]：何恺明团队与字节Seed实验室提出连续空间语言建模，挑战自回归token范式的根本局限
AI Coding时代核心矛盾再定义 [3]：行业共识转向“执行力>想法”，高效落地能力成为产品竞争力分水岭

🔗 Sources

[1] 将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了 — https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[2] Kimi 推出 TypeScript 版 kimi-code，调侃当年 Python 版争议 — https://www.bestblogs.dev/status/2058782251886817432?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[3] AI Coding 时代：执行力比想法更重要 — https://www.bestblogs.dev/status/2058782129564340464?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[4] DeepSeek V4 还能更省！新工具缓存命中率高达 99.82%，2 折稳定到手 — https://www.bestblogs.dev/article/b3629108?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[5] 图灵奖得主领衔，中国大模型第一梯队集结！2026 智源大会，看懂 AI 下一程 — https://www.bestblogs.dev/article/00d8987b?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
[6] “Token”必须死？ — https://www.bestblogs.dev/article/3bb425e2?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

← 返回更新速报