DeepSeek V3.1发布引发国产算力芯片热潮，端侧AI芯片迎来发展新机遇

8月21日，DeepSeek V3.1模型发布，一句“UE8MO FP8针对下一代国产芯片设计”的补充留言，点燃A股算力板块热情——寒武纪涨停创新高、中芯国际大涨14%，超2800只个股上涨，背后是国产芯片切入国际前沿算力赛道以及端侧AI爆发的曙光。

FP8是AI大模型的关键浮点格式，能以8位存储降低显存带宽压力，但此前多数国产芯片仅支持FP16，基于FP8格式跑模型性能折损超50%。而DeepSeek基于OCP的MX格式，推出创新的UE8M0 FP8 通过“数据块单独配8位缩放因子”设计，既保存储效率，又让动态范围扩数十倍，实现“更快、更省、抗大数”，还降低硬件门槛，助力国产芯片尤其是端侧AI突破困局：

1，动态范围扩大千倍（2⁻¹²⁷至2¹²⁸），通过“数据切块并分别配备8位缩放因子”设计，像“智能分装系统”精准压缩数据，避免传统打包的“数据褶皱”问题；

2，硬件执行效率跃升，仅需8位无符号指数（U+E8+M0），运算简化如“快进键”，功耗直降50%；

3，带宽需求锐减75%，国产HBM芯片的“内存墙”迎刃而解！

在这场算力革命中，芯枥石半导体积极响应技术趋势，其研发的可重构计算芯片，可高效兼容UE8MO FP8格式，助力国产芯片规避复杂浮点运算、缩短计算路径，进一步释放FP8格式的能效优势。同时，芯枥石针对国产芯片常见的“带宽瓶颈”问题，推出专用编译器优化模块，能与UE8MO FP8的“8位管理32个FP8数据”特性深度协同，将带宽开销再降15%-20%，让大模型推理中实现“满血性能”。

DeepSeek此次布局是国产算力产业链的共振，芯枥石半导体也将持续深耕软硬件协同，以技术创新赋能国产芯片生态，与行业伙伴共迎中国算力“顿悟时刻”，推动国产芯片在国际算力竞争中抢占前沿阵地。

了解 XLS 的更多信息

订阅后即可通过电子邮件收到最新文章。

分享到：

赞过：

了解 XLS 的更多信息