DeepSeek V3.1发布引发国产算力芯片热潮,端侧AI芯片迎来发展新机遇
DeepSeek V3.1发布引发国产算力芯片热潮,端侧AI芯片迎来发展新机遇

DeepSeek V3.1发布引发国产算力芯片热潮,端侧AI芯片迎来发展新机遇

      8月21日,DeepSeek V3.1模型发布,一句“UE8MO FP8针对下一代国产芯片设计”的补充留言,点燃A股算力板块热情——寒武纪涨停创新高、中芯国际大涨14%,超2800只个股上涨,背后是国产芯片切入国际前沿算力赛道以及端侧AI爆发的曙光。
      FP8是AI大模型的关键浮点格式,能以8位存储降低显存带宽压力,但此前多数国产芯片仅支持FP16,基于FP8格式跑模型性能折损超50%。而DeepSeek基于OCP的MX格式,推出创新的UE8M0 FP8 通过“数据块单独配8位缩放因子”设计,既保存储效率,又让动态范围扩数十倍,实现“更快、更省、抗大数”,还降低硬件门槛,助力国产芯片尤其是端侧AI突破困局:
1, 动态范围扩大千倍(2⁻¹²⁷至2¹²⁸),通过“数据切块并分别配备8位缩放因子”设计,像“智能分装系统”精准压缩数据,避免传统打包的“数据褶皱”问题;
2, 硬件执行效率跃升,仅需8位无符号指数(U+E8+M0),运算简化如“快进键”,功耗直降50%;
3, 带宽需求锐减75%,国产HBM芯片的“内存墙”迎刃而解!
      在这场算力革命中,芯枥石半导体积极响应技术趋势,其研发的可重构计算芯片,可高效兼容UE8MO FP8格式,助力国产芯片规避复杂浮点运算、缩短计算路径,进一步释放FP8格式的能效优势。同时,芯枥石针对国产芯片常见的“带宽瓶颈”问题,推出专用编译器优化模块,能与UE8MO FP8的“8位管理32个FP8数据”特性深度协同,将带宽开销再降15%-20%,让大模型推理中实现“满血性能”。
DeepSeek此次布局是国产算力产业链的共振,芯枥石半导体也将持续深耕软硬件协同,以技术创新赋能国产芯片生态,与行业伙伴共迎中国算力“顿悟时刻”,推动国产芯片在国际算力竞争中抢占前沿阵地。

了解 XLS 的更多信息

订阅后即可通过电子邮件收到最新文章。