Gem
🎉AI 圈重大消息!在 DeepSeek 开源周的第 3 天,DeepGEMM 震撼发布啦👏!
这是一款超厉害的 FP8 GEMM 库,专为 NVIDIA Hopper 架构设计。仅约 300 行 CUDA 代码,就实现了超高性能。在 H800 GPU 上普通 GEMM 最高能实现 2.7 倍的速度提升。而且还支持普通和混合专家分组运算,为大规模 AI 模型训练和推理提供了强大助力。
它采用即时编译技术,无需预编译,部署超方便。有了 DeepGEMM,千亿参数大模型训练周期都能从数周缩短至几天,简直太牛了!
DeepSeek 这次的开源举措,无疑为 AI 开发者和研究人员提供了一个超棒的工具。相信会有更多的开发者基于 DeepGEMM 进行创新和优化,推动 AI 技术迈向新的高度。#DeepSeek #DeepGEMM #AI 训练与推理 #开源项目