DeepSeek发布开源第一弹！让大模型在GPU上跑得更快_快讯

DeepSeek发布开源第一弹！让大模型在GPU上跑得更快

2025-02-25 16:37 DeepSeek

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。简单来说，FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的优化方案，尤其适用于高性能AI任务。这一代码能够加速大语言模型的解码过程，从而提高模型的响应速度和吞吐量，这对于实时生成任务（如聊天机器人、文本生成等）尤为重要。