ZAKER 科技 2 月 28 日消息,国内 AI 明星公司 DeepSeek 为期五天的 " 开源周 " 今日结束,其于 2 月 24 日正式启动,计划开源 5 个代码库,旨在与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。
在这五天里,DeepSeek 先后开源了 FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe 和 EPLB)以及面向全数据访问的推进器 3FS(Fire-Flyer 文件系统)多个项目。
FlashMLA 是专为英伟达 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列设计;DeepEP 是首个用于 MoE(混合专家模型)训练和推理的开源 EP 通信库;而 DeepGEMM 则提供支持给 V3/R1 的训练和推理;DualPipe 是一种用于 V3/R1 训练中计算与通信重叠的双向管道并行算法。
这些代码库将提供给全球开发者二次开发和改进,并有望促进 AI 技术在更广泛领域应用上取得突破。