DeepSeek开源TileKernels:面向大语言模型的GPU算子库
- 内容介绍
- 文章标签
- 相关推荐
DeepSeek于刚刚在GitHub上开源了名为TileKernels的GPU算子项目,该仓库以MIT协议发布,定位为面向大语言模型训练与推理场景的高性能GPU算子集合,底层基于TileLang构建。作者署名包括王翔文、徐晨浩、曹焕琪、田瑞、赵伟霖、余快与赵成钢。
GitHub - deepseek-ai/TileKernels: A kernel library written in tilelang
A kernel library written in tilelang
据仓库README介绍,TileLang是一种用于在Python中表达高性能GPU算子的领域特定语言,具备易迁移、敏捷开发与自动优化的特性。项目方表示,库中大部分算子在算力强度与显存带宽方面已接近硬件性能极限,其中部分算子已应用于DeepSeek内部的训练与推理流程;不过官方也注明这些代码并不代表最佳实践,目前仍在持续改进代码质量与文档。
image620×441 51 KB
运行环境方面,项目要求Python 3.10及以上、PyTorch 2.10及以上、TileLang 0.1.9及以上,并需配备NVIDIA SM90或SM100架构GPU以及CUDA 13.1以上工具链。
网友解答:--【壹】--:
适配吧,部署卡没啥问题,训练卡听说效率很差。上次消息说训练完了优先给华为适配
--【贰】--:
不是说转到华为了吗,怎么还在这里优化N卡呀,有没有懂得佬出来介绍一下
--【叁】--:
在 python 上优化啊。
DeepSeek于刚刚在GitHub上开源了名为TileKernels的GPU算子项目,该仓库以MIT协议发布,定位为面向大语言模型训练与推理场景的高性能GPU算子集合,底层基于TileLang构建。作者署名包括王翔文、徐晨浩、曹焕琪、田瑞、赵伟霖、余快与赵成钢。
GitHub - deepseek-ai/TileKernels: A kernel library written in tilelang
A kernel library written in tilelang
据仓库README介绍,TileLang是一种用于在Python中表达高性能GPU算子的领域特定语言,具备易迁移、敏捷开发与自动优化的特性。项目方表示,库中大部分算子在算力强度与显存带宽方面已接近硬件性能极限,其中部分算子已应用于DeepSeek内部的训练与推理流程;不过官方也注明这些代码并不代表最佳实践,目前仍在持续改进代码质量与文档。
image620×441 51 KB
运行环境方面,项目要求Python 3.10及以上、PyTorch 2.10及以上、TileLang 0.1.9及以上,并需配备NVIDIA SM90或SM100架构GPU以及CUDA 13.1以上工具链。
网友解答:--【壹】--:
适配吧,部署卡没啥问题,训练卡听说效率很差。上次消息说训练完了优先给华为适配
--【贰】--:
不是说转到华为了吗,怎么还在这里优化N卡呀,有没有懂得佬出来介绍一下
--【叁】--:
在 python 上优化啊。

