10月3日,DeepSeek V3.2-Exp 正式上线并官宣支持国产AI算子编程语言TileLang,同步发布V3.2算子示例,标志着“同一语义、跨多后端”的TileLang获得业界权威认可。由山东大学联合北京大学、复旦大学及算能科技共同推进的TileLang-TPU项目,近日在BM1684X、SC11等智算平台完成主流大模型算子的工程验证,成功跑通从算子表达、代码生成到设备执行的全链路闭环。

TileLang-TPU项目由北大牵头,山东大学智能创新研究院团队深度参与算子开发与模型适配工作。项目秉持“少惊扰、强约束”原则,实现TileLang前端到算能TPU后端的自动映射与性能优化,显著降低国产芯片算子开发门槛。目前,DeepSeek V3满血版在4卡SC11上吞吐超过600 tokens/s,验证了TileLang在国产TPU场景下的高效性与可扩展性。
TileLang能够将高级别的数据流描述自动转换并优化为高效的底层代码,通过独特的Tile级抽象和自动调度能力,开发者可以用更简洁的代码表达复杂计算,快速开发接近峰值性能的算子,显著提升算子开发效率。TileLang-TPU的成功验证,将进一步加深算能与高校、开源社区的合作深度,为完善国产芯片软件栈打造一个经典范式。
未来,山东大学智能创新研究院将持续深化与高校、企业合作,推动TileLang-TPU开源落地,助力国产AI芯片生态高质量发展,实现“一次改写、多平台复用”的目标,为国产芯片生态的繁荣贡献山大力量。