Triton-Ascend FAQ

1. 安装与环境配置

Q: 如何正确安装 Triton-Ascend?是否支持 pip 直接安装?

A: 可以直接使用pip 安装

pip install triton-ascend

Q: 能否在非 Ascend 硬件(如 CUDA AMD)上使用 Triton-Ascend?

A: 不可以,只能在 Ascend NPU 硬件环境使用 Triton-Ascend

2. 精度与数值一致性问题

Q: NPU 运行结果和 PyTorch/CPU/GPU 参考结果不一致,如何排查?

A: 用例请参考 07_accuracy_comparison_example.md 调试方法请参考 解释器模式调试方法

3. 错误代码与异常处理

Q: 为什么 kernel 编译时报 MLIRCompilationError?如何定位具体失败的 Pass?

A: 请参考 编译错误调试方法

Q: 遇到 Segmentation Fault(core dump)如何调试?

A: core dump 调试方法,请参考 使用GDB调试

4. 调试与日志

Q: 如何开启详细日志输出?TRITON_DEBUG=1 输出在哪?

A: 可以使用 TRITON_DEBUG=1 获取详细的调试转储文件,请参考 调试转储文件(Dump Files)

Q: 能否在 kernel 中打印中间张量值?tl.device_print 是否可用?

A: 可以使用 tl.device_print 打印 kernel 中的张量,请参考 打印调试方法

5. 开发与贡献

Q: 如何本地构建并测试 Triton-Ascend?

A: 本地构建和测试方法,请参考 通过源码安装Triton-Ascend

Q: 提交 PR 需要通过哪些 CI 检查?

A: PR 的 CI 检查包括:编码安全与规范检查、开源片段检查、恶意代码检查、编译构建、开发者测试

6. 性能调优

Q: 有没有性能分析工具(profiler)可以使用?

A: 有集成性能分析工具(profiler),请参考 算子性能调优方法