Triton-Ascend FAQ

1. 安装与环境配置

Q: 如何正确安装 Triton-Ascend？是否支持 pip 直接安装？

A: 可以直接使用pip 安装

pip install triton-ascend

Q: 能否在非 Ascend 硬件（如 CUDA AMD）上使用 Triton-Ascend？

A: 不可以，只能在 Ascend NPU 硬件环境使用 Triton-Ascend

Q: NPU 运行结果和 PyTorch/CPU/GPU 参考结果不一致，如何排查？

A: 用例请参考 07_accuracy_comparison_example.md 调试方法请参考解释器模式调试方法

Q: 为什么 kernel 编译时报 MLIRCompilationError？如何定位具体失败的 Pass？

Q: 遇到 Segmentation Fault（core dump）如何调试？

A: core dump 调试方法，请参考使用GDB调试

Q: 如何开启详细日志输出？TRITON_DEBUG=1 输出在哪？

A: 可以使用 TRITON_DEBUG=1 获取详细的调试转储文件，请参考调试转储文件（Dump Files）

Q: 能否在 kernel 中打印中间张量值？tl.device_print 是否可用？

A: 可以使用 tl.device_print 打印 kernel 中的张量，请参考打印调试方法

Q: 如何本地构建并测试 Triton-Ascend？

A: 本地构建和测试方法，请参考通过源码安装Triton-Ascend

Q: 提交 PR 需要通过哪些 CI 检查？

A: PR 的 CI 检查包括：编码安全与规范检查、开源片段检查、恶意代码检查、编译构建、开发者测试

Q: 有没有性能分析工具（profiler）可以使用？

A: 有集成性能分析工具（profiler），请参考算子性能调优方法