Triton Ascend
快速开始
快速入门
安装指南
安装指南
Triton 算子开发指南
Triton算子开发指南
Triton 算子迁移指南
昇腾与GPU的开发差异
GPU Triton算子迁移
算子调试与调优
Triton-Ascend 调试指南
Triton-Ascend 性能分析方法
Triton API 接口说明
triton.language
triton
常见问题
Triton-Ascend FAQ
Triton Ascend
Triton Ascend
查看页面源码
Triton Ascend
快速开始
快速入门
项目简介
环境要求
环境搭建
运行Triton示例
安装指南
安装指南
环境准备
通过pip安装Triton-Ascend
通过源码安装Triton-Ascend
Triton 算子开发指南
Triton算子开发指南
多核任务并行
单核数据搬运
单核数据运算
Triton 算子迁移指南
昇腾与GPU的开发差异
多核任务并行策略
单核数据搬运策略
编译优化能力
GPU Triton算子迁移
多核任务并行
单核数据搬运
单核数据运算
常见问题概览
算子调试与调优
Triton-Ascend 调试指南
1 引言
2 Triton-Ascend 编译流程概览
3 Triton-Ascend 临时文件指引
4 解释器模式
5 调试方法
附录 A:常用环境变量速查表
Triton-Ascend 性能分析方法
获取性能数据
分析性能数据
Triton API 接口说明
triton.language
昇腾拓展API列表
原子操作
比较操作
编译器提示操作
创建操作
调试操作
索引与元素操作
内联汇编
迭代器
线性代数操作
逻辑操作
数学操作
内存/指针操作
编程模型
随机数生成
归约操作
扫描/排序操作
Shape操作
triton
常见问题
Triton-Ascend FAQ