triton.language.broadcast_to

1 功能作用说明

将张量广播到目标形状，自动处理维度对齐。广播操作不会复制数据，而是通过改变张量的形状和步长来实现。

语法：

triton.language.broadcast_to(input, shape) - 函数调用形式
input.broadcast_to(shape) - 成员函数形式

功能：

自动处理维度对齐，将大小为1的维度扩展到目标形状中对应维度的大小
保持数据不变，仅改变张量的形状信息

2 参数规格

2.1 参数说明

参数名	类型	必需	说明
input	tensor	是	输入张量
shape	List[int]	是	目标形状

返回值：

类型： tensor
形状： 与shape参数指定的目标形状相同
数据类型： 与输入张量相同
内存布局： 通过改变步长信息实现广播，无数据拷贝

约束条件：

输入张量的维度数必须等于目标形状的维度数
所有维度必须满足广播规则

2.2 DataType支持表

支持情况	int8	int16	int32	int64	uint8	uint16	uint32	uint64	float16	float32	bfloat16	float8e4	float8e5	float64	bool
Ascend A2/A3	✓	✓	✓	✓	✓	×	×	×	✓	✓	✓	×	×	×	✓
GPU支持	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓

2.3 Shape支持表

支持任意维度数、任意形状大小。

2.4 特殊限制说明

与broadcast不同，Triton社区实现的broadcast_to必须保证tensor的shape和目标shape的rank一致

2.5 使用方法

基本用法：

@triton.jit
def matrix_add_bias_kernel(x_ptr, bias_ptr, output_ptr, M, N, BLOCK_M: tl.constexpr, BLOCK_N: tl.constexpr):
    # 加载数据块
    x = tl.load(x_ptr + offsets, mask=mask)

    # 广播bias到匹配的形状
    bias = tl.load(bias_ptr)
    bias_broadcast = bias.broadcast_to([BLOCK_M, BLOCK_N])

    # 执行加法
    output = x + bias_broadcast
    tl.store(output_ptr + offsets, output, mask=mask)