Pytorch中的多维张量点积

3
我有两个张量,形状分别为(8, 1, 128),如下所示。
q_s.shape
Out[161]: torch.Size([8, 1, 128])

p_s.shape
Out[162]: torch.Size([8, 1, 128])

上面的两个张量表示一个批次包含8个128维向量。我想要计算批次q_s和批次p_s的点积。我该怎么做?我尝试使用torch.tensordot函数,如下所示。它也能正常工作,但它还会做额外的工作,而我不想让它这样做。请看下面的例子。
dt = torch.tensordot(q_s, p_s, dims=([1,2], [1,2]))

dt
Out[176]: 
tensor([[0.9051, 0.9156, 0.7834, 0.8726, 0.8581, 0.7858, 0.7881, 0.8063],
        [1.0235, 1.5533, 1.2155, 1.2048, 1.3963, 1.1310, 1.1724, 1.0639],
        [0.8762, 1.3490, 1.2923, 1.0926, 1.4703, 0.9566, 0.9658, 0.8558],
        [0.8136, 1.0611, 0.9131, 1.1636, 1.0969, 0.9443, 0.9587, 0.8521],
        [0.6104, 0.9369, 0.9576, 0.8773, 1.3042, 0.7900, 0.8378, 0.6136],
        [0.8623, 0.9678, 0.8163, 0.9727, 1.1161, 1.6464, 0.9765, 0.7441],
        [0.6911, 0.8392, 0.6931, 0.7325, 0.8239, 0.7757, 1.0456, 0.6657],
        [0.8493, 0.8174, 0.8041, 0.9013, 0.8003, 0.7451, 0.7408, 1.1771]],
       grad_fn=<AsStridedBackward>)

dt.shape
Out[177]: torch.Size([8, 8])

我们可以看到,这会产生一个大小为(8,8)的张量,其中我想要的点积位于对角线上。有没有其他方法来获得所需形状为(8,1)的较小张量,它只包含上述结果中位于对角线上的元素。更明确地说,位于对角线上的元素是我们希望作为两个批次的点积正确所需的点积。索引[0][0]处的元素是q_s[0]和p_s[0]的点积。索引[1][1]处的元素是q_s[1]和p_s[1]的点积,依此类推。

在pytorch中,是否有更好的方法来获得所需的点积?

返回结果:
我们可以看到,这会产生一个大小为(8,8)的张量,其中我想要的点积位于对角线上。有没有其他方法来获得所需形状为(8,1)的较小张量,它只包含上述结果中位于对角线上的元素。更明确地说,位于对角线上的元素是我们希望作为两个批次的点积正确所需的点积。索引[0][0]处的元素是q_s[0]和p_s[0]的点积。索引[1][1]处的元素是q_s[1]和p_s[1]的点积,依此类推。在pytorch中,是否有更好的方法来获得所需的点积?
1个回答

5

您可以直接执行:

a = torch.rand(8, 1, 128)
b = torch.rand(8, 1, 128)

torch.sum(a * b, dim=(1, 2))
# tensor([29.6896, 30.4994, 32.9577, 30.2220, 33.9913, 35.1095, 32.3631, 30.9153])    

torch.diag(torch.tensordot(a, b, dim=([1,2], [1,2])))
# tensor([29.6896, 30.4994, 32.9577, 30.2220, 33.9913, 35.1095, 32.3631, 30.9153])

如果您在求和中设置axis=2,您将获得一个形状为(8,1)的张量。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接