Python - Theano scan()函数

Question

Python - Theano scan()函数

10

我无法完全理解theano.scan()的行为。

这里有一个例子：

import numpy as np
import theano
import theano.tensor as T


def addf(a1,a2):
        return a1+a2

i = T.iscalar('i')
x0 = T.ivector('x0') 
step= T.iscalar('step')

results, updates = theano.scan(fn=addf,
                   outputs_info=[{'initial':x0, 'taps':[-2]}],
                   non_sequences=step,
                   n_steps=i)

f=theano.function([x0,i,step],results)

print f([1,1],10,2)

上面的代码片段打印了以下序列，这是非常合理的：

[ 3  3  5  5  7  7  9  9 11 11]

然而，如果我将水龙头索引从-2切换到-1，即：

outputs_info=[{'initial':x0, 'taps':[-1]}]

结果变为：

[[ 3  3]
 [ 5  5]
 [ 7  7]
 [ 9  9]
 [11 11]
 [13 13]
 [15 15]
 [17 17]
 [19 19]
 [21 21]]

与我认为的合理方式不同（只需取向量的最后一个值并加上2）：

[ 3  5  7  9 11 13 15 17 19 21]

任何帮助都将不胜感激。

谢谢！

- Nfys

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- nouiz · Accepted Answer

当你使用taps=[-1]时，扫描假设输出信息中的信息原样使用。这意味着addf函数将被调用，其中向量和非序列作为输入。如果将x0转换为标量，则它将按预期工作：

import numpy as np
import theano
import theano.tensor as T


def addf(a1,a2):
        print a1.type
        print a2.type
        return a1+a2

i = T.iscalar('i')
x0 = T.iscalar('x0') 
step= T.iscalar('step')

results, updates = theano.scan(fn=addf,
                   outputs_info=[{'initial':x0, 'taps':[-1]}],
                   non_sequences=step,
                   n_steps=i)

f=theano.function([x0,i,step],results)

print f(1,10,2)

这将产生以下输出：

TensorType(int32, scalar)
TensorType(int32, scalar)
[ 3  5  7  9 11 13 15 17 19 21]

在您的情况下，由于它执行addf(vector, scalar)，因此它会广播元素值。

换句话说，如果taps为[-1]，x0将“按原样”传递给内部函数。如果taps包含其他任何内容，则传递到内部函数的内容将比x0少1维，因为x0必须提供许多初始步骤值（-2和-1）。