如何在Keras(和TensorFlow)中编写负二项分布损失函数?

4
我正在使用负二项分布来建模变量。与预测期望均值不同,我更愿意建模分布的两个参数。因此,神经网络的输出层由两个神经元组成。为此,我需要编写一个自定义损失函数。但以下代码无法正常工作——似乎存在遍历张量的问题。
在Keras(和TensorFlow)中,如何编写负二项分布的损失函数?
我只需要重写此代码,并使其符合TensorFlow张量的格式要求。根据我得到的错误,也许"tensorflow.map_fn"可以提供解决方案,但我尝试了没有成功。
一般情况下,该方法运行良好,但是在Keras/Tensorflow中无法正常运行。
from scipy.stats import nbinom
from keras import backend as K
import tensorflow as tf

def loss_neg_bin(y_pred, y_true):

    result = 0.0
    for p, t in zip(y_pred, y_true):
        result += -nbinom.pmf(t, p[0], min(0.99, p[1]))

    return result

我遇到的错误:

类型错误:只有在启用eager执行时,张量对象才可迭代。要对此张量进行迭代,请使用tf.map_fn。


1
你尝试过使用这个吗? - Vlad
谢谢,这似乎是分布的另一个定义,没有明确的方法来将其用于损失函数。此外,它已经被弃用了,建议使用tensorflow-probability库进行链接,这似乎很有前途,但我想使用不同的方式... - gugatr0n1c
1个回答

3

您需要使用tf.map_fn来实现循环,tf.py_func来包装nbinom.pmf。例如:

from scipy.stats import nbinom
import tensorflow as tf

def loss_neg_bin(y_pred, y_true):
    result = 0.0
    for p, t in zip(y_pred, y_true):
        result += -nbinom.pmf(t, p[0], min(0.99, p[1]))
    return result

y_pred= [[0.4, 0.4],[0.5, 0.5]]
y_true= [[1, 2],[1, 2]]
print('your version:\n',loss_neg_bin(y_pred, y_true))

def loss_neg_bin_tf(y_pred, y_true):
    result = tf.map_fn(lambda x:tf.py_func(lambda p,t:-nbinom.pmf(t, p[0], min(0.99,p[1]))
                                           ,x
                                           ,tf.float64)
                       ,(y_pred,y_true)
                       ,dtype=tf.float64)
    result = tf.reduce_sum(result,axis=0)
    return result

y_pred_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
y_true_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
loss = loss_neg_bin_tf(y_pred_tf, y_true_tf)

with tf.Session() as sess:
    print('tensorflow version:\n',sess.run(loss,feed_dict={y_pred_tf:y_pred,y_true_tf:y_true}))

# print
your version:
 [-0.34313146 -0.13616026]
tensorflow version:
 [-0.34313146 -0.13616026]

此外,如果您使用tf.py_func计算负二项分布作为损失反馈模型的概率质量函数,则需要自己定义梯度函数。 更新--添加可微分的负二项式损失 nbinom的概率质量函数为:
nbinom.pmf(k) = choose(k+n-1, n-1) * p**n * (1-p)**k

根据scipy.stats.nbinom,当 k >= 0 时。

因此我添加了可微的负二项式损失版本。

import tensorflow as tf

def nbinom_pmf_tf(x,n,p):
    coeff = tf.lgamma(n + x) - tf.lgamma(x + 1) - tf.lgamma(n)
    return tf.cast(tf.exp(coeff + n * tf.log(p) + x * tf.log(1 - p)),dtype=tf.float64)

def loss_neg_bin_tf_differentiable(y_pred, y_true):
    result = tf.map_fn(lambda x: -nbinom_pmf_tf(x[1]
                                                , x[0][0]
                                                , tf.minimum(tf.constant(0.99,dtype=tf.float64),x[0][1]))
                       ,(y_pred,y_true)
                       ,dtype=tf.float64)
    result = tf.reduce_sum(result,axis=0)
    return result

y_pred_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
y_true_tf = tf.placeholder(shape=(None,2),dtype=tf.float64)
loss = loss_neg_bin_tf_differentiable(y_pred_tf, y_true_tf)
grads = tf.gradients(loss,y_pred_tf)

y_pred= [[0.4, 0.4],[0.5, 0.5]]
y_true= [[1, 2],[1, 2]]
with tf.Session() as sess:
    print('tensorflow differentiable version:')
    loss_val,grads_val = sess.run([loss,grads],feed_dict={y_pred_tf:y_pred,y_true_tf:y_true})
    print(loss_val)
    print(grads_val)

# print
tensorflow differentiable version:
[-0.34313146 -0.13616026]
[array([[-0.42401619,  0.27393084],
       [-0.36184822,  0.37565048]])]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接