我很乐意帮您理解TensorFlow函数之间的区别。
作为他们的API中几乎具有相同的描述, 我通常会通过
例如,权重是否应使用
类似地,查看
tf.fake_quant_with_min_max_args
tf.fake_quant_with_min_max_vars
作为他们的API中几乎具有相同的描述, 我通常会通过
tf.fake_quant_with_min_max_vars
手动量化所需节点,但不确定是否正确。例如,权重是否应使用
tf.fake_quant_with_min_max_args
?类似地,查看
quantize.Quantize
代码,我理解它基本上是遍历图形,查找兼容张量,并根据全局步骤添加标识 / 量化节点。但是,我应该了解到并非所有操作都被量化(例如conv1d,尽管conv2d和mat/mul是)。该库是否将来支持所有操作?