在numpy热力图中获取“最热区域”的坐标

Question

在numpy热力图中获取“最热区域”的坐标

imagenumpyimage-processingcomputer-visionconv-neural-network

3

我有一个形状为（600,400）的热图numpy数组。该热图表示检测概率，具体来说，是在图像中检测脸部的概率。我的目标是从这个热图中获取最高概率出现的坐标（X和Y）。

我已经解决了单张脸的情况。代码如下：

face_location = np.unravel_index(heatmap.argmax(), heatmap.shape)
    print("Face location: " + str(face_location))

但在某些情况下，可能存在多个热点区域。我不知道如何调整算法以返回多个“最热区域”。问题在于任何一个热区域都会被逐渐较少热的区域包围。因此，在最热区域之后，下一个前10个最热区域都有可能紧贴初始点。

如何调整算法以查找多个热点区域？假设它们不会紧贴在一起也是可以的。

heatmap = [[  2.00299415e-04   2.03753079e-04   8.17560707e-04 ...,   2.23556344e-04
         1.98958180e-04   9.92935777e-01]
      [  2.00642273e-04   2.04473894e-04   8.19963054e-04 ...,   2.24148811e-04
         1.99438742e-04   9.92921114e-01]
      [  2.01056406e-04   2.05344462e-04   8.22864589e-04 ...,   2.24864416e-04
         2.00019145e-04   9.92903233e-01]
      ..., 
      [  7.28193991e-05  -2.73474743e-05   2.95096161e-05 ...,   5.96550672e-05
         1.98282614e-05   9.99637246e-01]
      [  7.34055429e-05  -2.72389279e-05   3.02382941e-05 ...,   5.98490733e-05
         2.04356711e-05   9.99619305e-01]
      [  7.37556256e-05  -2.71740992e-05   3.06735128e-05 ...,   5.99649393e-05
         2.07984649e-05   9.99608397e-01]]

- megashigger

如果我正确理解了你的问题，你可能想看一下这篇文章：如何在numpy数组中获取前N个最大值的索引？。 - Brad Solomon

2个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Laurentourte · Answer 1

如果您想采用davidrpugh提出的阈值方法，我有不同的建议。与其找到非零元素，不如找到二进制图像的连通组件。

import numpy as np
from scipy.ndimage.measurements import label
from skimage.measure import regionprops

heatmap = np.random.rand(100, 25)

thresh = 0.9
bw = np.array(heatmap)
bw[bw < thresh] = 0

img_cc, nb_cc = label(bw)
cc = regionprops(img_cc)

face_location = np.array([c.centroid for c in cc])

import matplotlib.pyplot as plt

plt.figure()
plt.imshow(heatmap)
plt.plot(face_location[:, 1], face_location[:, 0], 'r*')

plt.figure()
plt.imshow(img_cc)
plt.plot(face_location[:, 1], face_location[:, 0], 'r*')

plt.show()

脸部位置在这里由连通组件的中心定义，但您也可以在图像中查找每个区域的最大值。

- davidrpugh · Answer 2

也许考虑使用阈值概率定义热区的掩码数组？

In [29]: threshold_probability = 0.8

In [30]: prng = np.random.RandomState(42)

In [31]: heatmap = prng.rand(600, 400)

In [32]: heatmap
Out[32]: 
array([[ 0.37454012,  0.95071431,  0.73199394, ...,  0.42899403,
         0.75087107,  0.75454287],
       [ 0.10312387,  0.90255291,  0.50525237, ...,  0.56513318,
         0.69665082,  0.92249938],
       [ 0.70723863,  0.15253904,  0.57628836, ...,  0.96887786,
         0.74965183,  0.13008624],
       ..., 
       [ 0.77669933,  0.98757844,  0.72686576, ...,  0.149866  ,
         0.6685433 ,  0.90248875],
       [ 0.116007  ,  0.96352904,  0.33109138, ...,  0.85776718,
         0.88838363,  0.00901272],
       [ 0.30810176,  0.43190563,  0.60935151, ...,  0.07498895,
         0.60716006,  0.31712892]])

In [33]: hottest_areas = np.ma.MaskedArray(heatmap, heatmap < threshold_probability)

In [34]: X, Y = hottest_areas.nonzero()

In [35]: X
Out[35]: array([  0,   0,   0, ..., 599, 599, 599])

In [36]: Y
Out[36]: array([  1,   7,  11, ..., 376, 388, 394])

结果是一个元组，其中包含布尔条件定义掩码为False的值的x和y坐标（即，面部概率高于阈值的区域）。