搜索数组以查找相似的对象。

3

给定一个像这样的数组:

$array = array( 
            0 => array (
               0 => 35,
               1 => 30, 
               2 => 39
            ),
            1 => array (
               0 => 20,
               1 => 12, 
               2 => 5
            ),
            ...

            n => array (
               0 => 10,
               1 => 15, 
               2 => 7
            ),
         );

我需要找到数组中与给定参数最接近的条目。

find($a, $b, $c) {
  //return the closer entry to the input
}

更靠近输入值的条目,我指的是具有更接近输入值的数值的条目,例如传递(19,13,3),它应返回 $array [1]

我目前进行计算的方式是遍历整个数组,保持一个从-1开始的变量$distance和一个临时的$result变量。对于每个元素,我计算距离。

$dist = abs( subarray[0] - $a ) + abs ( subarray[1] - $b ) + abs( subarray[2] - $c ) 

如果计算出的距离等于-1或小于循环外的变量$distance,则将新距离分配给该变量,并将相应的数组保存在$result变量中。 循环结束时,我最终得到所需的值。
另外,其中一个值可以为空:例如(19、13、false),仍应返回$array[1],然后计算应忽略缺失的参数 - 在这种情况下,距离被计算为
$dist = abs( subarray[0] - $a ) + abs ( subarray[1] - $b );

忽略subarray [2]和$c的值。

问题是,即使我的代码有效,由于数组的大小可以轻松地增加到数十万个元素,因此执行所需的时间太长。我们仍在谈论毫秒级别,但出于各种原因,这仍然是不可接受的。 有没有更有效的方法来进行搜索以节省一些时间?

2个回答

1
我基本上使用了接近度的概念(每个数组的总距离更短),并返回了它。该代码可以在许多例程中得到很好的改进。
PS:我没有使用先进的函数或其他东西,因为您关注性能问题。这是我在短时间内最简单的例程。
$array = array(
    0 => array (
        0 => 35,
        1 => 30,
        2 => 39
    ),
    1 => array (
        0 => 20,
        1 => 12,
        2 => 5
    ),
);

$user = array(19,13,3);

function find($referencial, $input){
    $totalRef = count($referencial);
    if (is_array($referencial)){
        for ($i = 0; $i < $totalRef; $i++) {
            if (is_array($referencial[$i])){
                $totalSubRef = count($referencial[$i]);
                $proximity = array();
                for ($j = 0; $j < $totalSubRef; $j++) {
                    $proximity[$i] += abs($referencial[$i][$j] - $input[$j]);
                }
                if ($i > 0){
                    if ($maxProximity['distance'] > $proximity[$i]) {
                        $maxProximity['distance'] = $proximity[$i];
                        $maxProximity['index'] = $i;
                    }
                } else {
                    $maxProximity['distance'] = $proximity[$i];
                    $maxProximity['index'] = $i;
                }
            }
        }
        return $maxProximity;
    } else {
        exit('Unexpected referencial. Must be an array.');
    }
}

$found = find($array, $user);
print_r($found);
//Array ( [distance] => 4 [index] => 1 )
print_r($array[$found['index']]);
// Array ( [0] => 20 [1] => 12 [2] => 5 )

1

一个自定义函数 - 也许还有更好的方法,但是可以检查一下:

简而言之:

搜索所有项目,并以百分比的形式查找它检查的数字($mArray [0...3])和您提供的数字($mNumbersToFind [0...3])之间的差异。添加每个元素的三个数字(可能性)- 找到最大值 - 保留位置并返回数组。

$array = array( 
            array (
               0 => 13,
               1 => 15, 
               2 => 4
            ),
            array (
               0 => 20,
               1 => 12, 
               2 => 5
            ),

            array (
               0 => 13,
               1 => 3, 
               2 => 15
            ),
         );


$mNumbersToFind = array(13,3,3);

$mFoundArray = find($mNumbersToFind, $array);

echo "mFinalArray : <pre>";
print_r($mFoundArray);


function find($mNumbersToFind, $mArray){

    $mPossibilityMax = count($mNumbersToFind);
    $mBiggestPossibilityElementPosition = 0;
    $mBiggestPossibilityUntilNow = 0;


    foreach($mArray as $index => $current){

        $maxPossibility = 0;

        foreach($current as $subindex => $subcurrent){



            $mTempArray[$index][$subindex]['value'] = $subcurrent - $mNumbersToFind[$subindex];

            $percentChange = (1 - $mTempArray[$index][$subindex]['value'] / $subcurrent) * 100;
            $mTempArray[$index][$subindex]['possibility'] = $percentChange;
            $maxPossibility += $percentChange/$mPossibilityMax;


        }


        $mTempArray[$index]['final_possibility'] = $maxPossibility;

        if($maxPossibility > $mBiggestPossibilityUntilNow){
            $mBiggestPossibilityUntilNow = $maxPossibility;
            $mBiggestPossibilityElementPosition = $index;
        }



    }

    echo "mTempArray : <pre>"; // Remove this - it's just for debug
    print_r($mTempArray); // Remove this - it's just for debug

    return $mArray[$mBiggestPossibilityElementPosition];
}

调试输出 ($mTempArray) :
mTempArray :
Array
(
    [0] => Array
        (
            [0] => Array
                (
                    [value] => 0
                    [possibility] => 100
                )

            [1] => Array
                (
                    [value] => 12
                    [possibility] => 20
                )

            [2] => Array
                (
                    [value] => 1
                    [possibility] => 75
                )

            [final_possibility] => 65
        )

    [1] => Array
        (
            [0] => Array
                (
                    [value] => 7
                    [possibility] => 65
                )

            [1] => Array
                (
                    [value] => 9
                    [possibility] => 25
                )

            [2] => Array
                (
                    [value] => 2
                    [possibility] => 60
                )

            [final_possibility] => 50
        )

    [2] => Array
        (
            [0] => Array
                (
                    [value] => 0
                    [possibility] => 100
                )

            [1] => Array
                (
                    [value] => 0
                    [possibility] => 100
                )

            [2] => Array
                (
                    [value] => 12
                    [possibility] => 20
                )

            [final_possibility] => 73.333333333333
        )

)

最终输出:

mFinalArray : 
Array
(
    [0] => 13
    [1] => 3
    [2] => 15
)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接