如何进一步优化这个颜色差异函数?

12
我已经编写了一个用于计算CIE Lab颜色空间中颜色差异的函数,但速度较慢。由于我不是Java专家,我想知道是否有Java高手可以提供一些改进速度的技巧。
该代码基于评论块中提到的matlab函数。
/**
 * Compute the CIEDE2000 color-difference between the sample color with
 * CIELab coordinates 'sample' and a standard color with CIELab coordinates
 * 'std'
 *
 * Based on the article:
 * "The CIEDE2000 Color-Difference Formula: Implementation Notes,
 * Supplementary Test Data, and Mathematical Observations,", G. Sharma,
 * W. Wu, E. N. Dalal, submitted to Color Research and Application,
 * January 2004.
 * available at http://www.ece.rochester.edu/~gsharma/ciede2000/
 */
public static double deltaE2000(double[] lab1, double[] lab2)
{
    double L1 = lab1[0];
    double a1 = lab1[1];
    double b1 = lab1[2];

    double L2 = lab2[0];
    double a2 = lab2[1];
    double b2 = lab2[2];

    // Cab = sqrt(a^2 + b^2)
    double Cab1 = Math.sqrt(a1 * a1 + b1 * b1);
    double Cab2 = Math.sqrt(a2 * a2 + b2 * b2);

    // CabAvg = (Cab1 + Cab2) / 2
    double CabAvg = (Cab1 + Cab2) / 2;

    // G = 1 + (1 - sqrt((CabAvg^7) / (CabAvg^7 + 25^7))) / 2
    double CabAvg7 = Math.pow(CabAvg, 7);
    double G = 1 + (1 - Math.sqrt(CabAvg7 / (CabAvg7 + 6103515625.0))) / 2;

    // ap = G * a
    double ap1 = G * a1;
    double ap2 = G * a2;

    // Cp = sqrt(ap^2 + b^2)
    double Cp1 = Math.sqrt(ap1 * ap1 + b1 * b1);
    double Cp2 = Math.sqrt(ap2 * ap2 + b2 * b2);

    // CpProd = (Cp1 * Cp2)
    double CpProd = Cp1 * Cp2;

    // hp1 = atan2(b1, ap1)
    double hp1 = Math.atan2(b1, ap1);
    // ensure hue is between 0 and 2pi
    if (hp1 < 0) {
        // hp1 = hp1 + 2pi
        hp1 += 6.283185307179586476925286766559;
    }

    // hp2 = atan2(b2, ap2)
    double hp2 = Math.atan2(b2, ap2);
    // ensure hue is between 0 and 2pi
    if (hp2 < 0) {
        // hp2 = hp2 + 2pi
        hp2 += 6.283185307179586476925286766559;
    }

    // dL = L2 - L1
    double dL = L2 - L1;

    // dC = Cp2 - Cp1
    double dC = Cp2 - Cp1;

    // computation of hue difference
    double dhp = 0.0;
    // set hue difference to zero if the product of chromas is zero
    if (CpProd != 0) {
        // dhp = hp2 - hp1
        dhp = hp2 - hp1;
        if (dhp > Math.PI) {
            // dhp = dhp - 2pi
            dhp -= 6.283185307179586476925286766559;
        } else if (dhp < -Math.PI) {
            // dhp = dhp + 2pi
            dhp += 6.283185307179586476925286766559;
        }
    }

    // dH = 2 * sqrt(CpProd) * sin(dhp / 2)
    double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

    // weighting functions
    // Lp = (L1 + L2) / 2 - 50
    double Lp = (L1 + L2) / 2 - 50;

    // Cp = (Cp1 + Cp2) / 2
    double Cp = (Cp1 + Cp2) / 2;

    // average hue computation
    // hp = (hp1 + hp2) / 2
    double hp = (hp1 + hp2) / 2;

    // identify positions for which abs hue diff exceeds 180 degrees
    if (Math.abs(hp1 - hp2) > Math.PI) {
        // hp = hp - pi
        hp -= Math.PI;
    }
    // ensure hue is between 0 and 2pi
    if (hp < 0) {
        // hp = hp + 2pi
        hp += 6.283185307179586476925286766559;
    }

    // LpSqr = Lp^2
    double LpSqr = Lp * Lp;

    // Sl = 1 + 0.015 * LpSqr / sqrt(20 + LpSqr)
    double Sl = 1 + 0.015 * LpSqr / Math.sqrt(20 + LpSqr);

    // Sc = 1 + 0.045 * Cp
    double Sc = 1 + 0.045 * Cp;

    // T = 1 - 0.17 * cos(hp - pi / 6) +
    //       + 0.24 * cos(2 * hp) +
    //       + 0.32 * cos(3 * hp + pi / 30) -
    //       - 0.20 * cos(4 * hp - 63 * pi / 180)
    double hphp = hp + hp;
    double T = 1 - 0.17 * Math.cos(hp - 0.52359877559829887307710723054658)
            + 0.24 * Math.cos(hphp)
            + 0.32 * Math.cos(hphp + hp + 0.10471975511965977461542144610932)
            - 0.20 * Math.cos(hphp + hphp - 1.0995574287564276334619251841478);

    // Sh = 1 + 0.015 * Cp * T
    double Sh = 1 + 0.015 * Cp * T;

    // deltaThetaRad = (pi / 3) * e^-(36 / (5 * pi) * hp - 11)^2
    double powerBase = hp - 4.799655442984406;
    double deltaThetaRad = 1.0471975511965977461542144610932 * Math.exp(-5.25249016001879 * powerBase * powerBase);

    // Rc = 2 * sqrt((Cp^7) / (Cp^7 + 25^7))
    double Cp7 = Math.pow(Cp, 7);
    double Rc = 2 * Math.sqrt(Cp7 / (Cp7 + 6103515625.0));

    // RT = -sin(delthetarad) * Rc
    double RT = -Math.sin(deltaThetaRad) * Rc;

    // de00 = sqrt((dL / Sl)^2 + (dC / Sc)^2 + (dH / Sh)^2 + RT * (dC / Sc) * (dH / Sh))
    double dLSl = dL / Sl;
    double dCSc = dC / Sc;
    double dHSh = dH / Sh;
    return Math.sqrt(dLSl * dLSl + dCSc * dCSc + dHSh * dHSh + RT * dCSc * dHSh);
}

你确定需要使用CIED2000而不是简单的CIELAB差异吗?它计算成本高昂,只提供“科学上”可观测到的差异。对于大多数图像处理任务,从CIELAB颜色分量的简单欧几里得距离就足够了。 - Ross
2个回答

13

cos很耗费资源,特别是连续计算。您似乎正在计算cos(na+b),其中b是一个常数,n是一个小整数。这意味着您可以预先计算cos(b)和sin(b),并在运行时只计算cos(hp)和sin(hp)。通过反复利用,您可以获得cos(na+b)。

cos(a+b) = cos(a)*cos(b)-sin(a)*sin(b)
你将会用一些乘法和加法来代替一些sin和cos的运算,这几乎肯定是值得的。
如果你有雄心壮志,可以做得更好。你通过一个atan2间接地得到了hp。形如“三角函数(有理函数(反三角函数))”的模式通常可以被一些多项式和根的组合所替代,这些方法比三角函数更快。
我不知道Java中pow是如何实现的,但如果它使用对数,那么使用Cp2=Cp*Cp;Cp4=Cp2*Cp2;Cp7=Cp4*Cp2*Cp; 来获取Cp7可能更好。
更新:由于没有时间实际重写代码,现在变得有点牵强附会了。幂优化和三角优化实际上是同一件事情!三角函数优化是应用于复数的幂优化版本。此外,这行代码:
double dH = 2 * Math.sqrt(CpProd) * Math.sin(dhp / 2);

这部分代码是用于计算复数平方根的。这让我觉得很多代码实际上可以使用复数来编写,从而几乎消除了所有三角函数。不过我不知道你们的复数运算法则是否支持...


我已经添加了功率优化,现在该函数的速度快了1.5倍。现在我需要拿一张纸草拟一些三角数学。(: - João Dias
余弦展开有些帮助,但我的复数算术从来不好,我担心它永远都不会好。): - João Dias

1

一般来说,任何实现此功能且存在严重速度问题的系统都不会生成随机颜色。它将生成几个不同的颜色。即使是一个充满不同颜色的巨大图像通常也只有几千种颜色。我非常建议使用缓存算法。虽然如果速度是一个问题,你应该自己开发(你只需要原语,速度)。

实际上颜色距离例程本身没有太多优化的空间,但我为这个程序编写了一个缓存系统,速度快了100倍左右。距离例程从压倒性的因素变成了微不足道的因素。你不应该试图减慢它的速度。你可能会得到一些东西。但是,要适当减少调用次数。

你有两个输入集,它产生一个单一的输出集,并且需要非常长的时间才能完成。每个缓存索引7个双精度数,即14字节。对于14兆内存占用(或类似的值,忽略哈希等),可以存储百万条目,这足以使您在具有1k典型不同颜色的情况下获得高达90%以上的缓存命中率。如果将初始颜色从RGB转换为Lab(这些转换也应被缓存),则甚至可以大大减少此需求。如果您仅有5%的时间使用此功能,则会看到加速效果。而且您很可能会99%的时间都获得命中(除非您正在进行随机颜色比较等奇怪的操作)。根据我的观察,CIEDE2000所需的时间与欧几里得RGB几乎相同。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接