我正在寻找一种并行化复杂数学运算的方法,WebGL看起来是最完美的方法。
问题在于,你只能从纹理中读取8位整数。
我希望能够从纹理中获得32位数字。
我的想法是使用4个颜色通道每像素获得32位,而不是4次8位。
我的问题在于,GLSL没有“%”运算符或任何按位运算符!
简而言之:
如何通过使用glsl中的运算符将32位数字转换为4个8位数字?
有关该技术(使用按位运算符)的一些额外信息:
我正在寻找一种并行化复杂数学运算的方法,WebGL看起来是最完美的方法。
问题在于,你只能从纹理中读取8位整数。
我希望能够从纹理中获得32位数字。
我的想法是使用4个颜色通道每像素获得32位,而不是4次8位。
我的问题在于,GLSL没有“%”运算符或任何按位运算符!
简而言之:
如何通过使用glsl中的运算符将32位数字转换为4个8位数字?
有关该技术(使用按位运算符)的一些额外信息:
通过乘以/除以2的幂次方来进行位移。
如评论中所指出,我最初发布的方法是有效但不正确的,这里有一个由Aras Pranckevičius提供的方法,请注意帖子中源代码包含一个错别字且为HLSL,这是一个已更正错别字并转换为GLSL的版本:
const vec4 bitEnc = vec4(1.,255.,65025.,16581375.);
const vec4 bitDec = 1./bitEnc;
vec4 EncodeFloatRGBA (float v) {
vec4 enc = bitEnc * v;
enc = fract(enc);
enc -= enc.yzww * vec2(1./255., 0.).xxxy;
return enc;
}
float DecodeFloatRGBA (vec4 v) {
return dot(v, bitDec);
}
return vec4(comp.yzw, floor(depth)/256.0)
以恢复所有四个分量。此外,值得注意的是,对我来说,颜色分量输入范围为[0, 256),但输出范围为[0, 1)。可能只是在我的一端搞砸了,但通过这些更改,似乎对我来说工作正常。 - vermav = floor(v * 255.0 + 0.5) / 255.0;
确保v包含精确的0、1/255、2/255、...、1的值。
这是必要的,因为通常“vec4 v”来自texture2D函数,在某些GPU(例如iOS设备)上,texture2D返回的值可能是“0.000001”而不是精确的0.0。 - Slyv一般来说,如果您想将浮点数的有效数字打包成字节,则需要连续提取8个位的有效数字包,并将其存储在一个字节中。
为了将浮点值打包成4个8位缓冲区,首先必须指定源值的范围。
如果您已经定义了一个值范围[minVal
, maxVal
],它必须映射到范围[0.0, 1.0]:
float mapVal = clamp((value-minVal)/(maxVal-minVal), 0.0, 1.0);
函数Encode
将值在范围[0.0, 1.0]内的浮点数打包到一个vec4
中:
vec4 Encode( in float value )
{
value *= (256.0*256.0*256.0 - 1.0) / (256.0*256.0*256.0);
vec4 encode = fract( value * vec4(1.0, 256.0, 256.0*256.0, 256.0*256.0*256.0) );
return vec4( encode.xyz - encode.yzw / 256.0, encode.w ) + 1.0/512.0;
}
函数Decode
从vec4
中提取一个范围在[0.0, 1.0]的浮点数值:
float Decode( in vec4 pack )
{
float value = dot( pack, 1.0 / vec4(1.0, 256.0, 256.0*256.0, 256.0*256.0*256.0) );
return value * (256.0*256.0*256.0) / (256.0*256.0*256.0 - 1.0);
}
minVal
, maxVal
]中,并从该区间中提取浮点值:vec4 EncodeRange( in float value, flaot minVal, maxVal )
{
value = clamp( (value-minVal) / (maxVal-minVal), 0.0, 1.0 );
value *= (256.0*256.0*256.0 - 1.0) / (256.0*256.0*256.0);
vec4 encode = fract( value * vec4(1.0, 256.0, 256.0*256.0, 256.0*256.0*256.0) );
return vec4( encode.xyz - encode.yzw / 256.0, encode.w ) + 1.0/512.0;
}
float DecodeRange( in vec4 pack, flaot minVal, maxVal )
{
value = dot( pack, 1.0 / vec4(1.0, 256.0, 256.0*256.0, 256.0*256.0*256.0) );
value *= (256.0*256.0*256.0) / (256.0*256.0*256.0 - 1.0);
return mix( minVal, maxVal, value );
}
另一种可能性是将有效数字编码为RGB值的3 * 8位,并将指数编码为alpha通道的8位:
vec4 EncodeExp( in float value )
{
int exponent = int( log2( abs( value ) ) + 1.0 );
value /= exp2( float( exponent ) );
value = (value + 1.0) * (256.0*256.0*256.0 - 1.0) / (2.0*256.0*256.0*256.0);
vec4 encode = fract( value * vec4(1.0, 256.0, 256.0*256.0, 256.0*256.0*256.0) );
return vec4( encode.xyz - encode.yzw / 256.0 + 1.0/512.0, (float(exponent) + 127.5) / 256.0 );
}
float DecodeExp( in vec4 pack )
{
int exponent = int( pack.w * 256.0 - 127.0 );
float value = dot( pack.xyz, 1.0 / vec3(1.0, 256.0, 256.0*256.0) );
value = value * (2.0*256.0*256.0*256.0) / (256.0*256.0*256.0 - 1.0) - 1.0;
return value * exp2( float(exponent) );
}
floor(log2(abs(value))) + 127.0
。 - Brian Cannard大家在处理WebGL中这类问题时都是完全正确的,但我想分享一个获取值的技巧。
假设您想对两个适合16位的值进行比较:
// Generate a list of random 16bit integers
let data16bit = new Uint16Array(1000000);
for(let i=0; i < data16bit.length; i+=2){
data16bit[i] = Math.random()*(2**16);
data16bit[i+1] = Math.random()*(2**16);
}
// Read them one byte at a time, for writing to
// WebGL
let texture = new Uint8Array(data16bit.buffer);
vec4 here = texture2D(u_image, v_texCoord);
// Read the "red" byte and the "green" byte together (as a single thing)
// as well as the "blue" byte and the "alpha" byte together as a single
// thing
vec2 a = here.rg;
vec2 b = here.ba;
// now compare the things
if(a == b){
here.a = 1;
}
else{
here.a = 0;
}
// return the boolean value
gl_FragColor = here;
这个要点只是提醒您可以将同一块JavaScript内存视为不同的大小:Uint16Array
和Uint8Array
(而不是尝试进行位移并将其分解)。
针对更多细节的请求,该代码非常接近于直接从此代码和说明中剪切/粘贴。