如何在C语言中将128位整数转换为十进制ASCII字符串?

18

我正在尝试将作为4个无符号整数数组存储的128位无符号整数转换为C中的十进制字符串表示:

unsigned int src[] = { 0x12345678, 0x90abcdef, 0xfedcba90, 0x8765421 };
printf("%s", some_func(src)); // gives "53072739890371098123344"

(上述的输入和输出示例是完全虚构的;我不知道那个输入会产生什么结果。)

如果我要使用十六进制、二进制或八进制,这将是一个简单的问题,只需要使用掩码和位移来获取最低有效字符即可。但是,我认为我需要进行十进制除法。不幸的是,我不记得如何在多个整数之间执行除法,并且我正在使用的系统不支持大于32位的数据类型,因此无法使用128位类型。使用不同的编程语言也不行,而且我宁愿避免为了这一个操作而使用大数库。


4
十进制是为人类设计的。在第七位数字后,人们往往会失去兴趣。这到底有什么意义? - Hans Passant
以上内容应该如何打印输出?作为“0x1234567890abcdef…”?还是十进制? - AusCBloke
1
@ephemient:“上面的输入和输出示例完全是虚构的;我不知道那个输入会产生什么结果。” 他不知道 xD - AusCBloke
4
你可以使用“双倍打乱”算法。 - Daniel Fischer
对于一次性的转换(比如发布这个问题),Wolfram Alpha非常方便:http://www.wolframalpha.com/input/?i=0x1234567890abcdeffedcba908765421+in+decimal(Google也可以,但会失去精度) - John Carter
显示剩余5条评论
8个回答

11

不需要进行除法运算:

#include <string.h>
#include <stdio.h>

typedef unsigned long uint32;

/* N[0] - contains least significant bits, N[3] - most significant */
char* Bin128ToDec(const uint32 N[4])
{
  // log10(x) = log2(x) / log2(10) ~= log2(x) / 3.322
  static char s[128 / 3 + 1 + 1];
  uint32 n[4];
  char* p = s;
  int i;

  memset(s, '0', sizeof(s) - 1);
  s[sizeof(s) - 1] = '\0';

  memcpy(n, N, sizeof(n));

  for (i = 0; i < 128; i++)
  {
    int j, carry;

    carry = (n[3] >= 0x80000000);
    // Shift n[] left, doubling it
    n[3] = ((n[3] << 1) & 0xFFFFFFFF) + (n[2] >= 0x80000000);
    n[2] = ((n[2] << 1) & 0xFFFFFFFF) + (n[1] >= 0x80000000);
    n[1] = ((n[1] << 1) & 0xFFFFFFFF) + (n[0] >= 0x80000000);
    n[0] = ((n[0] << 1) & 0xFFFFFFFF);

    // Add s[] to itself in decimal, doubling it
    for (j = sizeof(s) - 2; j >= 0; j--)
    {
      s[j] += s[j] - '0' + carry;

      carry = (s[j] > '9');

      if (carry)
      {
        s[j] -= 10;
      }
    }
  }

  while ((p[0] == '0') && (p < &s[sizeof(s) - 2]))
  {
    p++;
  }

  return p;
}

int main(void)
{
  static const uint32 testData[][4] =
  {
    { 0, 0, 0, 0 },
    { 1048576, 0, 0, 0 },
    { 0xFFFFFFFF, 0, 0, 0 },
    { 0, 1, 0, 0 },
    { 0x12345678, 0x90abcdef, 0xfedcba90, 0x8765421 }
  };
  printf("%s\n", Bin128ToDec(testData[0]));
  printf("%s\n", Bin128ToDec(testData[1]));
  printf("%s\n", Bin128ToDec(testData[2]));
  printf("%s\n", Bin128ToDec(testData[3]));
  printf("%s\n", Bin128ToDec(testData[4]));
  return 0;
}

输出:

0
1048576
4294967295
4294967296
11248221411398543556294285637029484152

2
@BobbyPowers:unsigned int不能保证至少有32位长。unsigned long可以。无论系统是否为64位,都与C标准无关且超出其范围。 - Alexey Frunze
1
@6502: 我没有声称它会更快。这只是一种在不使用除法和没有许多预先计算的10的幂的情况下完成任务的方法。 - Alexey Frunze
非常好的解决方案(+1)。再加上一点额外的代码,它就可以处理非常大的数字。我处理的数字是160位以上。 - Tom
很好的使用了 uint32 而不是 unsigned。这使得解决方案可以在使用 16 位 int/unsigned 的嵌入式设计中移植。 - chux - Reinstate Monica
1
不要自己定义uint32,而是使用stdint.h中的标准uint32_t - user694733
显示剩余6条评论

7

这是一个基于2^32的简单除法,按照倒序打印十进制位数,并使用64位算术。其复杂度为 O(n),其中n是表示中的十进制数字位数:

#include <stdio.h>

unsigned int a [] = { 0x12345678, 0x12345678, 0x12345678, 0x12345678 };

/* 24197857161011715162171839636988778104 */

int
main ()
{
  unsigned long long d, r;

  do
    {
      r = a [0];

      d = r / 10;
      r = ((r - d * 10) << 32) + a [1];
      a [0] = d;

      d = r / 10;
      r = ((r - d * 10) << 32) + a [2];
      a [1] = d;

      d = r / 10;
      r = ((r - d * 10) << 32) + a [3];
      a [2] = d;

      d = r / 10;
      r = r - d * 10;
      a [3] = d;

      printf ("%d\n", (unsigned int) r);
    }
  while (a[0] || a[1] || a[2] || a[3]);

  return 0;
}

编辑:修正了循环,如果数组a仅包含零,则显示0。此外,该数组从左到右读取,a [0] 是最高有效位,a [3] 是最低有效位。


如果a[0]=a[1]=a[2]=a[3]=0,则不会打印任何东西。 - Alexey Frunze
@Alex,是的,我知道。应该是 do {} while(); - chill
很不幸,这里使用了64位算术运算,但不可用。......虽然我想我可以将问题重构为8个16位值,这样就可以在你使用64位算术运算的地方使用32位算术运算,但这将需要进行两倍的操作。 - esilver
@Silverhalide:你在使用什么古老的C编译器?(据我所知,2003年的最后一个C++标准没有“long long”,但1999年的当前C标准有它,难道你正在将代码编译为C++吗?) - Alexey Frunze
@Silverhalide,没问题,将其转换为仅使用32位甚至仅使用16位算术是微不足道的。只需将数组元素分别设为16位或8位,而且该数组将包含8或16个元素。我将在一分钟内添加一个仅使用32位算术的版本。 - chill
@Alex,编译器是从'97年开始的 - 别问。 - esilver

2
一种缓慢但简单的方法是使用减法从最高位到最低位逐个打印数字。基本上,您需要一个检查 x >= y 的函数和另一个计算 x -= y 的函数(当这种情况发生时)。 然后,您可以开始计算可以减去多少次10^38(这将是最高位),然后计算可以减去多少次10^37 ... 直到可以减去1的次数。
以下是此方法的完整实现:
#include <stdio.h>

typedef unsigned ui128[4];

int ge128(ui128 a, ui128 b)
{
    int i = 3;
    while (i >= 0 && a[i] == b[i])
        --i;
    return i < 0 ? 1 : a[i] >= b[i];
}

void sub128(ui128 a, ui128 b)
{
    int i = 0;
    int borrow = 0;
    while (i < 4)
    {
        int next_borrow = (borrow && a[i] <= b[i]) || (!borrow && a[i] < b[i]);
        a[i] -= b[i] + borrow;
        borrow = next_borrow;
        i += 1;
    }
}

ui128 deci128[] = {{1u,0u,0u,0u},
                   {10u,0u,0u,0u},
                   {100u,0u,0u,0u},
                   {1000u,0u,0u,0u},
                   {10000u,0u,0u,0u},
                   {100000u,0u,0u,0u},
                   {1000000u,0u,0u,0u},
                   {10000000u,0u,0u,0u},
                   {100000000u,0u,0u,0u},
                   {1000000000u,0u,0u,0u},
                   {1410065408u,2u,0u,0u},
                   {1215752192u,23u,0u,0u},
                   {3567587328u,232u,0u,0u},
                   {1316134912u,2328u,0u,0u},
                   {276447232u,23283u,0u,0u},
                   {2764472320u,232830u,0u,0u},
                   {1874919424u,2328306u,0u,0u},
                   {1569325056u,23283064u,0u,0u},
                   {2808348672u,232830643u,0u,0u},
                   {2313682944u,2328306436u,0u,0u},
                   {1661992960u,1808227885u,5u,0u},
                   {3735027712u,902409669u,54u,0u},
                   {2990538752u,434162106u,542u,0u},
                   {4135583744u,46653770u,5421u,0u},
                   {2701131776u,466537709u,54210u,0u},
                   {1241513984u,370409800u,542101u,0u},
                   {3825205248u,3704098002u,5421010u,0u},
                   {3892314112u,2681241660u,54210108u,0u},
                   {268435456u,1042612833u,542101086u,0u},
                   {2684354560u,1836193738u,1126043566u,1u},
                   {1073741824u,1182068202u,2670501072u,12u},
                   {2147483648u,3230747430u,935206946u,126u},
                   {0u,2242703233u,762134875u,1262u},
                   {0u,952195850u,3326381459u,12621u},
                   {0u,932023908u,3199043520u,126217u},
                   {0u,730304488u,1925664130u,1262177u},
                   {0u,3008077584u,2076772117u,12621774u},
                   {0u,16004768u,3587851993u,126217744u},
                   {0u,160047680u,1518781562u,1262177448u}};

void print128(ui128 x)
{
    int i = 38;
    int z = 0;
    while (i >= 0)
    {
        int c = 0;
        while (ge128(x, deci128[i]))
        {
            c++; sub128(x, deci128[i]);
        }
        if (i==0 || z || c > 0)
        {
            z = 1; putchar('0' + c);
        }
        --i;
    }
}

int main(int argc, const char *argv[])
{
    ui128 test = { 0x12345678, 0x90abcdef, 0xfedcba90, 0x8765421 };
    print128(test);
    return 0;
}

在问题文本中的那个数字转换成十进制后为:
11248221411398543556294285637029484152

Python也认为这是正确的值(当然,这并不意味着代码是正确的!!! ;-))


“unsigned”不能保证包含32位,最低要求为16位。请使用“unsigned long”,它至少包含32位,符合标准要求。 - Alexey Frunze
我认为这个问题是一个非常具体的问题,而不是一个普遍性的问题。从文本中可以看出,无符号数是32位的(OP正在使用4个无符号整数来表示128位的数字)。 - 6502
可能不太难修改这个程序,使其除以1,000,000,000(这是32位值中可表示的最大10的幂),而不是10。这将减少9倍的操作次数。 - esilver
@Silverhalide:这个方法没有使用任何乘法或除法(如果硬件不支持这些指令,它就非常有用),并且除法是通过重复减法实现的(因此,除非每个数字组进行多达10000次循环,否则我无法使用10000为基数)。我已经添加了另一个答案来解释模数方法……每次迭代的最大数字位数是4,而不是9,因为在计算除法/模数操作时也必须考虑进位。使用10000作为基数可以容纳四位数字,并适合16位。 - 6502

2

同样的事情,但使用32位整数算术:

#include <stdio.h>

unsigned short a [] = { 
  0x0876, 0x5421,
  0xfedc, 0xba90,
  0x90ab, 0xcdef,
  0x1234, 0x5678
};

int
main ()
{
  unsigned int d, r;

  do
    {
      r = a [0];

      d = r / 10;
      r = ((r - d * 10) << 16) + a [1];
      a [0] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [2];
      a [1] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [3];
      a [2] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [4];
      a [3] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [5];
      a [4] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [6];
      a [5] = d;

      d = r / 10;
      r = ((r - d * 10) << 16) + a [7];
      a [6] = d;

      d = r / 10;
      r = r - d * 10;
      a [7] = d;

      printf ("%d\n", r);
    }
  while (a[0] || a[1] || a[2] || a[3] || a [4] || a [5] || a[6] || a[7]);


  return 0;
}

0

假设您拥有快速的32位乘法和除法,可以通过实现bigint除法/模10000来每次计算4个数字,并使用(s)printf输出数字组的结果。

这种方法也很容易扩展到更高(甚至可变)精度...

#include <stdio.h>

typedef unsigned long bigint[4];

void print_bigint(bigint src)
{
    unsigned long int x[8];   // expanded version (16 bit per element)
    int result[12];           // 4 digits per element
    int done = 0;             // did we finish?
    int i = 0;                // digit group counter

    /* expand to 16-bit per element */
    x[0] = src[0] & 65535;
    x[1] = src[0] >> 16;
    x[2] = src[1] & 65535;
    x[3] = src[1] >> 16;
    x[4] = src[2] & 65535;
    x[5] = src[2] >> 16;
    x[6] = src[3] & 65535;
    x[7] = src[3] >> 16;

    while (!done)
    {
        done = 1;
        {
            unsigned long carry = 0;
            int j;
            for (j=7; j>=0; j--)
            {
                unsigned long d = (carry << 16) + x[j];
                x[j] = d / 10000;
                carry = d - x[j] * 10000;
                if (x[j]) done = 0;
            }
            result[i++] = carry;
        }
    }

    printf ("%i", result[--i]);
    while (i > 0)
    {
        printf("%04i", result[--i]);
    }
}

int main(int argc, const char *argv[])
{
    bigint tests[] = { { 0, 0, 0, 0 },
                       { 0xFFFFFFFFUL, 0, 0, 0 },
                       { 0, 1, 0, 0 },
                       { 0x12345678UL, 0x90abcdefUL, 0xfedcba90UL, 0x8765421UL } };
    {
        int i;
        for (i=0; i<4; i++)
        {
            print_bigint(tests[i]);
            printf("\n");
        }
    }
    return 0;
}

0

@Alexey Frunze的方法很简单,但非常慢。你应该使用@chill上面提到的32位整数方法。另一种不需要任何乘除法的简单方法是double dabble。这可能比chill的算法慢,但比Alexey的快得多。运行后,您将获得十进制数字的打包BCD。


0
在 Github 上有一个开源项目(C++),它提供了一个数据类型类 uint265_tuint128_t

https://github.com/calccrypto/uint256_t

不,我与那个项目没有关联,但我曾经为这样的目的使用过它,但我想它对其他人也可能有用。


0

实际上您不需要实现长除法,而是需要实现乘以二的幂和加法。您有四个uint_32。首先将它们中的每一个转换为字符串。分别将它们乘以 (2^32)^3(2^32)^2(2^32)^1(2^32)^0,然后将它们相加。您不需要进行基础转换,只需处理将这四个部分放在一起即可。显然需要确保这些字符串可以处理高达UINT_32_MAX*(2^32)^3的数字。


一个自定义的十进制大数库是个好主意,但是在十进制中,“乘以二的幂”并不是特别容易。原帖作者将不得不进行一般性的乘法运算。 - Pascal Cuoq
无论如何,我们必须实现“字符串”的乘法。也就是说,将字符串视为十进制数字并进行乘法运算。 - valdo

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接