将一串数字加密成字母数字混合的字符串

4
我有一组数字,希望将其缩短以便在URL中使用。该字符串始终仅包含数字。例如:9587661771112。
理论上,将数字字符串加密成字母数字字符(0-9a-zA-Z)应始终返回更短的结果,这正是我想要的。
我创建了一个算法,它执行以下操作:
加密(string1 = 数字输入字符串,string2 = 字母数字返回字符串) - 从string1中获取下两个字符并将其转换为数字,例如,对于上面的示例,“95”。 - 检查数字是否小于52(a-z和A-Z的组合长度) - 如果是,则添加("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ")[Number]到string2,并跳过2个字符 - 否则,将("0123456789)[Number的第一个数字]添加到string2,并跳过1个字符
接下来的步骤中数字变为了“58”等等。
经过一些调整,我得到的最短结果是:9587661771112 > j9UQpjva。
我的问题是,使用这种技术,结果可能会有很大的差异。我还觉得这不是我问题的干净解决方案。
因此,我需要一种加密算法,将数字字符串转换为较短的大写字母、小写字母和数字字符串。它必须可解密且具有比较一致的结果。
有什么想法如何实现吗?
string Chars = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";

string Base10To62(long N)
{
    string R = "";
    while (N != 0)
    {
        R += Chars[(int)(N % 62)];
        N /= 62;
    }
    return R;
}

long Base62To10(string N)
{
    long R = 0;
    int L = N.Length;
    for (int i = 0; i < L; i++)
    {
        R += Chars.IndexOf(N[i]) * (long)Math.Pow(62, i);
    }
    return R;
}

运作得很好 :)

2
我认为正确的术语是 压缩 而不是 __加密__。 - Martin Liversage
你可以称之为压缩,但我的意图也是更或多保护字符串免受编辑! - Oht
1
你只需要将一个十进制数转换为52进制数(参见https://dev59.com/23NA5IYBdhLWcg3wh-YC)。在这里不要考虑“加密”——“加密”和“更短的字符串”是不相容的。 - Jon
1
嗨,Thomas - 如果你有解决方案,最好的做法是发布一个回答到你自己的问题上 - 这样问题和解决方案就更清晰了,其他人也可以给你的回答点赞 :) - Justin
1
错误:Base10To62的输出为空字符串,没有结果;前导零丢失,因此不能编码所有数字字符串。 - Mark Adler
显示剩余6条评论
3个回答

2

解决方案:

string Chars = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";

    private static string Base10To62(string S) 
    {
        string R = "";
        var N = long.Parse(S);
        do { R += Chars[(int)(N % 0x3E)]; } while ((N /= 0x3E) != 0);
        return R;
    }

    private static string Base62To10(string S) 
    {
        long R = 0;
        int L = S.Length;
        for (int i = 0; i < L; i++) R += Chars.IndexOf(S[i]) * (long)(System.Math.Pow(0x3E, i));
        return R.ToString();
    }

1

为了好玩,将Linq版本从62转换到10:

long Base62To10(string N)
{
    return N.Select((t, i) => Chars.IndexOf(t)*(long) Math.Pow(62, i)).Sum();
}

Linq是.Net的一部分,就像Math类一样,因此使用Math是可以的,但不可以使用Linq,因为问题标记为c#? - M. Mennan Kara
1
好的,我会删除我的评论。一些研究表明它可能是C#的一部分,所以我承认错误等。 - Maarten Bodewes

1
如果您可以添加两个字符到您的集合中,使其成为一个漂亮的64位,那么我可以在这里描述一个简单快速的算法。
将数字编码为三或四位代码,如下所示:
0: 000
1: 001
2: 010
3: 011
4: 100
5: 101
6: 1100
7: 1101
8: 1110
9: 1111

这是一个前缀编码,这意味着您可以查看前三位来确定是否需要使用第四位。如果将前三位作为整数大于5,则获取另一位。因此解码如下:
get three bits as n
if n < 6
     the result is n + '0'
else
     n = (n << 1) + one more bit
     the result is n - 6 + '0'

比特(bits)然后被六个一组地存储在64个允许字符之一中。
如果您不知道有多少数字,这会有一个问题,因为如果在最后一个字符中留下四个或五个未使用的位,则会存在歧义。在这种情况下,可以简单地更改代码为:
0: 000
1: 001
2: 010
3: 011
4: 100
5: 1010
6: 1011
7: 1100
8: 1101
9: 1110
eom: 1111

这需要更多的位数,但提供了一个明确的消息结束标记。

对于第一个示例,每个字符平均存储1.76个数字。对于第二个示例,每个字符平均存储1.71个数字,减去一些编码时所需的数字数量取决于eom标记的位数。

如果您真的只能使用62个字符,那么我需要再考虑一下。

更新:

快速查看RFC 1738表明,在URL中可以使用更多字符:

lowalpha       = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" |
                 "i" | "j" | "k" | "l" | "m" | "n" | "o" | "p" |
                 "q" | "r" | "s" | "t" | "u" | "v" | "w" | "x" |
                 "y" | "z"
hialpha        = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "I" |
                 "J" | "K" | "L" | "M" | "N" | "O" | "P" | "Q" | "R" |
                 "S" | "T" | "U" | "V" | "W" | "X" | "Y" | "Z"
alpha          = lowalpha | hialpha
digit          = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" |
                 "8" | "9"
safe           = "$" | "-" | "_" | "." | "+"
extra          = "!" | "*" | "'" | "(" | ")" | ","
unreserved     = alpha | digit | safe | extra

因此,将$和_添加到您的集合中会使其变为64。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接