使用相同结果的Javascript和C# Unicode编码/解码

4

我找到了这个有用的帖子:

C# 解决方案:对Unicode字符串进行编码/解码:

如何将字节数组转换为十六进制字符串,反之亦然?

Javascript 解决方案:对Unicode字符串进行编码/解码:

Javascript:Unicode字符串转换为十六进制

但是这些解决方案会混淆字符。

例如Javascript(来自上面链接中的代码1:1):

var str = "그러하지";
hex = str.hexEncode(); // returns "adf8b7ecd558c9c0"

示例 C#(尝试了两种解决方案,结果相同):

/// <summary>
/// Convert a string to hex value
/// </summary>
/// <param name="stringValue"></param>
/// <returns></returns>
public string HexEncode(string stringValue)
{
  var ba = Encoding.Unicode.GetBytes(stringValue);
  // SOLUTION 1
  //var c = new char[ba.Length * 2];
  //for (var i = 0; i < ba.Length; i++)
  //{
  //  var b = ba[i] >> 4;
  //  c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
  //  b = ba[i] & 0xF;
  //  c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
  //}
  //return new string(c);
  // SOLUTION 2
  var hex = new StringBuilder(ba.Length * 2);
  foreach (var b in ba)
    hex.AppendFormat("{0:x2}", b);
  return hex.ToString();
}

/// <summary>
/// Converts a hex value to a string
/// </summary>
/// <param name="hexString"></param>
/// <returns></returns>
public string HexDecode(string hexString)
{
  if (hexString == null || (hexString.Length & 1) == 1) return "";
  // SOLUTION 1
  //hexString = hexString.ToUpper();
  //var hexStringLength = hexString.Length;
  //var b = new byte[hexStringLength / 2];
  //for (var i = 0; i < hexStringLength; i += 2)
  //{
  //  var topChar = (hexString[i] > 0x40 ? hexString[i] - 0x37 : hexString[i] - 0x30) << 4;
  //  var bottomChar = hexString[i + 1] > 0x40 ? hexString[i + 1] - 0x37 : hexString[i + 1] - 0x30;
  //  b[i / 2] = Convert.ToByte(topChar + bottomChar);
  //}
  // SOLUTION 2
  var numberChars = hexString.Length;
  var bytes = new byte[numberChars / 2];
  for (var i = 0; i < numberChars; i += 2)
    bytes[i / 2] = Convert.ToByte(hexString.Substring(i, 2), 16);
  return Encoding.Unicode.GetString(bytes);
}


var hex = tools.HexEncode("그러하지");
var str = tools.HexDecode(hex); // f8adecb758d5c0c9
  • JS: adf8 b7ec d558 c9c0
  • C#: f8ad ecb7 58d5 c0c9

这个序列被交换了。 只要我在同一个环境中,编码和解码都可以正常工作。但是我需要在JS中进行编码,在C#中进行解码,反之亦然。

我不知道哪个是正确的,如果可以定义“正确”的话。 那么我该如何解决这个问题呢?

1个回答

2

这两个值都是正确的。只是你的javascript解决方案提供了大端序列的unicode数组,而C#则提供了小端序列(MSDN文章,请参见“备注”部分)。 要使C#字节数组与你的javascript相同,请按照以下方式定义你的编码:

UnicodeEncoding bigEndianUnicode = new UnicodeEncoding(true, true);

然后像这样使用它:

var ba = bigEndianUnicode.GetBytes(stringValue);

Demo: .Net Fiddle


你救了我的一天!非常感谢你的回答。圣诞快乐 :) - YvesR
很高兴能够帮忙!祝你圣诞快乐! - Ilya Luzyanin

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接