JSON.Net DeserializeObject 文本编码

11

当我尝试从文件反序列化对象时,它会将土耳其字符(如“ğ”)转换为问号。

因此我尝试了这个:

JsonConvert.DeserializeObject<List<MyClass>>(json, new JsonSerializerSettings() 
{ Culture = new System.Globalization.CultureInfo("tr-TR")  });

但它没有起作用。有没有办法在Json.Net中更改字符编码?


1
这可能会有所帮助https://dev59.com/h2PVa4cB1Zd3GeqP9-W1 - csharpwinphonexaml
3个回答

37

在创建WebClient时,请确保声明UTF-8,如果您使用了WebClient

new WebClient() { Encoding = Encoding.UTF8 }

3
我看过许多复杂的解决方案,但是你提供的最简单的方案很有用!谢谢。 - David Shepard
这并不能真正解决问题,因为WebClient实际上是一个外部的组件,而且我们经常无法控制它。下面的@csharpwinphonexaml的答案更好,它清楚地描述了可能的原因。 - undefined

5
在理论上,您遇到了字符集编码/解码问题。
原因:您尝试读取的内容已使用像iso-8859-1或iso-8859-15这样的字符集进行编码。而您将尝试直接将其读取(解码)为“UTF-8”字符模型。当然,它不起作用,因为UTF-8不会像魔术一样识别您的特殊字符(如Ä,Ü,Ö等)。 UTF-8不是字符编码猜测器。
解决方案:
1- 使用相应的字符集(iso-8859-1/iso-8859-15)将您的内容(例如“Björn Nilsson”)重新编码为字节集合。
2- 使用基于“UTF-8”的字符集对您的内容进行解码。
这里是一个示例帮助程序类:
using System;
using System.Collections.Generic;
using System.Text;

    namespace csharp.util.charset
    {
        public class SysUtil
        {
            /// <summary>
            /// Convert a string from one charset to another charset
            /// </summary>
            /// <param name="strText">source string</param>
            /// <param name="strSrcEncoding">original encoding name</param>
            /// <param name="strDestEncoding">dest encoding name</param>
            /// <returns></returns>
            public static String StringEncodingConvert(String strText, String strSrcEncoding, String strDestEncoding)
            {
                System.Text.Encoding srcEnc = System.Text.Encoding.GetEncoding(strSrcEncoding);
                System.Text.Encoding destEnc = System.Text.Encoding.GetEncoding(strDestEncoding);
                byte[] bData=srcEnc.GetBytes(strText);
                byte[] bResult = System.Text.Encoding.Convert(srcEnc, destEnc, bData);
                return destEnc.GetString(bResult);
            }

        }
    }

用法:

在您的(JSON、XML或其他)序列化/反序列化类中,只需像这样转换您的内容

String content = "Björn Nilsson";
SysUtil.StringEncodingConvert(content, "ISO-8859-1","UTF-8");

如果你的反序列化程序确实执行了其意图,那么可以尝试在其中进行调用:

public class JsonNetSerializerFactory :ISerializerFactory 
{
    public ISerializer<T> Create<T>()
    {
        return new JsonNetSerializer<T>();
    }
    public class JsonNetSerializer<T> : ISerializer<T>
    {
        public T Deserialize(string input, String fromCharset, String toCharset)

        {
           String changedString = SysUtil.StringEncodingConvert(input, fromCharset,toCharset);

            return JsonConvert.DeserializeObject<T>(changedString  );
        }

        public IList<T> DeserializeList(string input, String fromCharset, String toCharset)
        {
         String changedString =  SysUtil.StringEncodingConvert(input, fromCharset,toCharset);

            return JsonConvert.DeserializeObject<IList<T>>(changedString);
        }
    }
}

-2

您可以避免使用辅助类,只需查看 .net编码类 作为参考:

Encoding.GetEncoding("iso-8859-1")

它应该给你想要的结果


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接