性能比较:BinaryFormatter vs. XmlSerializer

9

我经常看到BinaryFormatter比XmlSerializer性能更好的说法。出于好奇,我写了一个测试应用程序。

令人惊讶的是,为什么Xml的速度比Bin快得多(特别是反序列化)?

using System;
using System.Collections.Generic;
using System.Runtime.Serialization;
using System.Xml.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using System.IO;

namespace SerPlayground
{
    class Program
    {
        static void Main(string[] args)
        {
            var items = new List<TestClass>();
            for (int i = 0; i < 1E6; i++)
            {
                items.Add(new TestClass() { Name = i.ToString(), Id = i });
            }

            File.Delete("test.bin");
            using (var target = new FileStream("test.bin", FileMode.OpenOrCreate))
            {
                System.Threading.Thread.Sleep(1000);
                var bin = new BinaryFormatter();
                var start = DateTime.Now;
                bin.Serialize(target, items);
                Console.WriteLine("Bin: {0}", (DateTime.Now - start).TotalMilliseconds);

                target.Position = 0;
                System.Threading.Thread.Sleep(1000);
                start = DateTime.Now;
                bin.Deserialize(target);
                Console.WriteLine("Bin-D: {0}", (DateTime.Now - start).TotalMilliseconds);
            }

            File.Delete("test.xml");
            using (var target = new FileStream("test.xml", FileMode.OpenOrCreate))
            {
                System.Threading.Thread.Sleep(1000);
                var xml = new XmlSerializer(typeof(List<TestClass>));
                var start = DateTime.Now;
                xml.Serialize(target, items);
                Console.WriteLine("Xml: {0}", (DateTime.Now - start).TotalMilliseconds);

                target.Position = 0;
                System.Threading.Thread.Sleep(1000);
                start = DateTime.Now;
                xml.Deserialize(target);
                Console.WriteLine("Xml-D: {0}", (DateTime.Now - start).TotalMilliseconds);
           }

            Console.ReadKey();
        }
    }

    [Serializable]
    public class TestClass
    {
        public string Name { get; set; }
        public int Id { get; set; }
    }
}

我的结果:

Bin: 13472.7706
Bin-D: 121131.9284
Xml: 8917.51
Xml-D: 12841.7345

1
反序列化比序列化慢得多。你能修改你的示例来同时执行两者吗?那将是一个更有趣的比较。 - Kirk Woll
嗨,我建议你多次运行一些测试(100+次?)- 可以在循环中包含启动(创建格式化器/序列化器)或不包含。进行更多次数的计时可能会给你一个更准确的性能图像。此外,考虑使用StopWatch类来进行计时,因为我相信它使用高性能计时器(如果可能的话)。如果你仍然得到更快的XML序列化结果,也很好知道是为什么! - Jennifer
我一直认为二进制在网络传输方面更“快”,因为它包含的字节数较少。虽然我预计需要相当大的有效载荷才能明显看出差异。 - kbrimington
@Jennifer:我尝试了计时器类,结果是一样的。 - Robert Harvey
3个回答

7
因为您正在序列化一个没有任何属性的对象。如果您序列化实际包含一些数据的不同对象,例如字符串,那么二进制序列化程序比XML序列化程序快得多。我对您的代码进行了更改。
items.Add("asfd");

我得到了这个结果:

Xml: 1219.0541
Bin: 165.0002

其中一部分的差异当然是XML文件比二进制文件大约十倍。


1
值得注意的是,如果交换XML和BIN块的位置(尽管块之间使用的时间比例大致相同),整个过程运行速度几乎快了两倍。因此,我认为整个基准测试是有问题的,可能是由于垃圾回收或其他因素导致的。 - Robert Harvey
2
asfd - 美国家具设计师协会? - Russ Cam
罗伯·哈维:我添加了一个更复杂的类……现在交换XML和BIN不会产生任何变化……结果是相同的,XML更快。 - Lukas
@Lukas,你仍然只是在序列化。你真的应该反序列化。 - Kirk Woll
@Kirk Woll:现在我也反序列化了。 - Lukas

4
这个例子非常好,问题很有趣(我同意Robert的看法,在进行任何测量之前,应该至少运行一次Main方法,因为各种初始化不应被视为测试的一部分)。
话虽如此,XmlSerializer和BinaryFormatter之间的一个关键区别(除了显而易见的区别)是,XmlSerializer不尝试跟踪引用。如果您的对象图有多个对同一对象的引用,则在XML中会得到多个副本,并且在反序列化时无法正确地解析回单个对象。更糟糕的是,如果存在循环引用,则根本无法序列化该对象。与之相比,BinaryFormatter确实跟踪引用并可靠地重构对象图,无论您可能拥有多少个以及什么类型的对象引用。也许这种功能的开销解释了性能较差的原因?
使用BinaryFormatter而不是XmlSerializer的主要原因是输出的大小,而不是序列化/反序列化的性能。(构建文本的开销并不太大,而是传输xml文本的成本很高。)


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接