在C#中压缩和解压字符串

5

我知道有system.io.compression.gzipstream,但它接受一个流作为参数。

我正在寻找一个可以接受字符串的方法。

例如:

string compress(string stringtocompress,compressionlevel level);
string decompress(string stringtodecompress);

2个回答

26

你应该试试这个:

using System;
using System.IO;
using System.IO.Compression;
using System.Text;

...

public static string Compress(string s)
{
    var bytes = Encoding.Unicode.GetBytes(s);
    using (var msi = new MemoryStream(bytes))
    using (var mso = new MemoryStream())
    {
        using (var gs = new GZipStream(mso, CompressionMode.Compress))
        {
            msi.CopyTo(gs);
        }
        return Convert.ToBase64String(mso.ToArray());
    }
}

public static string Decompress(string s)
{
    var bytes = Convert.FromBase64String(s);
    using (var msi = new MemoryStream(bytes))
    using (var mso = new MemoryStream())
    {
        using (var gs = new GZipStream(msi, CompressionMode.Decompress))
        {
            gs.CopyTo(mso);
        }
        return Encoding.Unicode.GetString(mso.ToArray());
    }
}

4
请记住,Base64算法会使编码后的数据增加高达35%的大小。因此,它可能会"吞掉"使用压缩带来的好处。在协议级别(例如HTTP),设置压缩或使用字节数组而不是字符串要更好得多。 - adobrzyc
转换为UTF8对我有用。如果我使用Unicode,标准的常见解压工具会给我“H.e.l.l.o.”而不是“Hello”。 - Nick Chan Abdullah

5
请基于以下链接尝试下面的操作:http://dreamstatecoding.blogspot.com/2013/04/c-array-compress-and-decompress-with.html。我们避免使用双重内存流。
    public static byte[] Compress(string text)
    {
        var bytes = Encoding.Unicode.GetBytes(text);
        using (var mso = new MemoryStream())
        {
            using (var gs = new GZipStream(mso, CompressionMode.Compress))
            {
                gs.Write(bytes, 0, bytes.Length);
            }
            return mso.ToArray();
        }
    }

    public static string Decompress(byte[] data)
    {
        // Read the last 4 bytes to get the length
        byte[] lengthBuffer = new byte[4];
        Array.Copy(data, data.Length - 4, lengthBuffer, 0, 4);
        int uncompressedSize = BitConverter.ToInt32(lengthBuffer, 0);

        var buffer = new byte[uncompressedSize];
        using (var ms = new MemoryStream(data))
        {
            using (var gzip = new GZipStream(ms, CompressionMode.Decompress))
            {
                gzip.Read(buffer, 0, uncompressedSize);
            }
        }
        return Encoding.Unicode.GetString(buffer);            
    }

请注意,gzip.Read(buffer, 0, uncompressedSize) 可能并不会读取整个流。您可能需要在循环中进行重复调用,并查看返回值以跟踪实际读入缓冲区的字节数。请参阅 https://github.com/dotnet/runtime/issues/62954 获取更多信息。 - Stephen Swensen
另外,使用 BitConverter.ToInt32(data, data.Length - 4) 可以更简洁地计算出 uncompressedSize - Stephen Swensen

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接