我想使用一种除了Huffman和自适应Huffman算法之外的压缩技术来压缩DNA序列,我使用c#作为编程语言。 请问有人可以帮我找到一种算法吗? 注:我需要一种无损压缩算法。
我想使用一种除了Huffman和自适应Huffman算法之外的压缩技术来压缩DNA序列,我使用c#作为编程语言。 请问有人可以帮我找到一种算法吗? 注:我需要一种无损压缩算法。
使用DNA序列有4种可能的状态,分别是:
您可以使用两位比特来存储这四种可能的状态及其括号中的值。通过这种简单方法,您将能够在一个字节中存储四个不同的值。
更新
如@kol所提到的,您可以使用几乎任何压缩算法进一步压缩数据。
目前,.NET附带了两种压缩方法(Deflate和GZip),更多压缩方法可以在SharpZipLib开源库中找到。