我有一组markdown文件要传递给jekyll项目,需要使用程序或API找出它们的编码格式,即UTF-8带BOM或UTF-8不带BOM或ANSI。
如果我传递了文件的位置,那么这些文件必须被列出、读取,并将编码作为结果生成。是否有相应的代码或API可用?
我已经尝试过在流阅读器中使用sr.CurrentEncoding,如Effective way to find any file's Encoding所述,但与notepad++的结果不同。
我还尝试使用https://github.com/errepi/ude(Mozilla通用字符集检测器),如https://social.msdn.microsoft.com/Forums/vstudio/en-US/862e3342-cc88-478f-bca2-e2de6f60d2fb/detect-encoding-of-the-file?forum=csharpgeneral 所建议的,在C#项目中实现ude.dll,但结果并不像notepad++那样有效,文件编码显示为UTF-8,但从程序中得到的结果为UTF-8带BOM。
但我应该从两种方式中获得相同的结果,所以问题出在哪里?
如果我传递了文件的位置,那么这些文件必须被列出、读取,并将编码作为结果生成。是否有相应的代码或API可用?
我已经尝试过在流阅读器中使用sr.CurrentEncoding,如Effective way to find any file's Encoding所述,但与notepad++的结果不同。
我还尝试使用https://github.com/errepi/ude(Mozilla通用字符集检测器),如https://social.msdn.microsoft.com/Forums/vstudio/en-US/862e3342-cc88-478f-bca2-e2de6f60d2fb/detect-encoding-of-the-file?forum=csharpgeneral 所建议的,在C#项目中实现ude.dll,但结果并不像notepad++那样有效,文件编码显示为UTF-8,但从程序中得到的结果为UTF-8带BOM。
但我应该从两种方式中获得相同的结果,所以问题出在哪里?