更新:@GetoX已将此代码封装成适用于.net core的NuGet包!请参见下文,谢谢!
因此,我想知道是否有人能够指导我使用更多MIME类型的另一种方法,或者是另一种方法/类,我可以在其中包含我认为合适的MIME类型。
我使用Winista和URLMon的混合方式来检测上传文件的真实格式。
Winista MIME检测
比如说,有人将exe重命名为jpg扩展名,你仍然可以使用二进制分析确定“真实”的文件格式。它无法检测swf或flv,但几乎可以检测出所有其他众所周知的格式,而且你还可以获取十六进制编辑器并添加更多它可以检测到的文件。
File Magic
Winista使用一个名为“mime-type.xml”的XML文件来检测真正的MIME类型,该文件包含有关文件类型以及用于识别内容类型的签名的信息。例如:
<mime-type name="audio/basic"
description="uLaw/AU Audio File">
<ext>au</ext><ext>snd</ext>
<magic offset="0" type="byte" value="2e736e64000000"/>
</mime-type>
<mime-type name="audio/midi"
description="Musical Instrument Digital Interface MIDI-sequention Sound">
<ext>mid</ext><ext>midi</ext><ext>kar</ext>
<magic offset="0" value="MThd"/>
</mime-type>
<mime-type name="audio/mpeg"
description="MPEG Audio Stream, Layer III">
<ext>mp3</ext><ext>mp2</ext><ext>mpga</ext>
<magic offset="0" value="ID3"/>
</mime-type>
当Winista无法检测到真实的文件格式时,我会回到使用URLMon方法:
public class urlmonMimeDetect
{
[DllImport(@"urlmon.dll", CharSet = CharSet.Auto)]
private extern static System.UInt32 FindMimeFromData(
System.UInt32 pBC,
[MarshalAs(UnmanagedType.LPStr)] System.String pwzUrl,
[MarshalAs(UnmanagedType.LPArray)] byte[] pBuffer,
System.UInt32 cbSize,
[MarshalAs(UnmanagedType.LPStr)] System.String pwzMimeProposed,
System.UInt32 dwMimeFlags,
out System.UInt32 ppwzMimeOut,
System.UInt32 dwReserverd
);
public string GetMimeFromFile(string filename)
{
if (!File.Exists(filename))
throw new FileNotFoundException(filename + " not found");
byte[] buffer = new byte[256];
using (FileStream fs = new FileStream(filename, FileMode.Open, FileAccess.Read))
{
if (fs.Length >= 256)
fs.Read(buffer, 0, 256);
else
fs.Read(buffer, 0, (int)fs.Length);
}
try
{
System.UInt32 mimetype;
FindMimeFromData(0, null, buffer, 256, null, 0, out mimetype, 0);
System.IntPtr mimeTypePtr = new IntPtr(mimetype);
string mime = Marshal.PtrToStringUni(mimeTypePtr);
Marshal.FreeCoTaskMem(mimeTypePtr);
return mime;
}
catch (Exception e)
{
return "unknown/unknown";
}
}
}
在Winista方法内部,我使用URLMon作为后备:
public MimeType GetMimeTypeFromFile(string filePath)
{
sbyte[] fileData = null;
using (FileStream srcFile = new FileStream(filePath, FileMode.Open, FileAccess.Read))
{
byte[] data = new byte[srcFile.Length];
srcFile.Read(data, 0, (Int32)srcFile.Length);
fileData = Winista.Mime.SupportUtil.ToSByteArray(data);
}
MimeType oMimeType = GetMimeType(fileData);
if (oMimeType != null) return oMimeType;
Winista.MimeDetect.URLMONMimeDetect.urlmonMimeDetect urlmonMimeDetect = new Winista.MimeDetect.URLMONMimeDetect.urlmonMimeDetect();
string urlmonMimeType = urlmonMimeDetect.GetMimeFromFile(filePath);
if (!string.IsNullOrEmpty(urlmonMimeType))
{
foreach (MimeType mimeType in types)
{
if (mimeType.Name == urlmonMimeType)
{
return mimeType;
}
}
}
return oMimeType;
}
Wayback Machine链接到netomatix的Winista实用工具。据我所知,他们在开源Nutch爬虫系统中找到了一些“mime reader utility classes”,并在2000年代初进行了C#重写。
我使用Winista和URLMon回退托管了我的MimeDetect项目(请使用十六进制编辑器贡献新的文件类型):https://github.com/MeaningOfLights/MimeDetect
您还可以使用注册表方法或.Net 4.5方法,这些方法在Paul Zahra链接的此帖子中提到,但是在我看来,Winista是最好的选择。
享受知道您系统上的文件确实是它们所声称的,而不是被恶意软件感染的乐趣!
更新:
对于桌面应用程序,您可能会发现WindowsAPICodePack更好:
using Microsoft.WindowsAPICodePack.Shell;
using Microsoft.WindowsAPICodePack.Shell.PropertySystem;
private static string GetFilePropertyItemTypeTextValueFromShellFile(string filePathWithExtension)
{
var shellFile = ShellFile.FromFilePath(filePathWithExtension);
var prop = shellFile.Properties.GetProperty(PItemTypeTextCanonical);
return prop.FormatForDisplay(PropertyDescriptionFormatOptions.None);
}