从NSData或UIImage中查找图像类型

77

我正在从第三方提供的URL加载图像。此URL没有文件扩展名(或文件名),因为它是一个混淆的URL。我可以获取这个数据(以NSData的形式)并将其加载到UIImage中,并正常显示。

我想将这些数据保存到文件中。但是,我不知道数据的格式是什么(PNG、JPG、BMP)?我假设它是JPG格式(因为它是从网络上获取的图像),但有没有编程的方法来确保?我已经在StackOverflow和文档中查找了一些信息,但没有找到答案。

TIA。


编辑:我真的需要文件扩展名吗?我将其持久化到外部存储(Amazon S3),但考虑到它将始终在iOS或浏览器的上下文中使用(两者似乎都能正确解释数据而无需扩展名),也许这不是一个问题。


为什么你需要知道呢?如果UIImage正常显示,我不明白为什么不能在不使用扩展的情况下将其持久化。 - kennytm
1
该图像将来也会显示在网站上。我现在发现,浏览器可以正确地显示原始图像(没有文件扩展名)。 - pschang
11个回答

147

如果您拥有图像文件的NSData,则可以通过查看第一个字节来猜测内容类型:

+ (NSString *)contentTypeForImageData:(NSData *)data {
    uint8_t c;
    [data getBytes:&c length:1];

    switch (c) {
    case 0xFF:
        return @"image/jpeg";
    case 0x89:
        return @"image/png";
    case 0x47:
        return @"image/gif";
    case 0x49:
    case 0x4D:
        return @"image/tiff";
    }
    return nil;
}

4
是否有类似的解决方案来识别其他类型的文件,比如rtf、mov、mp3等? - Devarshi
5
对于识别UIImage对象,这并没有帮助我。为了从UIImage中提取NSData,我需要使用UIImagePNGRepresentation()或UIImageJPEGRepresentation(),它们会自动将图像数据进行转换。 - Shyam Bhat
1
另一种方法:CGImageSource(ImageIO框架的一部分)可以为图像数据提供适当的统一类型标识符。 - nzeltzer
我有一个首字节为0xDB的jpg文件吗? - rob5408
2
有人知道 PDF、Word(doc、docx)、Excel(xls、xlsx)、PowerPoint(ppt、pptx)、文本和 RTF 的字节数吗? - Arun Gupta
显示剩余2条评论

29

wl.的回答基础上进行改进,这里提供了一种更加详细和精确的方式来根据文件头预测图像的MIME类型。这段代码在很大程度上受到了PHP的ext/standard/image.c的启发。

- (NSString *)mimeTypeByGuessingFromData:(NSData *)data {

    char bytes[12] = {0};
    [data getBytes:&bytes length:12];

    const char bmp[2] = {'B', 'M'};
    const char gif[3] = {'G', 'I', 'F'};
    const char swf[3] = {'F', 'W', 'S'};
    const char swc[3] = {'C', 'W', 'S'};
    const char jpg[3] = {0xff, 0xd8, 0xff};
    const char psd[4] = {'8', 'B', 'P', 'S'};
    const char iff[4] = {'F', 'O', 'R', 'M'};
    const char webp[4] = {'R', 'I', 'F', 'F'};
    const char ico[4] = {0x00, 0x00, 0x01, 0x00};
    const char tif_ii[4] = {'I','I', 0x2A, 0x00};
    const char tif_mm[4] = {'M','M', 0x00, 0x2A};
    const char png[8] = {0x89, 0x50, 0x4e, 0x47, 0x0d, 0x0a, 0x1a, 0x0a};
    const char jp2[12] = {0x00, 0x00, 0x00, 0x0c, 0x6a, 0x50, 0x20, 0x20, 0x0d, 0x0a, 0x87, 0x0a};


    if (!memcmp(bytes, bmp, 2)) {
        return @"image/x-ms-bmp";
    } else if (!memcmp(bytes, gif, 3)) {
        return @"image/gif";
    } else if (!memcmp(bytes, jpg, 3)) {
        return @"image/jpeg";
    } else if (!memcmp(bytes, psd, 4)) {
        return @"image/psd";
    } else if (!memcmp(bytes, iff, 4)) {
        return @"image/iff";
    } else if (!memcmp(bytes, webp, 4)) {
        return @"image/webp";
    } else if (!memcmp(bytes, ico, 4)) {
        return @"image/vnd.microsoft.icon";
    } else if (!memcmp(bytes, tif_ii, 4) || !memcmp(bytes, tif_mm, 4)) {
        return @"image/tiff";
    } else if (!memcmp(bytes, png, 8)) {
        return @"image/png";
    } else if (!memcmp(bytes, jp2, 12)) {
        return @"image/jp2";
    }

    return @"application/octet-stream"; // default type

}

以上方法可识别以下图像类型:

  • image/x-ms-bmp (bmp)
  • image/gif (gif)
  • image/jpeg (jpg, jpeg)
  • image/psd (psd)
  • image/iff (iff)
  • image/webp (webp)
  • image/vnd.microsoft.icon (ico)
  • image/tiff (tif, tiff)
  • image/png (png)
  • image/jp2 (jp2)

不幸的是,从UIImage实例中获取这种信息的方法并不简单,因为其封装的位图数据无法访问。


3
很棒的清单,谢谢。我在使用iOS11中遇到了新的.heic图像类型的问题。您能否更新您的答案以包括这种新类型? - alfonso

16

@Tai Le的Swift 3解决方案将整个数据分配给字节数组。如果图像很大,这可能会导致崩溃。这个解决方案只分配单个字节:

import Foundation

public extension Data {
    var fileExtension: String {
        var values = [UInt8](repeating:0, count:1)
        self.copyBytes(to: &values, count: 1)

        let ext: String
        switch (values[0]) {
        case 0xFF:
            ext = ".jpg"
        case 0x89:
            ext = ".png"
        case 0x47:
            ext = ".gif"
        case 0x49, 0x4D :
            ext = ".tiff"
        default:
            ext = ".png"
        }
        return ext
    }
}

9

如果您正在从URL检索图像,则可以检查HTTP响应标头。 Content-Type 头包含有用的信息吗?(我想它会,因为浏览器可能能够正确显示图像,只有在内容类型适当设置时才能这样做)


哦,是的。我没有想到这个!好主意。 - pschang

7

Swift3 版本:

let data: Data = UIImagePNGRepresentation(yourImage)!

extension Data {
    var format: String {
        let array = [UInt8](self)
        let ext: String
        switch (array[0]) {
        case 0xFF:
            ext = "jpg"
        case 0x89:
            ext = "png"
        case 0x47:
            ext = "gif"
        case 0x49, 0x4D :
            ext = "tiff"
        default:
            ext = "unknown"
        }
        return ext
    }
}

如果您使用UIImagePNGRepresentation获取UIImage数据,则数据属性将始终返回PNG。顺便说一下,在Swift 3或更高版本中,“Data”已经是字节的集合,为什么不直接使用“first”? - Leo Dabus

5

另一种可行的方法是使用image I/O frameWork来检查图像的UTI。您可以通过UTI获取图像类型。 尝试以下代码:

CGImageSourceRef imgSrc = CGImageSourceCreateWithData((CFDataRef)data, NULL);
NSString *uti = (NSString*)CGImageSourceGetType(imgSrc);
NSLog(@"%@",uti);

例如,GIF图像的UTI是"com.compuserve.gif",PNG图像的UTI是"public.png"。但如果image I/O frameWork无法识别图像,则无法获得UTI。

4
UIImage中获取图像类型,可以从底层的Quartz图像数据中获取类型标识符(UTI):
extension UIImage {
    var typeIdentifier: String? {
        cgImage?.utType as String?
    }
}

要从URL获取图像类型标识符,这将取决于URL指向本地资源还是非本地资源:

extension URL {
    // for local resources (fileURLs)
    var typeIdentifier: String? { (try? resourceValues(forKeys: [.typeIdentifierKey]))?.typeIdentifier }
    // for non local resources (web) you can get it asyncronously
    func asyncTypeIdentifier(completion: @escaping ((String?, Error?) -> Void)) {
        var request = URLRequest(url: self)
        request.httpMethod = "HEAD"
        URLSession.shared.dataTask(with: request) { _ , response , error in
            completion((response as? HTTPURLResponse)?.mimeType, error)
        }.resume()
    }
}

let imageURL = URL(string: "https://istack.dev59.com/varL9.webp")!
imageURL.asyncTypeIdentifier { typeIdentifier, error in
    guard let typeIdentifier = typeIdentifier, error == nil else { return }
    print("typeIdentifier:", typeIdentifier)
}

3

基于 @ccoroom 的改进方案

//  Data+ImageContentType.swift

import Foundation

extension Data {  
    enum ImageContentType: String {
        case jpg, png, gif, tiff, unknown

        var fileExtension: String {
            return self.rawValue
        }
    }

    var imageContentType: ImageContentType {

        var values = [UInt8](repeating: 0, count: 1)

        self.copyBytes(to: &values, count: 1)

        switch (values[0]) {
        case 0xFF:
            return .jpg
        case 0x89:
            return .png
        case 0x47:
           return .gif
        case 0x49, 0x4D :
           return .tiff
        default:
            return .unknown
        }
    }
}

一些使用示例:
//load some image
do {
    let imageData = try Data(contentsOf: URL(string: "https://myServer/images/test.jpg")!)
} catch {
    print("Unable to load image: \(error)")
}

//content type check
guard [Data.ImageContentType.jpg,
       Data.ImageContentType.png].contains(imageData.imageContentType) else {
    print("unsupported image type")
            return
        }

//set file extension
let image = "myImage.\(imageData.imageContentType.fileExtension)" //myImage.jpg

1

为每种已知的图像格式实现签名检查。这里是一个快速的Objective-C函数,用于对PNG数据进行检查:

// Verify that NSData contains PNG data by checking the signature

- (BOOL) isPNGData:(NSData*)data
{
  // Verify that the PNG file signature matches

  static const
  unsigned char   png_sign[8] = {137, 80, 78, 71, 13, 10, 26, 10};

  unsigned char   sig[8] = {0, 0, 0, 0, 0, 0, 0, 0};

  if ([data length] <= 8) {
    return FALSE;
  }

  [data getBytes:&sig length:8];

  BOOL same = (memcmp(sig, png_sign, 8) == 0);

  return same;
}

1

如果这真的很重要,我相信你必须检查字节流。JPEG将以字节FF D8开头。PNG将以89 50 4E 47 0D 0A 1A 0A开头。我不知道BMP是否有类似的标头,但我认为在2010年你不太可能在网络上遇到它们。

但这对你真的很重要吗?你不能把它视为未知图像并让Cocoa Touch来处理吗?


1
我将其存储在第三方(Amazon S3)上,并最终打算在网站上使用此图像。虽然,现在我已经让它工作了,但我发现浏览器知道如何呈现图像,而不管文件扩展名。我们也知道iOS的UIImage并不关心。所以也许这没关系? - pschang
我的猜测是这并不重要,但如果你关心IE对没有扩展名的文件做正确的事情,那么你也应该测试一下。 - Steven Fisher

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接