我正在尝试将自定义MIME类型添加到Apache Tika。
我在org.apache.tika.mime
中有以下custom-mimetypes.xml
文档:
<?xml version="1.0" encoding="UTF-8"?>
<mime-info>
<mime-type type="text/stringtemplategroup">
<glob pattern="*.stg"/>
</mime-type>
<mime-type type="text/stringtemplate">
<glob pattern="*.st"/>
</mime-type>
</mime-info>
我遇到了一个关于“冲突扩展模式 .st”的错误:
Caused by: org.apache.tika.mime.MimeTypeException: Conflicting extension pattern: .st
at org.apache.tika.mime.MimeTypesReader.startElement(MimeTypesReader.java:166)
at org.apache.xerces.parsers.AbstractSAXParser.startElement(Unknown Source)
如何覆盖默认的
*.st
扩展名,并使用自己的扩展名?
File
对象,而不是一个InputStream
中,所以在Google App Engine上使用非常困难,我不得不分叉并修改太多的东西才能使它更加容易。最终,我自己编写了一个魔数分类器来支持我应用程序中少数几种类型。Tika是一个好想法,但实现很糟糕。 - user177800