我最近开始使用语义网络和链接数据技术,但一直有一个问题困扰着我。本体和词汇表有什么区别?哪个更好?
我最近开始使用语义网络和链接数据技术,但一直有一个问题困扰着我。本体和词汇表有什么区别?哪个更好?
从文档中得知:
控制词汇表(Controlled Vocabulary)是一份明确枚举的术语清单,由控制词汇表注册管理机构进行控制并提供。在控制词汇表中,所有术语必须具有明确无歧义的定义。控制词汇表可能未指定任何含义(它只是一组人们同意使用的术语,其含义已被理解),也可能为每个术语提供非常详细的定义。
形式本体论(Formal Ontology)是用本体论表示语言表达的控制词汇表,这种语言具有使用词汇术语在特定的感兴趣领域内表达有意义内容的语法。语法包含对本体论控制词汇表中的术语如何共同使用的正式约束条件(例如,说明什么是格式正确的陈述、声明、查询等)。
词汇和本体均指一个“事物”,尽管它们有所不同。
词汇是对事物的理解。
例如:
苹果是一种水果。苹果也是苹果公司的简称。
本体是对事物整体的理解,包括与其他事物的关系、相似之处和差异。
例如:
苹果 -> 是一种水果 -> 由苹果树生产 -> 具有科学名称 -> Malus domestica -> 公司以此命名。
由于您正在使用语义Web和链接数据技术,因此本体更适合您。
词汇是机器学习实验室从处理Web上的信息中得出的。但这个方向的机器学习已经行不通了。 W3C的人意识到这一点,并提出了语义Web和链接数据等解决方案,以进一步理解事物。这就引出了本体的复杂概念。
词汇对人类来说更容易理解,而本体对机器来说更容易理解。