本体论与词汇表

27

我最近开始使用语义网络和链接数据技术,但一直有一个问题困扰着我。本体和词汇表有什么区别?哪个更好?


2
你在询问计算机科学中“本体论”的用途,但有趣的是,“本体论”起源于哲学,与存在或实在相关的词根有关。这个术语在哲学中有几个相当不相关的意义。例如,“本体论”可以指关于什么样的事物存在的理论,也可以指关于事物存在的本质是什么的理论——即关于存在是什么的理论。一个计算机科学家所谓的“本体论”,在哲学家看来可能被描述为一种分类的分层系统,或者可能被描述为属性层次结构。 - Mars
5个回答

22
我像W3C在他们关于"本体论"的描述中所做的那样持有它:
引用: “词汇表”和“本体论”之间没有明确的区分。趋势是使用“本体论”一词来表示更复杂、可能相当正式的术语集合,而“词汇表”则是在不一定使用这种严格的形式主义或仅在非常宽泛的意义上使用时使用的。词汇表是语义Web推理技术的基本构建块。
[1] http://www.w3.org/standards/semanticweb/ontology

19
在最干燥的意义上,“词汇表”是一个无上下文关系定义的术语列表。而“本体论”含义更丰富,意味着存在相互关联、公理、类等元素。
然而,“词汇表”这个术语几乎从不仅指“术语列表”,除非你谈论的是本体论的范畴。两个术语有很大重叠,在我看来,使用“词汇表”一般意味着本体论并没有严格的哲学背景支持。

7

文档中得知:

控制词汇表(Controlled Vocabulary)是一份明确枚举的术语清单,由控制词汇表注册管理机构进行控制并提供。在控制词汇表中,所有术语必须具有明确无歧义的定义。控制词汇表可能未指定任何含义(它只是一组人们同意使用的术语,其含义已被理解),也可能为每个术语提供非常详细的定义。

形式本体论(Formal Ontology)是用本体论表示语言表达的控制词汇表,这种语言具有使用词汇术语在特定的感兴趣领域内表达有意义内容的语法。语法包含对本体论控制词汇表中的术语如何共同使用的正式约束条件(例如,说明什么是格式正确的陈述、声明、查询等)。


1
那篇文章看起来很有趣,但它似乎不是特定项目或API的文档。你能详细说明一下这个来源是什么吗? - Joshua Taylor

4

W3C有一种合适的方式来描述它:

在语义网络上,词汇表定义了用于描述和表示关注领域的概念和关系(也称为“术语”)。

由于其目的是提供所需描述,因此词汇表存在于本体论中。


4

词汇和本体均指一个“事物”,尽管它们有所不同。

词汇

词汇是对事物的理解。

例如:

苹果是一种水果。苹果也是苹果公司的简称。

本体

本体是对事物整体的理解,包括与其他事物的关系、相似之处和差异。

例如:

苹果 -> 是一种水果 -> 由苹果树生产 -> 具有科学名称 -> Malus domestica -> 公司以此命名。

由于您正在使用语义Web和链接数据技术,因此本体更适合您。

词汇是机器学习实验室从处理Web上的信息中得出的。但这个方向的机器学习已经行不通了。 W3C的人意识到这一点,并提出了语义Web和链接数据等解决方案,以进一步理解事物。这就引出了本体的复杂概念。

词汇对人类来说更容易理解,而本体对机器来说更容易理解。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接