什么是语义网?

49

我听说过很多关于语义网的事情,但我还不确定它到底是什么。它和我们现在所知道的互联网有什么不同?

10个回答

41

最好的解释是通过例子。尝试使用谷歌搜索引擎搜索所有在网上广告中配有小于2.0升且可用无铅汽油运行的发动机,并具有mp3连接并可以在展厅方便地乘坐公共交通工具从我家到达的汽车。

谷歌实际上无法帮助您进行该查询。您必须进行多次搜索并自己关联结果。在语义Web上,您将能够表达对出售的产品的兴趣,并添加约束条件。每个结果都将有用。一个或多个UI可能使您能够这样做,有些可能是专业的,其他则完全通用。

另一个例子是创建一张不通常存储在同一位置的事物图表,比如说饮食可乐的流行度,或者人口中的乡村步行与同一人口中的临床肥胖水平。对于这些内容,您可能根本不需要使用网络浏览器,而是可以使用更像Excel的东西——但是语义Web为您提供了工具(SPARQL、RDF),以查找和操作那些可以通过HTTP访问的数据。

所以Bravax的观点并非完全正确,可能不会有太大变化 - 你可能只是会得到更多有用和更好的混搭网站。或者你可能会发现自己做了很多以前从未想过与网络相关的事情。
当前的网络有很多替代方案,例如动画GIF、Flash、Silverlight、DHTML等。为了将数据放在语义网络上,将会有一系列工具和格式。RDFa是一个很好的选择,它是一种更通用的微格式类型,但你也可以提供整个数据库的转储,公开SPARQL端点,使用微格式或专有的HTML结构并添加转换,会有许多工具适用于不同的情况。
所以Vartec也部分正确,你可以使用RDFa和eRDF,但你也可以使用许多其他东西来发布数据。
请注意,语义网和另一个更简单的概念链接数据之间存在很多重叠。它们之间的关系不清楚,但我的看法是,在使用语义Web工具和技术之前,您需要Linked Data Web。Linked Data是关于数据的,语义Web更多地涉及处理数据、推理和处理信任可靠性等问题。本质上是技术堆栈的底部几层。

7
祝你好运,让终端用户在搜索引擎中输入SPARQL查询。 - hsivonen
1
我认为用户输入SPARQL的频率与他们现在输入SQL的频率大致相同,尽管可能会更频繁,因为他们有更多的数据可以吸引他们。我认为你会感到震惊,看到有时候Excel电子表格中嵌入了多少SQL! - Simon Gibbs
2
“Linked Data”只是“语义网络”的委婉说法。 - Mark Cidade
作为对hsivonen评论的回应:我不认为Simon的意思是用户会在搜索引擎中输入SPARQL。我理解这个答案的意思是,用户可以按照提到的句子格式输入查询,然后搜索引擎可以将其解析为SPARQL或类似的内容,然后根据语义上输入的数据(在Web上)获取数据,这些数据可以自动相关联。 - Travis
@SimonGibbs,你的回答非常有趣和实用。我开始研究本体论和语义网。我期待着开发一个语义网站。你能给我展示一个当前实现语义网的网站的例子吗?谢谢! - ivantxo
显示剩余4条评论

37

它与我们现在所知道的网络有何不同?

现在的HTML+CSS更注重结构和展示。语义是关于信息的含义。在语义网络中,您使用共享本体论来建立对象的含义(语义)和对象之间关系的含义。 最知名的本体论是:FOAFDublin Core

通常,语义会用专门的语言表达,例如RDFOWL。 RDF可以使用eRDF或W3C的RDFa嵌入在XHTML中。

相对于eRDF/RDFa的较少结构化的替代方案是微格式

阅读更多: http://en.wikipedia.org/wiki/Semantic_web


1
Dublin核心关注的是信息资源所包含的内容(数据关于数据 / 元数据),而不是信息资源之间的关系。关于关系的信息可以使用ISO主题图描述(http://en.wikipedia.org/wiki/Topic_Maps)。 - codeinthehole
据我所知,语义网更多地涉及数据之间的关系(而不是分类)。 - codeinthehole
为了完整性和因为例子通常有助于传达一个概念,你能在你的回答中提供一个小的代码示例吗?使用你提到的其中一种编程语言。 - w5m
通常语义会用专门的语言来表达,比如RDF或OWL。但这并不完全正确。语义是由于对RDF和OWL语义的共识而表达的。 - William Kinaan
我认为 Dublin Core 从未被其创建者视为本体论。它只是一个简单的元数据模式。 - helcim

13

语义Web 的核心思想很简单(像所有好的想法一样)。

当前的 Web 由相互链接的文档构成。谷歌通过使用上下文和链接中的锚文本,一直在建立基于这些信息的检索引擎,他们在这方面做得非常不错。换句话说,谷歌试图猜测链接的语义含义。

语义 Web 的想法是“如果这些链接是有类型的呢?” Web 上的每个事实都有一个地址 - 一个 URI - 并且通过关系(也是 URI)与其他事实(也是URI)相连接。关系的集合称为“本体论”。

因此,与目前的 Web 中页面 A 链接到页面 B 不同,语义 Web 上的链接更像:

URI A 使用类型 URI C 链接到 URI B。

任何东西都可以有一个 URI。人们也可以有 URIs;通常我们使用称为 FOAF 的关系集来描述他们。假设 Jeff Atwood 的 URI 是 http://codinghorror.com/foaf.xml,那么你可以这样说:

<http://codinghorror.com> <http://xmlns.com/foaf/0.1/homepage> <http://codinghorror.com/foaf.xml>

也就是说,http://codinghorror.com 是由 http://codinghorror.com/foaf.xml 所表示的个人的主页。

现在机器可以读取并查询这些关系 - 因此你可以将网络转换为数据库,让计算机可以立即处理。语义Web查询语言是SPARQL,值得一试。


4
语义Web就是在WWW上的一个语义(有意义)层。它是半结构化的(RDF),自我描述的(使用OWL本体论),并允许资源发现(SPARQL)。
语义Web基于“开放世界”假设工作;仅因为某些事情未被说明并不意味着它不存在,它只是“未知”的。这与像MySQL等关系数据库管理系统中使用的逻辑完全不同 - 如果某些内容缺失,则表示其不存在 - “封闭世界”假设。 Prolog和DATALOG是封闭世界逻辑的很好的例子。
如果您真的想了解底层正在发生的事情,您需要查看其基础,这些基础位于描述逻辑中。可以在此处找到对描述逻辑的良好概述:http://www.inf.unibz.it/~franconi/dl/course/ 如果您想了解有关RDF的更多信息,请阅读RDF PrimerRDF Semantics是另一篇非常有趣的文章。
研究人员基本上已经放弃了语义Web的“语义”部分,并决定专注于Linked Data - 如何导航RDF三元组,以便我们可以浪费更多的Internet带宽;-)

2
目前,HTML 页面中的标记标签如 <b><pre> 等仅描述内容应该如何显示,而不涵盖其内容的含义。
语义化 Web 的概念是,文档将包含 XML 标记,这些标记涵盖其内容的含义。例如,<person><firstname>。伟大的想法是 CSS 能够格式化此类文档,同时也能够轻松地从这些文档中提取有意义的信息。

认为HTML元素没有语义意义是一个常见的误解。HTML仅涵盖元素在文档结构方面的含义。HTML具有以文档为中心的语义,而不是以数据为中心的语义。 - Jon Cram
它并没有说HTML完全没有语义意义,我是说它们不暗示任何关于内容的意义。正如你所说,HTML对渲染器具有结构性意义。HTML本身对内容是不可知的。 - AnthonyWJones
1
语义网(大写S)是RDF。使用XML只是偶然的。 - hsivonen
我不明白改变大小写如何改变单词或者RDF如何垄断这个概念。然而,无论你是否订阅“语义”特定实现,XML都是传递该概念的合理基础。 - AnthonyWJones
@AnthonyWJones: 说得好,我稍微误读了你的回答!希望阅读这些评论的人能从中学到一些东西。 - Jon Cram

2
语义网是万维网的发明者蒂姆·伯纳斯-李(Tim Berners-Lee)真正意图让Web成为全球互连数据图形的产物。它是社交图形的一种泛化,您可以使用社交数据(使用词汇表如FOAF)以及任何其他类型的机器可理解的数据并将它们相互连接。描述这些信息的标准格式是资源描述框架(RDF)和Web本体语言(OWL)。网络上已经有很多编码数据,包括维基百科的RDF版本,称为DBPedia。
语义网将与当前的网络不同,因为计算机和人类都将理解文档的内容以及文档之间链接的意义。这将有助于自动化信息处理任务,包括从可信源研究信息。完整的SemWeb技术栈包括密码学、证明系统和信任网络。

2

Tim Berners-Lee在他的博客文章《巨型全局图》(来自2007-11-21)中描述了它:

三个思维跳跃:

  1. 互联网:“有趣的不是电缆,而是计算机”
  2. (万维网) Web:“有趣的不是计算机,而是文档”
  3. 巨型全局图:“重要的不是文档,而是文档所涉及的事物”

关于“巨型全局图”一词:

现在,我们可以使用图这个词来区分Web。

我称这个图为“语义Web”,但也许应该称之为“巨型全局图”!比WWWW更糟糕吗?;-)虽然“语义Web”这个术语已经被确立很长时间了,但我并不建议改变它。但是,让我们思考一下它所代表的图。(脚注:RDF规范也恰好使用“图”这个词,但这是另一回事。虽然XML解析器创建DOM树,但RDF解析器会在内存中创建RDF图。)


1
语义网络是迄今为止提出的唯一实用解决方案,用于修复万维网固有设计缺陷。因为我们今天所知道的互联网的设计师没有提供机制来解决基本的语言现象,这些现象控制着人类思考和交流的方式,例如同音异义词、近义词等。在互联网上搜索信息会导致大量错误的结果。语义网络的想法归结为为Web资源分配明确的标识符,以帮助正确地识别它们的含义。如果它成功了,我们可能会忘记通常的谷歌搜索是什么样子的,如果它失败了,所有事情都将保持不变。

0

这是一个吸引人们兴趣的流行词,类似于Web 2.0。

即将来临的未来,内容将从呈现中分离出来,带来很多好处。
但实际上,事实会因主机的可靠性和权威性而有所不同。

换句话说,用户现在看到的不会有太大的区别。


1
我怀疑这一点。那些都是主观的术语。 - Bravax
2
例如,“jaguar”既可以表示一种动物,也可以表示一辆汽车以及其他几件事情,这是主观的吗?以开尔文为单位的温度是主观的吗?你在说什么? - vartec
1
不,这些并不是主观的,但是说一个维基百科上关于美洲豹的文章是否准确是主观的。将来我们会有一些语义网站,但绝大多数不会是。 - Bravax
我非常希望全球人工智能的发展。虽然这可能会让我失业,但至少我可以得到一个漫长的假期。 - Jon Cram
3
语义网络允许对可信源进行标记,这使得它与现在的网络不同,因为您可以将源检查任务委派给计算机。 - Mark Cidade
显示剩余7条评论

0

语义网是一个分布式信息系统,其中互连的数据作为RDF三元组通过HTTP发布。RDF三元组由主语、谓语和宾语组成,但可以附加其他内容,例如有关对象的数据类型和注释。在语义网上,URI既用作标识符,也用作网络资源的地址。

它与Web不同,因为Web是文档和应用程序接口的分布式信息系统。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接