如果你想从维基百科中提取结构化数据,可以考虑使用DbPedia http://dbpedia.org/。它提供了使用SPARQL查询数据的工具,并从解析后的维基百科信息框模板返回数据。以下是在.NET中快速实现的例子http://www.kozlenko.info/blog/2010/07/20/executing-sparql-query-on-wikipedia-in-net/。目前有一些适用于多个平台的SPARQL库可用以使查询更加简单。
这里有两个来自infochimps.com的: http://www.infochimps.com/datasets/wikipedia-articles-abstract-search http://www.infochimps.com/datasets/wikipedia-articles-title-autocomplete