我正在建设一个分类IT问题的网站。如何获取Stack Overflow上使用的所有标签的内容?
我需要使用相同的标签功能,并单独使用相同的内容。
如何提取所有标签的内容?(应该有几千个标签。)
我正在建设一个分类IT问题的网站。如何获取Stack Overflow上使用的所有标签的内容?
我需要使用相同的标签功能,并单独使用相同的内容。
如何提取所有标签的内容?(应该有几千个标签。)
select
t.tagName,
e.body as 'Excerpt',
w.body as 'WikiBody'
from tags t
left join Posts e
on t.ExcerptPostId = e.Id
left join Posts w
on t.WikiPostId = w.Id
order by t.tagName
在这篇文章发布时,它返回了42,553行。
请注意,并非所有标签都有摘录或维基内容。
我在Andy的回答的基础上进行了拓展,并收集了每个标签的同义词:
select e.id,
count(t.tagName),
string_agg(TagSynonyms.SourceTagName, ',') as synonyms,
t.tagName,
e.body as 'Excerpt',
w.body as 'WikiBody'
from tags t
left join Posts e
on t.ExcerptPostId = e.Id
left join Posts w
on t.WikiPostId = w.Id
left join TagSynonyms
on TagSynonyms.TargetTagName = t.tagName
group by t.tagName, e.body, w.body, e.id
order by count(t.tagName) desc
链接在这里。