存储同义词的数据结构

4
大家好。
我是这个论坛的新成员,也是计算机科学行业的新手,所以这个问题可能看起来不太结构化。我问这个问题是因为我必须在我的项目中包含它。即使你不能通过精确的答案帮助我,我也请求你为我指引到达答案的路径。 问题:
我正在寻找自我演化的数据结构,用于对术语和短语(符合某些规则的同义词)进行对齐。例如,如果查询同义词mobile的结果还包括一些相关部分(规则将在此处调用),那么Mobile和Cell将是同义词。Mobile和Cell的含义也可能不同。Mobile也可以是Mobile Library、Mobile Hospital等,而Cell可以是生物学术语。
我的工作
我已经探索了一些Nosql和Neo4j图形数据库。它们非常好,但我无法找到任何与我的问题相关的有用概念。
提前感谢您的帮助。任何帮助都会受到赞赏。
1个回答

3

我不知道你的规则需要多么复杂,但如果像你的例子那样简单,那么你可以使用一个类似如下的简单关系模型:

enter image description here

你的单词列表 (Term) 包含所有像 "cell"、"mobile" 等的单词。你的规则表 (Context) 列出了单词在哪个域中使用(比如 "calling"、"biology" 等),连接表 (Synonym) 在同一个 Context 中将两个 Terms 连接起来。


1
感谢您的回复,Joel。是的,这里提到的示例(规则)相当简单。但是,如果用户查询“我一直在佛罗里达咳嗽、憋气和发烧”,因为这些是猪流感的原因,那么如果此时有许多患者经过猪流感,那该怎么办?因此,这个查询应该回答“你可能患有猪流感”。在这里,可以使用什么类型的数据结构,我举了医学领域的例子,因为我需要将其包含在医学治疗引擎中。 - pawan9977
@PawanParekh - 我不清楚你实际想要实现什么。将一组症状与可能的诊断联系起来是专家系统的主题,而不是同义词查找表。如果这正是您要实现的内容,则建议您查看此问题:https://dev59.com/n3NA5IYBdhLWcg3wn_bD - Joel Brown
非常抱歉回复晚了。我正在使用图形数据库来对齐它们。 - pawan9977

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接