我正在开发一个使用神经网络的应用程序。目前我在考虑是否将其放入基于SQL(可能是SQL Server)的关系数据库或者图形数据库中。
从性能角度来看,神经网络将非常庞大。
我的问题:
- 与图形数据库相比,关系数据库在处理神经网络时是否会受到性能影响?
- 哪种图形数据库技术最适合处理大型神经网络?
- 像PostGIS这样的地理空间数据库是否可以有效地表示神经网络?
我正在开发一个使用神经网络的应用程序。目前我在考虑是否将其放入基于SQL(可能是SQL Server)的关系数据库或者图形数据库中。
从性能角度来看,神经网络将非常庞大。
我的问题:
这取决于模型进展的目的。
免责声明
首先,我要声明我只熟悉 Kohonnen 图。(所以,我承认 Kohonnen 只是任何东西中仅限于入门级的神经网络,并因此受到嘲笑。)以上问题是我多年来在阅读各种神经图表时进行的个人头脑运动的结果。
类别 vs 参数 vs 属性
我们是否可以按照车轮数量或吨位分类车辆?车轮数量或吨位应该是属性、参数还是类别特征。
了解这场辩论是构建你的存储库的关键步骤。这一辩论对于疾病和患者向量尤其重要。我曾经看到由医学专家设计的患者信息关系图表,但显然没有接受过信息科学方面的培训,他们假设每个患者都有一个共同的参数集。为每个患者记录准备了数千列,大部分未使用。当他们超出表格的列限制时,他们会创建一个新的表格,并添加更多稀疏使用的数千列。
类型 1:所有节点具有共同的参数集,因此可以将节点建模成具有已知列数的表格。
类型 2:有各种类别的节点。节点的类别数量是固定的。每个类别都有一组固定的参数。因此,每个类别的节点都有一个特征表格。
类型 3:没有意图把节点归类。每个节点都可以自由地开发和获取自己的独特属性集。
类型 4:有固定数量的节点类别。每个类别中的节点可以自由地开发和获取其自己的独特属性集。每个类别都有一组受限制的属性,节点可以获取这些属性。
SELECT id FROM Nodes a, NumericAttributes b
WHERE a.attributeName = $name
AND b.value WItHIN $range
AND a.id = b.id
可以使用自引用外键将树存储在表中。 我假设需要存储的仅有两个是拓扑和权重; 这两者都可以存储在扁平化的树结构中。 当然,这可能需要许多递归选择,在您的RDBMS上,这取决于本地实现的痛苦程度(因此需要许多SQL查询来实现)。 我无法评论比较,但希望这有助于关系观点:)