我有一棵树,具体来说是带有节点标签和叶子字符串/单词的解析树。我想将这棵树作为输入传递给神经网络,同时保持其结构。
当前方法 假设我们有一些单词字典 w1,w2.....wn 将在解析树中出现的单词编码为n维二进制向量,当解析树中的单词为wi时,在第i个位置上会出现1
那么树的结构怎么办呢?对于n个叶节点单词,大约有2^n种可能的父标签,所以我们不能设定最大输入单词长度,然后强行枚举所有树。
现在我能想到的方法就是通过选择一个叶子结点的直接父节点来近似表示该树。同样,这也可以用二进制向量来表示,其维度等于不同类型标签的数量 - 大约是 ~100。 我的输入是二维的。第一维只是单词的向量表示,第二维是其父标签的向量表示。
但是这样会失去很多句子的结构。是否有标准/更好的方法来解决这个问题呢?