C++和Haskell中的树遍历

3

我是Haskell的新手。我试图了解Haskell如何处理递归函数调用以及它们的惰性评估。我进行的实验很简单,即在C++和Haskell中构建二叉搜索树,并分别按后序遍历它们。C++实现是标准的辅助堆栈方法。(我只是在访问元素时打印出它)。

这是我的Haskell代码:

module Main (main) where

import System.Environment (getArgs)
import System.IO
import System.Exit
import Control.Monad(when)
import qualified Data.ByteString as S

main = do
     args <- getArgs
     when (length args < 1) $ do
          putStrLn "Missing input files"
          exitFailure

     content <- readFile (args !! 0)
     --preorderV print $ buildTree content
     mapM_ print $ traverse POST $ buildTree content
     putStrLn "end"


data BSTree a = EmptyTree | Node a (BSTree a) (BSTree a) deriving (Show)
data Mode = IN | POST | PRE

singleNode :: a -> BSTree a
singleNode x = Node x EmptyTree EmptyTree

bstInsert :: (Ord a) => a -> BSTree a -> BSTree a
bstInsert x EmptyTree = singleNode x
bstInsert x (Node a left right)
          | x == a = Node a left right
          | x < a  = Node a (bstInsert x left) right
          | x > a  = Node a left (bstInsert x right)

buildTree :: String -> BSTree String
buildTree = foldr bstInsert EmptyTree . words

preorder :: BSTree a -> [a]
preorder EmptyTree = []
preorder (Node x left right) = [x] ++ preorder left ++ preorder right

inorder :: BSTree a -> [a]
inorder EmptyTree = []
inorder (Node x left right) = inorder left ++ [x] ++ inorder right

postorder :: BSTree a -> [a]
postorder EmptyTree = []
postorder (Node x left right) = postorder left ++  postorder right ++[x]

traverse :: Mode -> BSTree a -> [a]
traverse x tree = case x of IN   -> inorder tree
                            POST -> postorder tree
                            PRE  -> preorder tree


preorderV :: (a->IO ()) -> BSTree a -> IO ()
preorderV f EmptyTree = return ()
preorderV f (Node x left right) = do 
                                     f x
                                     preorderV f left
                                     preorderV f right

我的测试结果表明,C++在性能方面明显优于Haskell:

C++性能:(请注意,first15000.txt大约是first3000.txt的5倍)

time ./speedTestForTraversal first3000.txt > /dev/null 

real    0m0.158s
user    0m0.156s
sys     0m0.000s
time ./speedTestForTraversal first15000.txt > /dev/null 

real    0m0.923s
user    0m0.916s
sys     0m0.004s

使用相同输入文件的Haskell:

time ./speedTestTreeTraversal first3000.txt > /dev/null 

real    0m0.500s
user    0m0.488s
sys     0m0.008s
time ./speedTestTreeTraversal first15000.txt > /dev/null 

real    0m3.511s
user    0m3.436s
sys     0m0.072s

我本以为Haskell与C++的差别不大,但是否存在一些错误?有没有办法改进我的Haskell代码?
谢谢。
编辑:2014年10月18日
经过多次测试,Haskell的遍历仍然比C++实现要慢得多。我要给予Cirdec的回答充分的信任,因为他指出了我Haskell实现的低效性。然而,我的原始问题是比较C++和Haskell实现。所以我想保留这个问题,并发布我的C++代码以鼓励更进一步的讨论。
#include <iostream>
#include <string>
#include <boost/algorithm/string.hpp>
#include <fstream>
#include <stack>
using namespace std;
using boost::algorithm::trim;
using boost::algorithm::split;


template<typename T>
class Node
{
public:
    Node(): val(0), l(NULL), r(NULL), p(NULL) {};
    Node(const T &v): val(v), l(NULL), r(NULL), p(NULL) {}
    Node* getLeft() {return l;}
    Node* getRight(){return r;}
    Node* getParent() {return p;}
    void  setLeft(Node *n) {l = n;}
    void  setRight(Node *n) {r = n;}
    void  setParent(Node *n) {p = n;}
    T  &getVal() {return val;}
    Node* getSucc() {return NULL;}
    Node* getPred() {return NULL;}
private:
    T val;
    Node *l;
    Node *r;
    Node *p;
};

template<typename T>
void destoryOne(Node<T>* n)
{
    delete n;
    n = NULL;
}

template<typename T>
void printOne(Node<T>* n)
{
    if (n!=NULL)
    std::cout << n->getVal() << std::endl;
}




template<typename T>
class BinarySearchTree
{
public:
    typedef void (*Visit)(Node<T> *);

    BinarySearchTree(): root(NULL) {}
    void delNode(const T &val){};
    void insertNode(const T &val){
    if (root==NULL)
        root = new Node<T>(val);
    else {
        Node<T> *ptr = root;
        Node<T> *ancester = NULL;
        while(ptr && ptr->getVal()!=val) {
        ancester = ptr;
        ptr = (val < ptr->getVal()) ? ptr->getLeft() : ptr->getRight(); 
        }
        if (ptr==NULL) {
        Node<T> *n = new Node<T>(val);
        if (val < ancester->getVal())
            ancester->setLeft(n);
        else
            ancester->setRight(n);
        } // else the node exists already so ignore!
    }
    }
    ~BinarySearchTree() {
    destoryTree(root);
    }
    void destoryTree(Node<T>* rootN) {
    iterativePostorder(&destoryOne);
    }

    void iterativePostorder(Visit fn) {
    std::stack<Node<T>* > internalStack;
    Node<T> *p = root;
    Node<T> *q = root;
    while(p) {
        while (p->getLeft()) {
        internalStack.push(p);
        p = p->getLeft();
        }
        while (p && (p->getRight()==NULL || p->getRight()==q)) {
        fn(p);
        q = p;
        if (internalStack.empty())
            return;
        else {
            p = internalStack.top();
            internalStack.pop();
        }
        }
        internalStack.push(p);
        p = p->getRight();
    }
    }


    Node<T> * getRoot(){ return root;}
private:
    Node<T> *root;
};



int main(int argc, char *argv[])
{
    BinarySearchTree<string> bst;
    if (argc<2) {
    cout << "Missing input file" << endl;
    return 0;
    }
    ifstream inputFile(argv[1]);
    if (inputFile.fail()) {
    cout << "Fail to open file " << argv[1] << endl;
    return 0;
    }
    while (!inputFile.eof()) {
    string word;
    inputFile >> word;
    trim(word);
    if (!word.empty()) {
        bst.insertNode(word);
    }
    }

    bst.iterativePostorder(&printOne);

    return 0;
}

编辑:2014年10月20日 下方Chris的答案非常详尽,我可以重复这个结果。


请注意,在主函数中,我注释掉了一行代码。我认为直接打印元素而不是先创建一个列表可能更好。结果证明,这两种方法的性能相似。看来惰性求值在这里表现得很好。 - Yan Zhu
3
也许你本意是要让 postorder (Node x left right) = postorder left ++ postorder right ++ [x] 吗? - Cirdec
2个回答

11

++ 进行的列表拼接操作速度较慢,因为每次使用 ++ 时,都需要遍历第一个参数直到结尾才能确定添加第二个参数的位置。你可以在 标准预定义库 中的 ++ 定义中看到第一个参数被遍历到了 []

(++) :: [a] -> [a] -> [a]
[]     ++ ys = ys
(x:xs) ++ ys = x : (xs ++ ys)

当递归使用 ++ 时,必须针对每个递归级别重复此遍历,这是低效的。

还有另一种构建列表的方法:如果您在开始构建列表之前知道列表末尾将出现什么,您可以在构建时已经放置好末尾。让我们看一下 postorder 的定义。

postorder :: BSTree a -> [a]
postorder EmptyTree = []
postorder (Node x left right) = postorder left ++ postorder right ++ [x]

当我们进行postorder left时,我们已经知道它之后会是postorder right ++ [x],因此用右侧和节点值构建左侧树的列表是有意义的。同样,当我们进行postorder right时,我们已经知道它之后应该是x。我们可以通过创建一个带有rest列表积累值的辅助函数来实现这一点。

postorder :: BSTree a -> [a]
postorder tree = go tree []
    where
        go EmptyTree rest = rest
        go (Node x left right) rest = go left (go right (x:rest))

在我的机器上,当以一个包含15k单词的字典作为输入时,速度大约提高了两倍。让我们更深入地探索一下,看看是否可以获得更深刻的理解。如果我们使用函数组合(.)和应用($)重写postorder定义,而不是使用嵌套括号,那么就会变成:

postorder :: BSTree a -> [a]
postorder tree = go tree []
    where
        go EmptyTree rest = rest
        go (Node x left right) rest = go left . go right . (x:) $ rest
我们甚至可以省略rest参数和函数应用$,并以稍微更加无点风格的方式编写它。
postorder :: BSTree a -> [a]
postorder tree = go tree []
    where
        go EmptyTree = id
        go (Node x left right) = go left . go right . (x:)

现在我们可以看到我们做了什么。我们用一个函数 [a] -> [a] 替换了一个列表 [a],这个函数将列表添加到现有列表的开头。空列表被替换为不添加任何东西到列表开头的函数,即恒等函数 id。单元素列表 [x] 被替换为将 x 添加到列表开头的函数,(x:)。列表连接 a ++ b 被替换为函数组合 f . g —— 首先添加 g 将会添加到列表开头的内容,然后再添加 f 将会添加到列表开头的内容。


3
仅供参考,@Cirdec 提出的方法被称为 "差分列表",在函数式编程和逻辑编程中非常常见。 - Riccardo T.
1
每次出现 ++ 时,它的第一个参数必须被遍历到末尾。这比那个稍微有点微妙,毕竟定义和遍历发生在不同的时间。关键是 (++) 构建了一个严格的 显式 ++ 结构;go 在进行遍历时重新排列 隐式(“未来”)结构,向右旋转,因此最终得到一个更向右倾斜的结构(好的)。-- “用已经放置好的右侧列表构建树的左侧...”,这是一个很好的说法。 - Will Ness
感谢Cirdec的回复。我知道(++)比(:)要昂贵。感谢你为我指出这个技巧。然而,在编译了你的代码之后,我得到了与之前非常相似的性能。你的测试是在我的代码之上运行还是你有另一个不同的代码?我想知道是否还有其他东西限制了我的程序。 - Yan Zhu
1
@Yan Zhu 我使用了这个字典的前15k条目:http://docs.oracle.com/javase/tutorial/collections/interfaces/examples/dictionary.txt 来运行您的代码。这些条目按字母顺序排列,因此对于bstInsert来说,它们会导致最坏的情况性能。我使用命令ghc -O2在64位Windows GHC 7.8.3上编译了代码。我通过在mapM_ print $ traverse POST $ buildTree content行之前和之后添加System.CPUTime中的getCPUTime来计时代码。 - Cirdec
1
@Cirdec 完整的测试应该尝试增加、减少和随机输入(对于 insert 来说,最坏情况可能是 ++ 的最佳情况)。此外,在一个大小点上比较速度是没有意义的;至少需要两个或更多的大小点来看看经验增长阶如何比较。例如,OP数据显示C在N^1.1(典型的线性对数行为),而Haskell在N^1.2(暗示着N(log N)^2),差距不大。 - Will Ness

3

我生成了一个文件,其中包含小写ASCII字母表abcdefghijklmnopqrstuvwxyz中所有4字母字符串,它们之间用空格分隔; 我认为我按正确顺序获得了它,以便您的代码生成的树是完美平衡的。

我选择了这个长度,因为在我的计算机上需要3.4秒,就像您的3.5秒Haskell运行一样。 我将其命名为26_4.txt,理由显而易见。听起来你的数据集实际上接近于26 4 个单词,因此长度也是相当的。

运行时间的下限将会是:

import System.IO
main = do
    mylist <- readFile "26_4.txt"
    mapM_ putStrLn (words mylist)

这对于我的数据集来说,只需要花费0.4秒(当然要将stdout导入/dev/null)。因此,我们不能期望Haskell在这种问题上获得超过10倍的加速。不过,这个因素已经在您的问题范围内;相比之下,C++程序需要两倍于这个超级简单程序的时间。

但是,没有任何处理是一个不切实际的目标。如果我们使用一个由专业人士优化过的数据结构,他们更了解Haskell,那么我们可以获得一个更为现实的界限:

import System.IO
import qualified Data.Map.Strict as Map

balancedTree = Map.fromList . map (\k -> (k, ()))

serializeTree = map fst . Map.toList

main = do
    mylist <- readFile "26_4.txt"
    mapM_ putStrLn (serializeTree $ balancedTree $ words mylist)

这在我的电脑上大约需要1.6秒的时间。虽然不如你的 C++ 快,但我认为你的 C++ 并没有像我想的那样平衡树。
我采用了 Cirdec 的修改后,让这段代码的运行时间降至3.1秒,因此只相当于将文件的运行时间缩短了约10%。
然而,在我的电脑上,除非使用 RTSopts 给它更多的内存,否则这个文件甚至无法运行。这指向一个非常重要的优化:尾调用优化。你和 Cirdec 的代码都有一种特殊的次优方式:它们不是尾递归的,这意味着 GHC 无法将其转换为循环。我们可以通过编写显式的“待完成任务”堆栈来使它变成尾递归:
postorder :: BSTree a -> [a]
postorder t = go [] [t]
    where go xs [] = xs
          go xs (EmptyTree : ts) = go xs ts
          go xs (Node x a b : ts) = go (x : xs) (b : a : ts)

这个变化似乎使得加载时间缩短到了2.1秒。

C++和Haskell之间的另一个差异会导致一些时间浪费,那就是Haskell版本允许您惰性构建搜索树,而C++代码不允许这样做。我们可以将Haskell代码改为严格模式以解决这个问题,提供类似以下内容:

data BSTree a = EmptyTree
          | Node  !a !(BSTree a) !(BSTree a) deriving (Show)

这个修改与Cirdec的修改结合起来,使我们的时间降至1.1秒,这意味着至少在我的机器上,我们已经和你的C++代码持平。你应该在自己的机器上测试一下,看看是否也存在相同的问题。我认为任何进一步的优化都不能仅凭想象而做出来,而必须使用适当的分析工具。

记得用ghc -O2编译代码,否则尾调用和其他优化可能无法生效。


1
在我看来,你的后序遍历实现可以被视为C++迭代算法的尾递归转换。我相信类似的技巧也可以用于中序/前序遍历,虽然我还没有尝试过。我是对的吗? - Yan Zhu
1
是的,尾递归就是所有循环状态变量都成为参数的迭代算法! preorder 的代码只是将 b:a:ts 替换为 a:b:ts,我认为; 我想 inorder 将需要稍微思考一下。我们可以将内部堆栈的类型推广为 [(BSTree x,[x])],其中对偶的第二个元素保存要附加到处理完该树后的反向元素列表,使用 app (x:xs) ys = app xs (x : ys)。 然后例如,go out ((Node x left right,xs):ts) = go out ((right,x:xs):(left,[]):ts) 具有 inorder 逻辑。 - CR Drost

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接