MPI接收和发送Eigen压缩稀疏矩阵

3
什么是使用Eigen库定义的稀疏矩阵发送和接收的最佳(最快)方法?
目前,我正在创建一个值、行和列向量(从预定义的稀疏矩阵中),只使用非零元素并逐个发送/接收这些3个向量。这些向量是简单的std::vector。
if (0 == myrank) {
    Sz.insert(0,0) = 0.5;       Sz.insert(1,1) = -0.5;

    //------ preparing to send ----------
    shape[0] = Sz.rows();
    shape[1] = Sz.cols();
    int size=Sz.nonZeros();
    val.resize(size); inner.resize(size); outer.resize(size);
    cout << "val-size = "<< val.size() << endl;
    int counter=0;
    for (int k=0; k<Sz.outerSize(); ++k) {
        for (CrsMatrixType::InnerIterator it(Sz,k); it; ++it)  {
            val[counter]=it.value();
            inner[counter]=it.col();
            outer[counter]=it.row();
            counter++;
        }
    }
    assert(counter==size);
    MPI_Send(&shape[0],2,MPI_INT,1, 100, MPI_COMM_WORLD);
    MPI_Send(&size,1,MPI_INT,1, 101, MPI_COMM_WORLD);
    MPI_Send(&val[0],size,MPI_DOUBLE,1, 102, MPI_COMM_WORLD);
    MPI_Send(&inner[0],size,MPI_INT,1, 103, MPI_COMM_WORLD);
    MPI_Send(&outer[0],size,MPI_INT,1, 104, MPI_COMM_WORLD);


}

稍后,我使用以下方式接收它们:

if (1 == myrank) {

    //------ preparing to receive ----------
    shape.resize(2);
    int size;
    MPI_Recv(&shape[0],2,MPI_INT,0, 100, MPI_COMM_WORLD, &status);
    MPI_Recv(&size,1,MPI_INT,0, 101, MPI_COMM_WORLD, &status);

    val.resize(size); inner.resize(size); outer.resize(size);
    MPI_Recv(&val[0],size,MPI_DOUBLE,0, 102, MPI_COMM_WORLD, &status);
    MPI_Recv(&inner[0],size,MPI_INT,0, 103, MPI_COMM_WORLD, &status);
    MPI_Recv(&outer[0],size,MPI_INT,0, 104, MPI_COMM_WORLD, &status);


    Sz.resize(shape[0],shape[1]);
    Sz.reserve(size); // allocate room for nonzero elements only.
    for (int k=0; k<Sz.outerSize(); ++k) {
        Sz.coeffRef(inner[k],outer[k]) = val[k];
    }

    cout << "my RANK " << myrank << endl;
    cout << Sz << endl;
}

将它们添加到秩为1的稀疏矩阵中。是否有更好的方法?谢谢。

首先,您应该一次性发送“形状”和“大小”。然后,您可以创建一个包含两个MPI_INT和一个MPI_DOUBLE的结构体来描述矩阵的元素,分配并填充它,为其构建一个派生数据类型,并一次性发送“大小”个元素。 - Gilles Gouaillardet
谢谢!:D 我采用了下面@chtz的评论。它避免了制作临时变量,并直接在秩1中填充矩阵。 - qubit10
1个回答

3

我一般建议使用压缩形式传输稀疏矩阵,不需要将值复制到临时 std::vector 中。

void sendSparseEigen(const Ref<const SparseMatrix<double>,StandardCompressedFormat>& mat) {
    int rows=mat.rows, cols=mat.cols, nnz=mat.nonZeros();
    assert(rows==mat.innerSize() && cols==mat.outerSize());
    assert(mat.outerIndexPtr()[cols]==nnz);
    int shape[3] = {rows, cols, nnz};
    MPI_Send(shape              ,3   ,MPI_INT,   1, 100, MPI_COMM_WORLD);
    MPI_Send(mat.valuePtr()     ,nnz ,MPI_DOUBLE,1, 101, MPI_COMM_WORLD);
    MPI_Send(mat.innerIndexPtr(),nnz ,MPI_INT,   1, 102, MPI_COMM_WORLD);
    MPI_Send(mat.outerIndexPtr(),cols,MPI_INT,   1, 103, MPI_COMM_WORLD);
}

void receiveSparseEigen(SparseMatrix<double> &out){
    int shape[3];
    MPI_Recv(shape,3,MPI_INT,0, 100, MPI_COMM_WORLD, &status);
    int rows=shape[0], cols=shape[1], nnz=shape[2];
    out.resize(rows, cols);
    out.reserve(nnz);
    MPI_Recv(out.valuePtr(),  nnz, MPI_DOUBLE,0, 101, MPI_COMM_WORLD, &status);
    MPI_Recv(out.innerIndexPtr(),nnz, MPI_INT,0, 102, MPI_COMM_WORLD, &status);
    MPI_Recv(out.outerIndexPtr(),cols,MPI_INT,0, 103, MPI_COMM_WORLD, &status);
    out.outerIndexPtr()[cols] = nnz;
}

免责声明:我不是MPI专家,我从你的示例中复制了所有与MPI相关的代码--显然,你应该以某种方式处理MPI产生的所有可能错误。上面的代码未经测试。

运行得非常好,虽然我没有明确测试速度/内存。很明显,你的解决方案避免了创建临时变量,节省了内存和冗余操作。谢谢!还有一件事,在将来,如果有其他人使用这个解决方案,请确保在传递之前压缩稀疏矩阵。 mat.makeCompressed(); - qubit10
你可以将Ref中的StandardCompressedFormat标志删除,然后只需 assert(mat.isCompressed ());或传递一个非const的SparseMatrix&并在第一个函数内调用makeCompressed() - chtz

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接