使用SWIG将Java的Map<String, String>传递给C++方法

7

我有一个在C++中定义的方法:

std::map<std::string, std::string> validate(
                                   std::map<std::string, std::string> key, 
                                   std::map<std::string, std::string> value
                                   );

我希望在Java中调用该方法。因此,我必须编写一个包装器,使用Swig,通过它我将能够将Java Map作为STL map传递给c++方法。

请告诉我如何定义.i文件以使Swig能够正常工作。


我很好奇为什么你的输入映射既不是const也不是引用,而我假设这是一个非变异函数? - Flexo
3个回答

8
为了做到这一点,您需要告诉SWIG使用java.util.Map作为输入参数,使用%typemap(jstype)。您还需要提供一些代码来将Java映射类型转换为C++的std::map类型,SWIG会在适当的位置注入此代码。我编写了一个小例子(已编译,但未经测试)来说明这一点:
%module test

%include <std_map.i>
%include <std_string.i>

%typemap(jstype) std::map<std::string, std::string> "java.util.Map<String,String>"
%typemap(javain,pre="    MapType temp$javainput = $javaclassname.convertMap($javainput);",pgcppname="temp$javainput") std::map<std::string, std::string> "$javaclassname.getCPtr(temp$javainput)"
%typemap(javacode) std::map<std::string, std::string> %{
  static $javaclassname convertMap(java.util.Map<String,String> in) {
    $javaclassname out = new $javaclassname();
    for (java.util.Map.Entry<String, String> entry : in.entrySet()) {
      out.set(entry.getKey(), entry.getValue());      
    }
    return out;
  }    
%}

%template(MapType) std::map<std::string, std::string>;

void foo(std::map<std::string, std::string>);

pgcppname部分确保我们传递的std::map不会过早地被垃圾回收。有关其工作原理的更多详细信息,请参见SWIG文档中的此示例

支持从C++返回std::map到Java需要进行更多的工作,但是这是可能的。 java.util.Map是一个接口,因此我们需要调整std::map的默认包装以满足该接口。实际上,使用java.util.AbstractMap并从中继承更容易,尽管我最终还是重写了其中大多数函数。整个解决方案类似于我的std::vector答案的这个问题

在最终版本中有相当多的组成部分。我将在此完整呈现它,并附有注释说明:

%module test
%{
#include <cassert>
#include <iostream>
%}

%include <std_map.i>

// 1.
%rename (size_impl) std::map<std::string,std::string>::size;
%rename (isEmpty) std::map<std::string,std::string>::empty;
%include <std_string.i>

%typemap(jstype) std::map<std::string, std::string> "java.util.Map<String,String>"
%typemap(javain,pre="    MapType temp$javainput = $javaclassname.convertMap($javainput);",pgcppname="temp$javainput") std::map<std::string, std::string> "$javaclassname.getCPtr(temp$javainput)"
%typemap(javacode) std::map<std::string, std::string> %{
  static $javaclassname convertMap(Map<String,String> in) {
    // 2.
    if (in instanceof $javaclassname) {
      return ($javaclassname)in;
    }

    $javaclassname out = new $javaclassname();
    for (Map.Entry<String, String> entry : in.entrySet()) {
      out.set(entry.getKey(), entry.getValue());
    }
    return out;
  }

  // 3.
  public Set<Map.Entry<String,String>> entrySet() {
    HashSet<Map.Entry<String,String>> ret = new HashSet<Map.Entry<String,String>>(size());
    String array[] = new String[size()];
    all_keys(array);
    for (String key: array) {
      ret.add(new MapTypeEntry(key,this));
    }
    return ret;
  }

  public Collection<String> values() {
    String array[] = new String[size()];
    all_values(array);
    return new ArrayList<String>(Arrays.asList(array));
  }

  public Set<String> keySet() {
    String array[] = new String[size()];
    all_keys(array);
    return new HashSet<String>(Arrays.asList(array));
  }

  // 4.
  public String remove(Object key) {
    final String ret = get(key);
    remove((String)key);
    return ret;
  }

  public String put(String key, String value) {
    final String ret = has_key(key) ? get(key) : null;
    set(key, value);
    return ret;
  }

  // 5.
  public int size() {
    return (int)size_impl();
  }
%}

// 6.
%typemap(javaimports) std::map<std::string, std::string> "import java.util.*;";
// 7.
%typemap(javabase) std::map<std::string, std::string> "AbstractMap<String, String>";

// 8.
%{
template <typename K, typename V>
struct map_entry {
  const K key;
  map_entry(const K& key, std::map<K,V> *owner) : key(key), m(owner) {
  }
  std::map<K,V> * const m;
};
%}

// 9.
template <typename K, typename V>
struct map_entry {
  const K key;
  %extend {
    V getValue() const {
      return (*$self->m)[$self->key];
    }

    V setValue(const V& n) const {
      const V old = (*$self->m)[$self->key];
      (*$self->m)[$self->key] = n;
      return old;
    }
  }
  map_entry(const K& key, std::map<K,V> *owner);
};

// 10.
%typemap(javainterfaces) map_entry<std::string, std::string> "java.util.Map.Entry<String,String>";
// 11.
%typemap(in,numinputs=0) JNIEnv * %{
  $1 = jenv;
%}

// 12.
%extend std::map<std::string, std::string> {
  void all_values(jobjectArray values, JNIEnv *jenv) const {
    assert((jsize)$self->size() == jenv->GetArrayLength(values));
    jsize pos = 0;
    for (std::map<std::string, std::string>::const_iterator it = $self->begin();
         it != $self->end();
         ++it) {
       jenv->SetObjectArrayElement(values, pos++, jenv->NewStringUTF(it->second.c_str()));
    }
  }

  void all_keys(jobjectArray keys, JNIEnv *jenv) const {
    assert((jsize)$self->size() == jenv->GetArrayLength(keys));
    jsize pos = 0;
    for (std::map<std::string, std::string>::const_iterator it = $self->begin();
         it != $self->end();
         ++it) {
       jenv->SetObjectArrayElement(keys, pos++, jenv->NewStringUTF(it->first.c_str()));
    }
  }
}

%template(MapType) std::map<std::string, std::string>;
%template(MapTypeEntry) map_entry<std::string, std::string>;

// 13.
%inline %{
  std::map<std::string, std::string> foo(std::map<std::string, std::string> in) {
    for (std::map<std::string, std::string>::const_iterator it = in.begin();
         it != in.end(); ++it) {
      std::cout << it->first << ": " << it->second << "\n";
    }

    return std::map<std::string, std::string>(in);
  }
%}

  1. std_map.i并不是用来实现任何接口/抽象类的。我们需要重命名一些暴露出来的内容才能这样做。
  2. 由于我们让我们的类型实现了Map(通过AbstractMap),所以当这只是一个复制操作时,从MapType -> MapType转换是愚蠢的。现在,convertMap方法检查这种情况作为优化。
  3. EntrySetAbstractMap的主要要求。我们定义了(稍后) MapTypeEntry来为我们实现Map.Entry接口。这使用了一些更多的代码在%extend内部来高效地将所有键枚举为数组。请注意,如果我们在此枚举正在进行时更改映射,则不是线程安全的,会发生奇怪的坏事情,可能无法被检测到。
  4. remove是我们必须实现的方法之一,以便变得可变。由于C++映射不执行此操作,因此removeput都必须返回旧值,因此需要一些额外的Java代码来实现这一点。
  5. 甚至size()也不兼容,因为需要长/整数转换。实际上,我们应该在非常大的映射中检测精度损失,并对溢出做出明智的处理。
  6. 我厌倦了到处输入java.util.Map,所以这使得生成的SWIG代码具有所需的导入。
  7. 这设置了MapType继承自AbstractMap,以便我们代理并满足Java map的要求,而不是进行额外的复制以进行转换。
  8. C++类的定义将作为我们条目的类。这只有一个键,然后是指向拥有它的地图的指针。值不存储在Entry对象本身中,并且始终参考底层地图。这种类型也是不可变的,我们无法更改所拥有的地图或键。
  9. 这是SWIG看到的。我们提供了一个额外的get/setValue函数,它回调到它来自的地图。拥有地图的指针没有暴露出来,因为我们没有必要这样做,这实际上只是一个实现细节。
  10. java.util.Map.Entry<String,String>
  11. 这是一个技巧,可以自动填充%extend内部一些代码的jenv参数,我们需要在该代码内部进行一些JNI调用。
  12. %extend内部的这两个方法分别将所有键和值放入输出数组中。传递时,预期数组具有正确的大小。有一个assert来验证这一点,但实际上它应该是一个异常。这两个都是内部实现细节,可能应该是私有的。它们被所有需要批量访问键/值的函数使用。
  13. foo的实际实现以检查我的代码是否正确。

内存管理在这里是免费的,因为它仍然由C++代码拥有。(所以您仍然需要决定如何管理C++容器的内存,但这并不新奇)。由于返回给Java的对象只是一个围绕C++ map的包装器,容器的元素不必存在于其之后。在这里它们还是Strings,它们是特殊的,因为如果它们使用SWIG的std::shared_ptr支持作为智能指针,则一切都将按预期工作。唯一棘手的情况是指向对象的指针映射。在这种情况下,Java程序员有责任至少保持地图及其内容与任何返回的Java代理一样长。

最后,我编写了以下Java代码进行测试:

import java.util.Map;

public class run {
  public static void main(String[] argv) {
    System.loadLibrary("test");

    Map<String,String> m = new MapType();
    m.put("key1", "value1");
    System.out.println(m);
    m = test.foo(m);
    System.out.println(m);
  }
}

我编译并运行的代码是:

swig2.0 -Wall -java -c++ test.i
gcc -Wall -Wextra -shared -o libtest.so -I/usr/lib/jvm/default-java/include -I/usr/lib/jvm/default-java/include/linux test_wrap.cxx
javac run.java
LD_LIBRARY_PATH=. java run
{key1=value1}
key1: value1
{key1=value1}

能否提供一个 javaout 的示例代码,以便完整了解?我对 SWIG 还很陌生,不是很清楚。在“相反”的代码中,内存管理是如何处理的? - aberaud
@aberaud 当然,我会尝试在周末完成。我认为这里的OP方法不一定是正确的,因为它涉及大量复制到和从临时文件中。像这样的东西:https://dev59.com/4GPVa4cB1Zd3GeqP9di4#12551108,但对于映射而不是向量可能更好。 (要么就将C ++调整为适用于Java映射,要么就将其适应为适用于Java映射) - Flexo
1
@aberaud - 结果比我意识到的要复杂得多,因为唯一的方法是正确的方式,而不是我最初计划展示的快速hack。 - Flexo

1

或者我们可以完全使用Java来实现(假设您的函数声明可以在头文件MapTest.h中找到),并借助JavaCPP

import com.googlecode.javacpp.*;
import com.googlecode.javacpp.annotation.*;

@Platform(include={"<string>", "<map>", "MapTest.h"})
public class MapTest {
    static { Loader.load(); }

    @Name("std::map<std::string, std::string>")
    public static class StringStringMap extends Pointer {
        static { Loader.load(); }
        public StringStringMap() { allocate(); }
        public StringStringMap(Pointer p) { super(p); }
        private native void allocate();

        @Index @ByRef public native String get(String x);
        public native StringStringMap put(String x, String y);
    }

    public static native @ByVal StringStringMap validate(
            @ByVal StringStringMap key, @ByVal StringStringMap value);

    public static void main(String[] args) {
        StringStringMap m = new StringStringMap();
        m.put("foo", "bar");
        System.out.println(m.get("foo"));
    }
}

我觉得这比SWIG更容易、更清晰...


0

关于@Flexo的建议,快速评论一下:它是有效的,但是SWIG需要在C++类型和Java类型之间使用&s进行类型映射。我不得不在他们的代码中添加这些内容到前两个typemaps中:

%typemap(jstype) std::map<std::string, std::string> & "java.util.Map<String,String>"
%typemap(javain,pre="    MapType temp$javainput = $javaclassname.convertMap($javainput);",pgcppname="temp$javainput") & std::map<std::string, std::string> "$javaclassname.getCPtr(temp$javainput)"

希望这篇文章能够帮助到那些和我一样在尝试让这个工作正常运行时感到困惑的人。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接