什么是最适合Java的HBase客户端API？

Question

什么是最适合Java的HBase客户端API？

javaapihadoophbase

5

我正在进行一个使用hbase的项目，这个项目是基于java的。我需要知道什么是最好的java hbase客户端API。

- Ali Raza

我假设你在询问是否应该直接编写Java代码还是通过REST访问HBase。答案取决于您的应用程序需求。 - kdgregory

我想问如何使用Java连接HBase。因此必须有一个API。我想下载它，但到目前为止我还没有成功。 - Ali Raza

1

HBase官网提供了完整的下载和安装HBase的指南。请从这里开始：http://hbase.apache.org/book/book.html - kdgregory

我找到了。谢谢你的帮助。 - Ali Raza

5个回答

6

Kundera是一个值得推荐的客户端，作者为此付出了很多努力。

- xinqiyang

2

Kundera是一个对象-数据存储映射工具，可与Hbase、Cassandra和MongoDB一起使用。

一些显著的特点包括：

JPA 2.0兼容。

使用lucene进行列/列族索引。

支持实体关系和JPA查询。

跨数据存储持久化。

它托管在这里： https://github.com/impetus-opensource/Kundera

- Amresh

你是否将列/列族的Lucene索引存储在HDFS上？ - debarshi

1

HBaseExecutor是HBase Java客户端的简单包装器。与原生的HBase Java驱动程序相比，HBaseExecutor具有以下功能：

提供了一致/集成/简洁的API，用于使用实体/字符串进行操作(CRUD)。
对字节参数/操作进行封装，以提高可操作性。

这里是一个使用HBaseExecutor的简单示例

Account account = createAccount();

// Insert is supported by Model/entity
hbaseExecutor.put("account", toAnyPut(account));

// Get is supported by Model/entity
Account dbAccount = hbaseExecutor.get(Account.class, "account", AnyGet.valueOf(account.getId()));
N.println(dbAccount);

// Delete the inserted account
hbaseExecutor.delete("account", AnyDelete.valueOf(account.getId()));

与使用HBase Java客户端的示例相比：

Account account = createAccount();

// Insert an account into HBase store
Put put = new Put(Bytes.toBytes(account.getId()));
put.addColumn(Bytes.toBytes("name"), Bytes.toBytes("firstName"), Bytes.toBytes(account.getName().firstName().value()));
put.addColumn(Bytes.toBytes("name"), Bytes.toBytes("lastName"), Bytes.toBytes(account.getName().lastName().value()));
put.addColumn(Bytes.toBytes("contact"), Bytes.toBytes("city"), Bytes.toBytes(account.getContact().city().value()));
put.addColumn(Bytes.toBytes("contact"), Bytes.toBytes("state"), Bytes.toBytes(account.getContact().state().value()));
put.addColumn(Bytes.toBytes("createTime"), Bytes.toBytes(""), Bytes.toBytes(N.stringOf(account.createTime().value())));

hbaseExecutor.put("account", put);

// Get the inserted account from HBase store
Result result = hbaseExecutor.get("account", new Get(Bytes.toBytes(account.getId())));
CellScanner cellScanner = result.cellScanner();
while (cellScanner.advance()) {
    final Cell cell = cellScanner.current();
    N.println(Bytes.toString(cell.getFamilyArray(), cell.getFamilyOffset(), cell.getFamilyLength()));
    N.println(Bytes.toString(cell.getQualifierArray(), cell.getQualifierOffset(), cell.getQualifierLength()));
    N.println(Bytes.toString(cell.getValueArray(), cell.getValueOffset(), cell.getValueLength()));
    // ... a lot of work to do
}

// Delete the inserted account from HBase store.
hbaseExecutor.delete("account", new Delete(Bytes.toBytes(account.getId())));

(声明：我是HBaseExecutor的开发人员)

- user_3380739

1

playOrm是另一个Java工具，您可以在实体上注释并立即运行。它故意不符合JPA标准，因为nosql与传统关系型数据库有很大的不同。它具有像findAll()这样的方法，因为您希望在nosql中并行读取。

playOrm确实添加了JQL，但对于nosql来说有所不同...例如，您可以将万亿行分成10亿个分区，并在任何分区中进行JQL查询并与其他表连接。如果您来自JPA世界，它会使向noSql的过渡更加容易。

- Dean Hiller

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- frail · Accepted Answer

HBase在其核心库中拥有自己的Java客户端，几乎涵盖了所有功能(包括连接)。如果你需要一个异步客户端，可以尝试从stumbleupon获取asyncbase，它是一个可靠的客户端。但它的过滤器支持有限(虽然它有基本的过滤器，而且它们效果很棒)。如果你正在使用Java，我不建议通过REST使用。