Memtable理解

Question

Memtable理解

cassandranosql

6

我有关于Cassandra Memtable的问题。感谢您的帮助。

Memtable的相关信息:

1) 存放在RAM中;

2) 每个ColumnFamily结构都有一个memtable;

3) 一个ColumnFamily可以存在多个memtable;

问题:

1) 什么时候会为ColumnFamily创建额外的memtable？需要满足什么条件？我认为在创建额外的commit log文件后会创建额外的memtable。这是正确的吗？

2) 达到commit log大小阈值后会发生什么？我认为会开始将memtable放入队列；在队列填满后，将开始将memtable刷新到sstable，然后删除旧的commit log（在hdd上）和相应的memtables（在ram中）。在这种情况下，部分memtable内存将始终为空，并且commit log始终会被填满90-100%吗？

3) 当达到memtable大小阈值时会发生什么？与前面的情况类似，会开始刷新到sstable吗？某些部分的commit log也将始终为空，并且memtable内存将填满90-100%吗？

4) 关于memtable_allocation_type：在官方资源中 - "offheap_buffers将单元格名称和值移动到DirectBuffer对象中。这对读取的影响最小-值仍然是“活动”的Java缓冲区-但仅在存储大字符串或blob时才会显着减少堆内存."。DirectBuffer是什么意思？它放置在Java堆中吗？您能提供一些关于此的信息网站链接吗？

非常感谢！

- bissquit

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- G Quintana · Accepted Answer

对于给定的列族，通常只有一个内存中的Memtable，除了特殊情况如修复过程或待处理的刷新。
当提交日志已满时，会触发刷新：Memtable被写入磁盘作为SSTable，然后清除Memtable并回收提交日志。新的周期从空提交日志/Memtable开始。
当Memtable超过给定大小时，会像上面一样触发刷新。
通常默认情况下，Memtable保存在Java堆内存中。自Cassandra 2.1以来，Memtable可以存储在Java堆之外，以减轻GC压力。但是这个设置是一些特殊情况的优化。Cassandra可以使用JNA将数据存储在Java堆之外，这意味着这些数据不会被JVM知道，因此不适合进行垃圾回收。但是Java对象必须进行转换才能在其中存储/检索。这就是为什么这些Java对象不被视为“活着的”。

我建议你观看https://academy.datastax.com/courses/learning-cassandra-write-path