Cassandra的删除数据的操作,被设计用于提高性能,并与Cassandra的内置属性配合使用以进行数据分配和容错。
Cassandra将删除视为插入或upsert(注:Update和Insert的组合语义)操作。
这个DELETE命令实际是在分区的数据块中写入了一条数据,这个数据是一个删
除标记,我们称之他为墓碑(tombstone)。墓碑通过写操作将数据写到一个或
者多个数据节点的SSTables中。碑的主要区别特征是它有一个内置的过期时间。在截止时间结束时(详情见下文),Cassandra在执行compaction 操作的过程中墓碑将被删除。
您还可以用生存时间值(TTL)标记Cassandra记录(行或列)。在这段时间结束之后,Cassandra将用墓碑标记记录他们,这些被标记的数据的处理方式和其他墓碑记录一样。
分布式系统中的删除操作
在多节点集群中,Cassandra可以在两个或多个节点上存储相同数据的副本。这有助于防止数据丢失,但会使删除过程复杂化。如果一个节点接收到本地存储的数据的删除,则该节点将删除指定的记录,并尝试将该删除操作(墓碑)传递到包含该记录副本的其他节点。但是如果当时有一个副本节点没有响应,它不会立即收到删除命令,所以它的数据版本仍然处于删除操作之前的版本。如果在该节点恢复正常之前而其他节点将墓碑记录删除掉了,那么Cassandra会将恢复的节点上那些记录(注:这些记录就是那些被删除的数据,因为该节点没有收到删除操作‘墓碑’)作为新数据处理,并将其传播到群集的其他节点。这种行为产生的数据被称为僵尸数据。
为了防止僵尸的再现,Cassandra给每个墓碑一个宽限期(注:相当于贷款中说的宽限期)。宽限期的目的是给予无响应的节点恢复和正常处理墓碑的时间。如果客户端在宽限期内向墓碑写入新的更新,Cassandra会覆盖之前的墓碑值。
如果客户端在宽限期内为该记录发送读取,Cassandra会忽略墓碑,如果其他节点可用话他会去其他副本获取数据。
当无响应的节点恢复时,Cassandra将通过hinted handoff操作来重演该节点在故障期没接收到的数据更新。 Cassandra在其宽限期内不会重演这个墓碑里的数据。但是,如果节点在宽限期结束之后才恢复的话,则Cassandra可能会丢失删除操作(就会导致删除的数据重现)。
墓碑的宽限期结束后,Cassandra在压实过程中会删除墓碑。
逻辑删除的宽限期由属性gc_grace_seconds设置。它的默认值是864000秒(十天)。每个表都可以有自己的属性值。
更多关于Cassandra删除
详细资料:
l 墓碑的到期时间是指数据的创建的时间加上表属性gc_grace_seconds的值。
l Cassandra还支持批量数据插入和更新。这个过程介绍了其他节点删除的数据在重演的时候重新insert的危险。Cassandra不会重演一个在宽限期内的墓碑里记录的数据。
l 在单节点集群上,可以将gc_grace_seconds设置为0(零)。
l 为了完全防止僵尸数据的再现,在节点恢复后在节点上运行nodetool repair 命令,这个命令的执行时间必须是每个表的gc_grace_seconds时间内,不能超期。
l 如果表中的所有数据在创建时都被赋予TTL,并且所有数据都被允许过期自动删除而不是手动删除,则不需要定期为该表运行nodetool repair 命令。
l 如果使用SizeTieredCompactionStrategy或DateTieredCompactionStrategy这两种压缩方式,则可以通过手动启动压缩过程来立即删除墓碑。
警告:
如果强制压缩,Cassandra可能会从所有数据中创建一个非常大的SSTable。 Cassandra不会长时间触发另一个压缩。强制压缩过程中产生的SSTable中的数据在非压实期间会变得非常陈旧。
l Cassandra允许您为整个表设置default_time_to_live属性。标有常规TTL的列和行如上所述进行处理;但是当记录超过表级TTL时,Cassandra会立即删除它,而不会进行逻辑删除或压缩。
Cassandra支持通过DROP KEYSPACE和DROP TABLE语句立即删除。