hbase中的deleteColumn,hbasedeleteColumn


Delete类的接口有两个方法:deleteColumns和deleteColumn,它们的区别从method注释里可以看到: Html代码

  • deleteColumns: Delete all versions of the specified column with a timestamp less than or equal to the specified timestamp.      
  • deleteColumn: Delete the latest version of the specified column.  
   

    
实现上,前者只是传给server一个时间标签,表示这行数据的最后删除版本,因此仅相当于一个普通的put 
    但是后者必须定位到这行version,因此需要先get到这行数据,再做处理 

    实际使用中有个陷阱,细心的人会发现如果对某行数据的一个version进行了删除,在compact之前即使再将同一个version的数据写进去,也是读不到的。原因是hbase定位数据是依靠rowkey/timestamp/family/qulifier。假如这四者都一样,那么多次put/delete是无法知道先后顺序的。因此取哪个值取决于KeyValue.Type的值,Delete是在Put之前。所以扫描到Delete就不会再去读Put了。 
    要想恢复对这个timestamp标签的读写,必须做一次compact,最好是major_compact,确保这一行数据己经从物理上删除了,此时就可以再读取值了。

  更多精彩内容请关注:http://bbs.superwu.cn   关注超人学院微信二维码:

相关内容