BitSet的使用场景及简单示例


BitSet简介

    类实现了一个按需增长的位向量。位 set 的每个组件都有一个boolean值。用非负的整数将BitSet的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个BitSet修改另一个BitSet的内容。

    默认情况下,set 中所有位的初始值都是false。

    每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。

    除非另行说明,否则将 null 参数传递给BitSet中的任何方法都将导致NullPointerException。

    在没有外部同步的情况下,多个线程操作一个BitSet是不安全的

基本原理

    用1位来表示一个数据是否出现过,0为没有出现过,1表示出现过。使用用的时候既可根据某一个是否为0表示,此数是否出现过。

    一个1G的空间,有 8*1024*1024*1024=8.58*10^9bit,也就是可以表示85亿个不同的数

使用场景

    常见的应用是那些需要对海量数据进行一些统计工作的时候,比如日志分析、用户数统计等等

    如统计40亿个数据中没有出现的数据,将40亿个不同数据进行排序等。
    现在有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来

代码示例
package util;

import java.util.BitSet;

public class BitSetDemo {
 private BitSet used = new BitSet();

 /**
  * 求一个字符串包含的char
  *
  */
 public void contrainChars(String str) {
  for (int i = 0; i < str.length(); i++)
   used.set(str.charAt(i)); // set bit for char

  StringBuilder sb = new StringBuilder();
  sb.append("[");
  int size = used.size();
  System.out.println(size);
  for (int i = 0; i < size; i++) {
   if (used.get(i)) {
    sb.append((char) i);
   }
  }
  sb.append("]");
  System.out.println(sb.toString());
 }

 /**
  * 求素数
  * 有无限个。一个大于1的自然数,如果除了1和它本身外,不能被其他自然数整除(除0以外)的数称之为素数(质数) 否则称为合数
  */
 public void computePrime() {
  BitSet sieve = new BitSet(1024);
  int size = sieve.size();
  for (int i = 2; i < size; i++)
   sieve.set(i);
  int finalBit = (int) Math.sqrt(sieve.size());

  for (int i = 2; i < finalBit; i++)
   if (sieve.get(i))
    for (int j = 2 * i; j < size; j += i)
     sieve.clear(j);

  int counter = 0;
  for (int i = 1; i < size; i++) {
   if (sieve.get(i)) {
    System.out.printf("%5d", i);
    if (++counter % 15 == 0)
     System.out.println();
   }
  }
  System.out.println();
 }

 /**
  * 简单使用示例
  */
 public void simpleExample() {
  String names[] = { "Java", "Source", "and", "Support" };
  BitSet bits = new BitSet();
  for (int i = 0, n = names.length; i < n; i++) {
   if ((names[i].length() % 2) == 0) {
    bits.set(i);
   }
  }
 
  System.out.println(bits);
  System.out.println("Size : " + bits.size());
  System.out.println("Length: " + bits.length());
  for (int i = 0, n = names.length; i < n; i++) {
   if (!bits.get(i)) {
    System.out.println(names[i] + " is odd");
   }
  }
  BitSet bites = new BitSet();
  bites.set(0);
  bites.set(1);
  bites.set(2);
  bites.set(3);
  bites.andNot(bits);
  System.out.println(bites);
 }

 public static void main(String args[]) {
  BitSetDemo bs = new BitSetDemo();
  bs.contrainChars("How do you do? 你好呀");
  bs.computePrime();
  bs.simpleExample();
 }
}

本文永久更新链接地址

相关内容