Java分批读取文件


package com.java.io.test;
import java.io.File;
import java.io.RandomAccessFile;
import java.nio.MappedByteBuffer;
import java.nio.channels.FileChannel;

public class ReadBig {
 public static String fff = "C://Documents and Settings//Administrator//桌面//工作//数据整合/tmp//loopclean_xab.txt";
 public static void main1(long s,int denominator) throws Exception {

  final int BUFFER_SIZE = 0x300000;// 缓冲区大小为3M
  File f = new File(fff);

  /**
   *
   * map(FileChannel.MapMode mode,long position, long size)
   *
   * mode - 根据是按只读、读取/写入或专用(写入时拷贝)来映射文件,分别为 FileChannel.MapMode 类中所定义的
   * READ_ONLY、READ_WRITE 或 PRIVATE 之一
   *
   * position - 文件中的位置,映射区域从此位置开始;必须为非负数
   *
   * size - 要映射的区域大小;必须为非负数且不大于 Integer.MAX_VALUE
   *
   * 所以若想读取文件后半部分内容,如例子所写;若想读取文本后1/8内容,需要这样写map(FileChannel.MapMode.READ_ONLY,
   * f.length()*7/8,f.length()/8)
   *
   * 想读取文件所有内容,需要这样写map(FileChannel.MapMode.READ_ONLY, 0,f.length())
   *
   */

  MappedByteBuffer inputBuffer = new RandomAccessFile(f, "r")
    .getChannel().map(FileChannel.MapMode.READ_ONLY,
    f.length()*s/denominator, f.length() / denominator
    // f.length()*7/8,f.length()/8       
    );

  byte[] dst = new byte[BUFFER_SIZE];// 每次读出3M的内容

  long start = System.currentTimeMillis();

  for (int offset = 0; offset < inputBuffer.capacity(); offset += BUFFER_SIZE) {

   if (inputBuffer.capacity() - offset >= BUFFER_SIZE) {

    for (int i = 0; i < BUFFER_SIZE; i++)

     dst[i] = inputBuffer.get(offset + i);

   } else {

    for (int i = 0; i < inputBuffer.capacity() - offset; i++)

     dst[i] = inputBuffer.get(offset + i);

   }

   int length = (inputBuffer.capacity() % BUFFER_SIZE == 0) ? BUFFER_SIZE
     : inputBuffer.capacity() % BUFFER_SIZE;

   System.out.println(new String(dst, 0, length));// new
   // String(dst,0,length)这样可以取出缓存保存的字符串,可以对其进行操作

  }

  long end = System.currentTimeMillis();

  System.out.println("读取文件文件内容花费:" + (end - start) + "毫秒");

 }
public static void main(String[] args) {
    try {
        //读取文件从7/8开始,到结束也就是读取文件最后1/8
        ReadBig.main1(7,8);
    } catch (Exception e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}
}

/**

  MappedByteBufferinputBuffer = new RandomAccessFile(f, "r")

    .getChannel().map(FileChannel.MapMode.READ_ONLY,

      0, f.length() / 2

     // f.length()*7/8,f.length()/8    

);

重要就是红色那段(我们可以把它当做两个参数)

我们可以编写一个方法,然后在方法内传递两个参数读取文件的多少完全由这两个参数决定

Eg:

0, f.length() / 2:                  文件前半部分

f.length() / 2, f.length() / 2 文件后半部分

..

主要看你要把文件分成几部分,你可以在每次查询时获取你想要的那部分内容,我测试过了这样可以大大提高效率;

*/

相关内容