文章导读

C++如何在文件I/O中实现文件分块读取

作者 2025年9月5日 10

分块读取可避免大文件内存溢出，使用std::ifstream的read()方法配合缓冲区循环读取，每次通过gcount()获取实际读取字节数并处理数据，直至文件结束，推荐以binary模式打开文件，合理选择块大小（如4KB、64KB）以平衡内存与性能，同时重用缓冲区、及时关闭文件，确保资源安全。

在处理大文件时，一次性读取整个文件可能导致内存不足。C++中可以通过分块读取的方式，每次只读取文件的一部分，从而高效处理大文件。以下是实现文件分块读取的基本方法。

使用 std::ifstream 进行分块读取

利用 std::ifstream 的 read() 方法，可以指定每次读取的字节数，实现分块操作。关键是设置一个缓冲区，并循环读取直到文件结束。

基本步骤如下：

打开文件，检查是否成功
定义缓冲区大小（如 4096 字节）
循环调用 read()，每次读取固定大小的数据
使用 gcount() 获取实际读取字节数
处理每一块数据
直到文件结束（EOF 或 fail）

示例代码：

 #include <iostream> #include <fstream> #include <vector>  void readInChunks(const std::string& filename, size_t chunkSize = 4096) {     std::ifstream file(filename, std::ios::binary);     if (!file) {         std::cerr << "无法打开文件: " << filename << std::endl;         return;     }      std::vector<char> buffer(chunkSize);      while (file) {         file.read(buffer.data(), chunkSize);         std::streamsize bytesRead = file.gcount();          if (bytesRead > 0) {             // 处理当前块，例如打印大小或写入其他文件             std::cout << "读取了 " << bytesRead << " 字节" << std::endl;             // 可在此处添加数据处理逻辑         }     }      file.close(); }