Hadoop 文件系统 API 定义

这是 Hadoop 文件系统 API 的规范,它将文件系统的内容建模为一组路径,这些路径可以是目录、符号链接或文件。

令人惊讶的是,在这个领域几乎没有先例。有多个 Unix 文件系统规范将文件系统建模为 inode 树,但没有公开定义“Unix 文件系统作为数据存储访问的概念模型”的概念。

本规范尝试这样做;定义 Hadoop 文件系统模型和 API,以便多个文件系统可以实现 API,并向应用程序展示其数据的一致模型。它不会尝试正式指定文件系统的任何并发行为,除了记录 HDFS 表现出的行为,因为 Hadoop 客户端应用程序通常期望这些行为。

  1. 简介
  2. 符号
  3. 模型
  4. FileSystem 类
  5. OutputStream、Syncable 和 StreamCapabilities
  6. Abortable
  7. FSDataInputStream 类
  8. PathCapabilities 接口
  9. FSDataOutputStreamBuilder 类
  10. 使用文件系统规范进行测试
  11. 扩展规范及其测试
  12. 使用多个部分上传文件
  13. IOStatistics
  14. openFile()
  15. 安全模式
  16. LeaseRecoverable