天天看点

HDFS中JAVA API的使用

  hdfs是一个分布式文件系统,既然是文件系统,就可以对其文件进行操作,比如说新建文件、删除文件、读取文件内容等操作。下面记录一下使用java api对hdfs中的文件进行操作的过程。

  对分hdfs中的文件操作主要涉及一下几个类:

  configuration类:该类的对象封转了客户端或者服务器的配置。

  filesystem类:该类的对象是一个文件系统对象,可以用该对象的一些方法来对文件进行操作。filesystem fs = filesystem.get(conf);通过filesystem的静态方法get获得该对象。

  fsdatainputstream和fsdataoutputstream:这两个类是hdfs中的输入输出流。分别通过filesystem的open方法和create方法获得。

<a></a>

具体如何对文件操作清下下面例子: