本文用于複習《Hadoop權威指南》第三章後半部分内容

代碼來自于書中，僅有少部分修改，主要是為了回憶起來友善

在文章eclipse實作word count中就有關于如何在eclipse中開發hadoop項目，連結如下Eclipse實作Hadoop WordCount

利用FileSystem的listStatus方法來讀取檔案和目錄的中繼資料，再用stat2path方法講status數組轉為path數組。

這裡用一種與之前不同的路徑設定方法（雖然其實是與書上一樣的），在run configuration中添加參數

hdfs://localhost:9000/ 和hdfs://localhost:9000/user/wyh/

public class ListStatus {

  public static void main(String[] args) throws Exception {
    String uri = args[];
    Configuration conf = new Configuration();
    FileSystem fs = FileSystem.get(URI.create(uri), conf);

    Path[] paths = new Path[args.length];
    for (int i = ; i < paths.length; i++) {
      paths[i] = new Path(args[i]);
    }

    FileStatus[] status = fs.listStatus(paths);
    Path[] listedPaths = FileUtil.stat2Paths(status);
    for (Path p : listedPaths) {
      System.out.println(p);
    }
  }
}

書上給出了一個RegexExcludePathFilter類實作了PathFilter接口，用于排除一個正規表達式路徑，也覺得挺有趣的，但是沒有給具體實作排除的代碼，在這裡寫了一個TestFilter類來實作一下。

首先把2016.12.01.txt和2016.12.02.txt放到分布式系統中，可以看到在去掉RegexExcludePathFilter的時候會兩個檔案都顯示，直接運作則會顯示路徑+2016.12.02.txt。

public class TestFilter {
      public static void main(String[] args) throws Exception {
            String uri = "hdfs://localhost:9000/";
            Configuration conf = new Configuration();
            FileSystem fs = FileSystem.get(URI.create(uri), conf);

            FileStatus[] status =fs.globStatus(new Path("hdfs://localhost:9000/user/wyh/2016.*.*")
            ,new RegexExcludePathFilter("hdfs://localhost:9000/user/wyh/2016.12.01.*"));
            // ,new RegexExcludePathFilter("hdfs://localhost:9000/user/wyh/2016.12.01.*")
            Path[] listedPaths = FileUtil.stat2Paths(status);
            for (Path p : listedPaths) {
              System.out.println(p);
            }
      }
}

Eclipse實作DFS部分操作複習（2）本文用于複習《Hadoop權威指南》第三章後半部分内容

本文用于複習《Hadoop權威指南》第三章後半部分内容

代碼來自于書中，僅有少部分修改，主要是為了回憶起來友善

在文章eclipse實作word count中就有關于如何在eclipse中開發hadoop項目，連結如下Eclipse實作Hadoop WordCount

繼續閱讀

Hadoop之運作wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

Eclipse運作WordCount（詳細版）相關連接配接Eclipse運作WordCount

在DOS下運作不了ipconfig指令

GNU科學函數庫[參考手冊][v0.1 Build 090201 Beta][GNU Scientific Library]

與專家面對面：Android開發入門問與答

基于XOR的加密程式

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

Hibernate使用Hibernate的“3個準備，7個步驟”Hibernate API簡介操作實體對象對象識别

java中，字元串中的函數的替換方法

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理

用mybatis的generator插件在項目中自動生成dao及entity