hadoop 小结

    xiaoxiao2026-02-15  14

    1、创建hdfs文件

    如果Apache hadoop版本是0.x 或者1.x,

      bin/hadoop hdfs fs -mkdir -p /in   bin/hadoop hdfs fs  -put /home/du/input   in 如果Apache hadoop版本是2.x.

      bin/hdfs  dfs  -mkdir -p /in  #创建hdfs文件

    创建源文件/home/du/input,并写入几个单词如 hello world

    touch input

    vim input

    把源文件倒入hdfs

    bin/hdfs  dfs   -put /home/du/input   /in #   注意:/home/du/input是源文件所在目录不是hdfs文件, /in是hdfs文件目录

    2、查看

    bin/hdfs dfs -ls in/*

    3、运行mapreduce,查看单词个数

    # *.jar是mapreduce程序,wordcount是主类,in是hdfs输入目录,out是输出目录 bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount in out   查看单词个数  bin/hdfs dfs -cat ./out/*

    4、从hdfs中复制到linux

    bin/hdfs dfs -get in ../lhy

    5、删除hdfs的内容,会自动删除block中的数据

    bin/hdfs dfs -rmr abc

    6、当前状态

    bin/hdfs dfsadmin -report 相关资源:python入门教程(PDF版)
    最新回复(0)