1、创建hdfs文件
如果Apache hadoop版本是0.x 或者1.x,
bin/hadoop hdfs fs -mkdir -p /in
bin/hadoop hdfs fs -put /home/du/input in
如果Apache hadoop版本是2.x.
bin/hdfs dfs -mkdir -p /in #创建hdfs文件
创建源文件/home/du/input,并写入几个单词如 hello world
touch input
vim input
把源文件倒入hdfs
bin/hdfs dfs -put /home/du/input /in # 注意:/home/du/input是源文件所在目录不是hdfs文件, /in是hdfs文件目录
2、查看
bin/hdfs dfs -ls in/*
3、运行mapreduce,查看单词个数
# *.jar是mapreduce程序,wordcount是主类,in是hdfs输入目录,out是输出目录
bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount in out
查看单词个数
bin/hdfs dfs -cat ./out/*
4、从hdfs中复制到linux
bin/hdfs dfs -get in ../lhy
5、删除hdfs的内容,会自动删除block中的数据
bin/hdfs dfs -rmr abc
6、当前状态
bin/hdfs dfsadmin -report
相关资源:python入门教程(PDF版)