hadoop 小结

xiaoxiao2026-02-15 19

1、创建hdfs文件

如果Apache hadoop版本是0.x 或者1.x,

bin/hadoop hdfs fs -mkdir -p /in bin/hadoop hdfs fs -put /home/du/input in 如果Apache hadoop版本是2.x.

bin/hdfs dfs -mkdir -p /in #创建hdfs文件

创建源文件/home/du/input，并写入几个单词如 hello world

touch input

vim input

把源文件倒入hdfs

bin/hdfs dfs -put /home/du/input /in # 注意：/home/du/input是源文件所在目录不是hdfs文件, /in是hdfs文件目录

2、查看

bin/hdfs dfs -ls in/*

3、运行mapreduce，查看单词个数

# *.jar是mapreduce程序，wordcount是主类，in是hdfs输入目录，out是输出目录 bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount in out 查看单词个数 bin/hdfs dfs -cat ./out/*

4、从hdfs中复制到linux

bin/hdfs dfs -get in ../lhy

5、删除hdfs的内容，会自动删除block中的数据

bin/hdfs dfs -rmr abc

6、当前状态

bin/hdfs dfsadmin -report 相关资源：python入门教程(PDF版)

最新回复(0)