假設Hadoop的安裝目錄HADOOP_HOME為/home/admin/hadoop。
啟動與關閉
啟動Hadoop
1.進入HADOOP_HOME目錄。
2.執行sh bin/start-all.sh
關閉Hadoop
1.進入HADOOP_HOME目錄。
2.執行sh bin/stop-all.sh
文件操作
Hadoop使用的是HDFS,能夠實現的功能和我們使用的磁盤系統類似。並且支持通配符,如*。
查看文件列表
查看hdfs中/user/admin/aaron目錄下的文件。
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs -ls /user/admin/aaron
這樣,我們就找到了hdfs中/user/admin/aaron目錄下的文件了。
我們也可以列出hdfs中/user/admin/aaron目錄下的所有文件(包括子目錄下的文件)。
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs -lsr /user/admin/aaron
創建文件目錄
查看hdfs中/user/admin/aaron目錄下再新建一個叫做newDir的新目錄。
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs -mkdir /user/admin/aaron/newDir
刪除文件
刪除hdfs中/user/admin/aaron目錄下一個名叫needDelete的文件
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs -rm /user/admin/aaron/needDelete
刪除hdfs中/user/admin/aaron目錄以及該目錄下的所有文件
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs -rmr /user/admin/aaron
上傳文件
上傳一個本機/home/admin/newFile的文件到hdfs中/user/admin/aaron目錄下
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs –put /home/admin/newFile /user/admin/aaron/
下載文件
下載hdfs中/user/admin/aaron目錄下的newFile文件到本機/home/admin/newFile中
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs –get /user/admin/aaron/newFile /home/admin/newFile
查看文件
我們可以直接在hdfs中直接查看文件,功能與類是cat類似
查看hdfs中/user/admin/aaron目錄下的newFile文件
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop fs –cat /home/admin/newFile
MapReduce Job操作
提交MapReduce Job
原則上說,Hadoop所有的MapReduce Job都是一個jar包。
運行一個/home/admin/hadoop/job.jar的MapReduce Job
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop jar /home/admin/hadoop/job.jar [jobMainClass] [jobArgs]
殺死某個正在運行的Job
假設Job_Id為:job_201005310937_0053
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop job -kill job_201005310937_0053
更多Hadoop的命令
上面介紹的這些Hadoop的操作命令是我們最常用的。如果你希望了解更多,可以按照如下的方式獲取命令的說明信息。
1.進入HADOOP_HOME目錄。
2.執行sh bin/hadoop
我們可以看到更多命令的說明信息:
復制代碼 代碼如下:
Usage: hadoop [--config confdir] COMMAND
where COMMAND is one of:
namenode -format format the DFS filesystem
secondarynamenode run the DFS secondary namenode
namenode run the DFS namenode
datanode run a DFS datanode
dfsadmin run a DFS admin client
fsck run a DFS filesystem checking utility
fs run a generic filesystem user client
balancer run a cluster balancing utility
jobtracker run the MapReduce job Tracker node
pipes run a Pipes job
tasktracker run a MapReduce task Tracker node
job manipulate MapReduce jobs
queue get information regarding JobQueues
version print the version
jar <jar> run a jar file
distcp <srcurl> <desturl> copy file or directories recursively
archive -archiveName NAME <src>* <dest> create a hadoop archive
daemonlog get/set the log level for each daemon
or
CLASSNAME run the class named CLASSNAME
Most commands print help when invoked w/o parameters.