程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MYSQL入門知識 >> Hadoop源代碼分析

Hadoop源代碼分析

編輯：MYSQL入門知識

一個典型的HDFS系統包括一個NameNode和多個DataNode。NameNode維護名字空間；而DataNode存儲數據塊。

DataNode負責存儲數據，一個數據塊在多個DataNode中有備份；而一個DataNode對於一個塊最多只包含一個備份。所以我們可以簡單地認為DataNode上存了數據塊ID和數據塊內容，以及他們的映射關系。

一個HDFS集群可能包含上千DataNode節點，這些DataNode定時和NameNode通信，接受NameNode的指令。為了減輕NameNode的負擔，NameNode上並不永久保存那個DataNode上有那些數據塊的信息，而是通過DataNode啟動時的上報，來更新NameNode上的映射表。

DataNode和NameNode建立連接以後，就會不斷地和NameNode保持心跳。心跳的返回其還也包含了NameNode對DataNode的一些命令，如刪除數據庫或者是把數據塊復制到另一個DataNode。應該注意的是：NameNode不會發起到DataNode的請求，在這個通信過程中，它們是嚴格的客戶端/服務器架構。

DataNode當然也作為服務器接受來自客戶端的訪問，處理數據塊讀/寫請求。DataNode之間還會相互通信，執行數據塊復制任務，同時，在客戶端做寫操作的時候，DataNode需要相互配合，保證寫操作的一致性。

下面我們就來具體分析一下DataNode的實現。DataNode的實現包括兩部分，一部分是對本地數據塊的管理，另一部分，就是和其他的實體打交道。我們先來看本地數據塊管理部分。

安裝Hadoop的時候，我們會指定對應的數據塊存放目錄，當我們檢查數據塊存放目錄目錄時，我們回發現下面有個叫dfs的目錄，所有的數據就存放在dfs/data裡面。

其中有兩個文件，storage裡存的東西是一些出錯信息，貌似是版本不對…雲雲。in_use.lock是一個空文件，它的作用是如果需要對整個系統做排斥操作，應用應該獲取它上面的一個鎖。

接下來是3個目錄，current存的是當前有效的數據塊，detach存的是快照（snapshot，目前沒有實現），tmp保存的是一些操作需要的臨時數據塊。

但我們進入current目錄以後，就會發現有一系列的數據塊文件和數據塊元數據文件。同時還有一些子目錄，它們的名字是subdir0到subdir63，子目錄下也有數據塊文件和數據塊元數據。這是因為HDFS限定了每個目錄存放數據塊文件的數量，多了以後會創建子目錄來保存。

數據塊文件顯然保存了HDFS中的數據，數據塊最大可以到64M。每個數據塊文件都會有對應的數據塊元數據文件。裡面存放的是數據塊的校驗信息。下面是數據塊文件名和它的元數據文件名的例子：

blk_3148782637964391313
blk_3148782637964391313_242812.meta

上面的例子中，3148782637964391313是數據塊的ID號，242812是數據塊的版本號，用於一致性檢查。

在current目錄下還有下面幾個文件：

VERSION，保存了一些文件系統的元信息。

dncp_block_verification.log.curr和dncp_block_verification.log.prev，它記錄了一些DataNode對文件系定時統做一致性檢查需要的信息。

上一頁:MySQL下Limit使用及性能分析
下一頁:MySQL 水平分區方案Spock Proxy

MYSQL入門知識

mysql使用二進制日志恢復數據

一、恢復到某個二進制文件1.開啟二進制日志在mysqld的配

mysql中文亂碼的解決辦法

在使用mysql的過程或多或少都會碰

如何輕松構建Mysql高可用集群系統

一、 MySQL復制的實現原理&nb

MySQL備份原理詳解

備份是數據安全的最後

MySQL數據庫的基本數據類型

整數類型數值型數據類型主要用來存儲數字，包含的類型有：TIN

如何三招搞掛MySQL？

本文將介紹三種搞掛MySQL的方式，

相關文章

閱讀排行榜

MySQL table is marked as crashed and should be repaired 的解 MySQL使用正則表達式方法說說MySQL中的事務 MySQL 忘記密碼解決辦法 MySQL的事務和隔離級別概述 Mac下MySQL的安裝與配置 mysql日期類型默認值0000-00-00容錯處理 MySQL PHP語法 MySQL數據庫操作命令行 MySQL 入門 mysql下常用的基本命令合集

熱門圖文

對oracle controlfile進行轉儲在MySQLDump中使用-w語句進行備份的方法，mysqldump-w 常見Oracle數據庫相關問題總結及解決辦法（一） SQL2005行觸發器 SQL2005日志收縮方法安裝SQL Server2005開發版時出現性能計數器要求安裝錯誤的解決辦法 Oracle管理系統概述：特點，子系統與模塊 IBM DB2數據庫哪些事項你需注意？

欄目導航

MYSQL入門知識 SQL基礎知識關於MYSQL數據庫 Mariadb數據庫 MySQL綜合教程

Copyright © 程式師世界 All Rights Reserved