程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP 讀取大文件程序代碼

PHP 讀取大文件程序代碼

編輯:關於PHP編程

PHP 讀取大文件與讀取一般的文件是有些區別的,如果你的文件到了幾百MB或GB這樣可能普通的php讀取文件會很慢或卡死了,下面我來介紹一下PHP 讀取大文件技巧吧。

一般讀取文件我們用fopen 或者 file_get_contents ,前者可以循環讀取,後者可以一次性讀取,但都是將文件內容一次性加載來操作。如果加載的文件特別大時,如幾百M,上G時,這時性能就降下來了,那麼PHP裡有沒有對大文件的處理函數或者類呢? 答案是:有的。

PHP真的越來越“面向對象”了,一些原有的基礎的SPL方法都開始陸續地實現出class了。

從 PHP 5.1.0 開始,SPL 庫增加了 SplFileObject 與 SplFileInfo 兩個標准的文件操作類。SplFileInfo 是從 PHP 5.1.2 開始實現的。

從字面意思理解看,可以看出 SplFileObject 要比 SplFileInfo 更為強大。

不錯,SplFileInfo 僅用於獲取文件的一些屬性信息,如文件大小、文件訪問時間、文件修改時間、後綴名等值,而 SplFileObject 是繼承 SplFileInfo 這些功能的。

 代碼如下 復制代碼

 /** 返回文件從X行到Y行的內容(支持php5、php4) 
 * @param string $filename 文件名
 * @param int $startLine 開始的行數
 * @param int $endLine 結束的行數
 * @return string
 */
function getFileLines($filename, $startLine = 1, $endLine=50, $method='rb') {
    $content = array();
    $count = $endLine - $startLine; 
    // 判斷php版本(因為要用到SplFileObject,PHP>=5.1.0)
    if(version_compare(PHP_VERSION, '5.1.0', '>=')){
        $fp = new SplFileObject($filename, $method);
        $fp->seek($startLine-1);// 轉到第N行, seek方法參數從0開始計數
        for($i = 0; $i <= $count; ++$i) {
            $content[]=$fp->current();// current()獲取當前行內容
            $fp->next();// 下一行
        }
    }else{//PHP<5.1
        $fp = fopen($filename, $method);
        if(!$fp) return 'error:can not read file';
        for ($i=1;$i<$startLine;++$i) {// 跳過前$startLine行
            fgets($fp);
        }
        for($i;$i<=$endLine;++$i){
            $content[]=fgets($fp);// 讀取文件行內容
        }
        fclose($fp);
    }
    return array_filter($content); // array_filter過濾:false,null,''
}  

 Ps: 上面都沒加”讀取到末尾的判斷”:!$fp->eof() 或者 !feof($fp),加上這個判斷影響效率,自己加上測試很多很多很多行的運行時間就曉得了,而且這裡加上也完全沒必要。

從上面的函數就可以看出來使用SplFileObject比下面的fgets要快多了,特別是文件行數非常多、並且要取後面的內容的時候。fgets要兩個循環才可以,並且要循環$endLine次。

此方法花了不少功夫,測試了很多中寫法,就是想得出效率最高的方法。哪位覺得有值得改進的歡迎賜教。

使用,返回35270行-35280行的內容:

 代碼如下 復制代碼

echo '<pre>';
var_dump(getFileLines('test.php',35270,35280));
echo '</pre>'; 

再看一個實例

 代碼如下 復制代碼

 

function readBigFile($filename, $count = 20, $tag = "rn") {
$content = "";//最終內容
$current = "";//當前讀取內容寄存
$step= 1;//每次走多少字符
$tagLen = strlen($tag);
$start = 0;//起始位置
$i = 0;//計數器
$handle = fopen($filename,'r+');//讀寫模式打開文件,指針指向文件起始位置
while($i < $count && !feof($handle)) {
fseek($handle, $start, SEEK_SET);//指針設置在文件開頭
$current = fread($handle,$step);//讀取文件
$content .= $current;//組合字符串
$start += $step;//依據步長向前移動
//依據分隔符的長度截取字符串最後免得幾個字符
$substrTag = substr($content, -$tagLen);
if ($substrTag == $tag) { //判斷是否為判斷是否是換行或其他分隔符
$i++;
$content .= "<br />";
}
}
//關閉文件
fclose($handle);
//返回結果
return $content;
}
$filename = "csdn.sql";//需要讀取的文件
$tag = "n";//行分隔符 注意這裡必須用雙引號
$count = 100;//讀取行數
$data = readBigFile($filename,$count,$tag);
echo $data;

注意:通過使用PHP的fseek和fread相結合,即可做到隨意讀取文件中的某一部份數據,關於函數傳入的變量$tag的值,根據系統不一樣,傳入的值也是有區別的:Windows用”rn”,linux/unix用”n”,Mac OS用”r”。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved