今天在做一個簡單的采集程序需要下載對方網站內容,然後把內容中的圖片再保存在本地服務器上,下面我來給各位同介紹我的具體操作方法,下載圖片主要用到了file_get_contents 函數,具體方法如下。
這裡我們使用php的正則表達式來實現:
上面就將遠程圖片給匹配出來了,我們需要將其保持到本地。這裡需要注意兩點:
1.圖片保存路徑(圖片存儲目錄)
2.實際訪問圖片地址
下面是完整實例:(你可以保存到本地服務器修改相應地方進行測試)
代碼如下 復制代碼<!DOCTYPE HTML>
<html lang="en-US">
<head>
<meta charset="UTF-8">
<title>php保存遠程圖片到本地,php正則匹配文章中的圖片地址</title>
</head>
<body>
<?php
//保存文章中遠程圖片到本地
//作者:yanue;
// 文件保存目錄路徑(請更換為你自己的路徑, 你可以echo一下)
$save_path = $_SERVER ['DOCUMENT_ROOT'] . 'swfupload/attached/';
// 文件保存目錄URL
$save_url = '/swfupload/attached/';
$save_path = realpath ( $save_path ) . '/';
// 圖片存儲目錄
$imgPath = $save_path . date ( "Ymd" );
$imgUrl = $save_url . date ( "Ymd" );
// 創建文件夾
if (! is_dir ( $imgPath )) {
@mkdir ( $imgPath, 0777 );
}
$content = '這裡是文章內容,這裡插入一張圖片測試 <img src="http://www.bkjia.com/wp-content/uploads/2012/03/48ef3a3e1f30e9246abc40834c086e061c95f7521.jpg">';
$content = stripslashes ( $content );
$img_array = array ();
// 匹配所有遠程圖片
preg_match_all ( "/(src|SRC)=["|'| ]{0,}(http://(.*).(gif|jpg|jpeg|bmp|png))/isU", $content, $img_array );
// 匹配出來的不重復圖片
$img_array = array_unique ( $img_array [2] );
print_r($img_array);
// 時間無限制
set_time_limit ( 0 );
foreach ( $img_array as $key => $value ) {
$value = trim ( $value );
// 讀取遠程圖片
$get_file = @file_get_contents ( $value );
// 保存到本地圖片名稱
$imgname = date ( "YmdHis" ) . '_' . rand ( 10000, 99999 ) . "." . substr ( $value, - 3, 3 );
// 保存到本地的實際文件地址(包含路徑和名稱)
$fileName = $imgPath . '/' . $imgname;
// 實際訪問的地址
$fileurl = $imgUrl . "/" . $imgname;
// 文件寫入
if ($get_file) {
$fp = @fopen ( $fileName, "w" );
@fwrite ( $fp, $get_file );
@fclose ( $fp );
}
// 替換原來的圖片地址
$content = ereg_replace ( $value, $fileurl, $content );
}
echo $content;
?>
</body>
</html>