有時候經常會用到一些在線手冊,比如國內或國外的,有些是訪問速度慢,有些是作者直接吧網站關閉了,有些是服務器總是宕機,所以還是全盤克隆到自己服務器比較爽。
庫特點:
給定一初始連接,初始鏈接以下的層級所有文件會拷貝到本地。
多次克隆可以配置是否覆蓋。
可以配置是否下載圖片。
所有鏈接替換為相對鏈接,所以可以隨便rewrite。
絕對不會出現文件覆蓋等問題。
最NB的特點是,沒有比這更NB的庫了。
SVN:http://svn.phpdr.net/repos/ares/php/library/trunk/lib/CurlMulti/MyCurl/Clone.php
幫客之家下載:http://xiazai.jb51.net/201502/other/CurlMulti.rar
克隆結果展示(這個克隆操作幾秒鐘就完成了):
克隆源網站:http://www.laruence.com/manual/
克隆結果:http://manual.phpdr.net/yaf/
Demo代碼:
復制代碼 代碼如下:
<?php
class Controller_Spider extends MyYaf_Controller_Base{
function init(){
parent::init();
if(!$this->getRequest()->isCli()){
Ares_Http::error403();
}
include 'CurlMulti/CurlMulti.php';
include 'CurlMulti/MyCurl.php';
include 'phpQuery.php';
}
}
復制代碼 代碼如下:
<?php
class YafdocController extends Controller_Spider {
function init() {
parent::init ();
include 'CurlMulti/MyCurl/Clone.php';
}
function indexAction() {
$url = 'http://www.laruence.com/manual';
$dir = Yaf_Application::app ()->getAppDirectory () . '/data/manual';
$cacheDir = $this->getBaseDir () . '/cache/curl';
if (! is_dir ( $cacheDir )) {
mkdir ( $cacheDir );
}
$curl = new CurlMulti ();
$curl->maxThread = 10;
$curl->cache ['enable'] = true;
$curl->cache ['enableDownload'] = true;
$curl->cache ['dir'] = $cacheDir;
$curl->cache ['compress'] = true;
$clone = new MyCurl_Clone ( $curl, $url, $dir );
$clone->overwrite = true;
$clone->start ();
return false;
}
}