這是一段很簡單的程序利用了php的file_get_contents函數來采集百度的數據,然後通過simplexml_load_String把它數據解析出來,這樣數據就保存到了一個數組,我們就可以方便的利用了。 代碼如下 復制代碼
function getBaiduHotKeyWord()
{
$templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
If (preg_match('/<table>(.*)</table>/is', $templateRss, $_description)) {
$templateRss = $_description [0];
$templateRss = str_replace("&", "&", $templateRss);
}
$templateRss = "<?xml version="1.0" encoding="GBK"?>" . $templateRss;
$xml = simplexml_load_String($templateRss);
foreach ($xml->tbody->tr as $temp) {
if (!empty ($temp->td->a)) {
$keyArray [] = trim(($temp->td->a));
}
}
return $keyArray;
}