程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> 用Java+MySQL+PHP輕松構建跨平台的搜索引擎

用Java+MySQL+PHP輕松構建跨平台的搜索引擎

編輯：關於JAVA

此搜索引擎適於在一個中等規模的局域網中使用，由於找到的網頁存在數據庫中，不僅可以索靜態的Html頁面，可以搜索PHP、ASP等動態頁面。對於一個擁有5萬個網頁的系統(使用PII-400作為服務器)，搜索響應時間在2-10秒左右，完全可以滿足要求，由於Java、mysql、PHP都是跨平台的軟件，所以此搜索引擎不僅可以工作在Windows服務器上，而且也可以工作在Linux等其他系統中。

一、建立搜索引擎需要的數據庫和數據表。

首先建立數據庫：

c:\mysql\bin\＞ mysqladmin -uroot -pmypasswd create Spider

然後建立數據庫中的表結構

c:\mysql\bin\＞ mysql -uroot -pmypasswd Spider ＜ Spider.mysql

其中Spider.mysql為一個文本文件，其內容如下：

CREATE TABLE link ( Id int(10) unsigned NOT NULL auto_increment, Url varchar(120) NOT NULL, Class tinyint(3) unsigned NOT NULL default 0 , IsSearchLink tinyint(3) unsigned default 0, PRIMARY KEY (Url), UNIQUE Id (Id), KEY Url (Url), KEY Class (Class) );

# 本局域網的初始主頁地址，搜索蜘蛛從此網址開始搜索所有其他網頁

INSERT INTO link VALUES( '1', 'HTTP://102.211.69.1/', '0', '0');

# 數據表 webpagelocal 用來存放下載的所有的網頁

CREATE TABLE webpagelocal ( Id int(10) unsigned NOT NULL auto_increment, Url varchar(120) NOT NULL, Content text NOT NULL, PRIMARY KEY (Url), UNIQUE Id (Id), KEY Url (Url) );

# 數據表 webpagefindfast

# 用MakeFast.php從表webpagelocal中提取512字節的檢索信息存放其中

CREATE TABLE webpagefindfast ( Id int(10) unsigned NOT NULL, Url varchar(120) NOT NULL, Title varchar(64), Content blob, PRIMARY KEY (Url), KEY Url (Url), KEY Title (Title) );

二、以下為搜索網頁和下載網頁至本地數據庫的Java程序LinkToDB.java，它也是此搜索引擎的核心和基礎

/***************************** LinkToDB.java ***********************************
*
* 對URL中的http鏈接進行分析,將相對路徑轉換為絕對路徑，排序方式輸出結果到數據庫
*
* 假如分析得到的URL是Link表中唯一的，就將其內容下載到表 WebPageLocal 中。
*
********************************************************************************
/
import java.io.*;
import java.util.*;
import java.net.*;
import java.lang.String;
import java.sql.*;
import java.text.*;

class Counter {
private int i = 1;
int read() { return i; }
void increment() { i++; }
}

public class LinkToDB {
String UrlHost = "";
String UrlFile = "";
String UrlPath = "";
static String StartWith = null;
boolean outsideTag = true; //判定是否在標記之中
static char[] buffer = new char[4096]; // 緩沖區:用於保存從 URL 讀的數據
InputStreamReader read = null;
BufferedReader reader = null;
URLConnection UC = null;
private URL url = null;
private StreamTokenizer st;
private TreeMap counts = new TreeMap();//以排序方式保存找到的鏈接

LinkToDB(String myurl,String StartOnly){
try {
StartWith = StartOnly;
if(StartOnly!=null) { if(!myurl.startsWith(StartOnly)) return; }//只搜索此網站
url = new URL(myurl);
UrlHost = url.getHost();
UrlHost = UrlHost.toUpperCase();
UrlFile = url.getFile();
int v=UrlFile.lastIndexOf("/");
if(v!=-1) UrlPath = UrlFile.substring(0,v);
System.out.println("分析文件："+myurl);
int uclength=200000;
int ucError=0;
try{
uc = url.openConnection();
uc.setUseCaches(false);
uc.connect();
}
catch(IOException io) { ucError=1; System.out.println("打不開待分析網頁:"+myu
rl); }
if(ucError!=1){
uclength = uc.getContentLength();
if (uclength＜200000) {
try{ read = new InputStreamReader(url.openStream()); }
catch(IOException io) {System.out.println("流打開錯誤:"+myurl);}
}
else System.out.println("文件太大，不分析");
}
if(read!=null){
reader=new BufferedReader(read);
if(reader!=null){
st = new StreamTokenizer(reader);
st.resetSyntax(); // 重置語法表
st.WordChars(0,255); // 令牌范圍為全部字符
st.ordinaryChar('＜'); // HTML標記兩邊的分割符
st.ordinaryChar('＞');
}
}
}
catch(MalformedURLException e){ System.out.println("Malformed URL String!");}
}
void cleanup() {
try { read.close(); }
catch(IOException e) { System.out.println("流關閉錯誤"); }
}
void countWords() {
try {
while(st.nextToken()!=StreamTokenizer.TT_EOF) {
String s0="";
String s_NoCase="";
switch(st.ttype) {
case '＜': //入標記字段
outsideTag=false;
continue; //countWords();
case '＞': //出標記字段
outsideTag=true;
continue; //countWords();
case StreamTokenizer.TT_EOL: s0 = new String("EOL"); break;
case StreamTokenizer.TT_WORD: if(!outsideTag) s0 = st.sval; /*已經是字符
串*/ break;
default: s0 = "";// s0 = String.valueOf((char)st.ttype);/*單一字符*/
}
if(outsideTag) continue;//出了標記區域(＜a ＞)
String s = "";
s_NoCase = s0.trim();
s0=s_NoCase.toUpperCase();
if(s0.startsWith("A ")s0.startsWith("AREA ")s0.startsWith("FRAME ")s0.s
tartsWith("IFRAME ")){ //以這些開始的都是超級鏈接
int HREF_POS = -1;
if(s0.startsWith("FRAME ")s0.startsWith("IFRAME ")) {
HREF_POS = s0.indexOf("SRC=");
s0 = s0.substring(HREF_POS+4).trim();
s_NoCase=s_NoCase.substring(HREF_POS+4).trim();
}
else {
HREF_POS=s0.indexOf("HREF=");
s0=s0.substring(HREF_POS+5).trim();
s_NoCase=s_NoCase.substring(HREF_POS+5).trim();
}
if(HREF_POS!=-1) {
if(s0.startsWith("\""))
{s0=s0.substring(1);s_NoCase=s_NoCase.substring(1);}
int QUOTE=s0.indexOf("\"");
if(QUOTE!=-1)
{s0=s0.substring(0,QUOTE).trim();s_NoCase=s_NoCase.substring(0,QUOTE).trim
();}
int SPACE=s0.indexOf(" ");
if(SPACE!=-1)
{s0=s0.substring(0,SPACE).trim();s_NoCase=s_NoCase.substring(0,SPACE).trim
();}
if(s0.endsWith("\""))
{s0=s0.substring(0,s0.length()-1);s_NoCase=s_NoCase.substring(0,s_NoCase.l
ength()-1);}
if(s0.indexOf("'")!=-1s0.indexOf("javascript:")!=-1s0.indexOf("..")!=-1
)
{s0="";s_NoCase="";} //有這些符號，認為非合法鏈接；兩點表示上一目錄，而我
只想向下級查找
if ( !s0.startsWith("FTP://") &&//以下後綴或前綴通常非網頁格式
!s0.startsWith("FTP://") &&
!s0.startsWith("MAILTO:") &&
!s0.endsWith(".SWF") &&
!s0.startsWith("../")) //因../表示上一目錄，通常只需考慮本級和下N級目錄
s=s0;
if (!s.startsWith("HTTP://")&&!s.equals("")) {s=UrlHost+UrlPath+"/"+s;s_No
Case=UrlHost+UrlPath+"/"+s_NoCase;}
else if(s.startsWith("/")) {s=UrlHost+s;s_NoCase=UrlHost+s_NoCase;}
if(s.startsWith("HTTP://")) {s=s.substring(7);s_NoCase=s_NoCase.substring(
7);}
int JinHao=s.indexOf("#"); //假如含有"#"號，表示有效的鏈接是此前的部分
if(JinHao!=-1) {s=s.substring(0,JinHao).trim();s_NoCase=s_NoCase.substring(
0,JinHao).trim();}
int H=-1; //以下將/./轉換為/
for(int m=0;m＜4;m++){
H=s.indexOf("/./");
if(H!=-1) {s=s.substring(0,H)+s.substring(H+2);s_NoCase=s_NoCase.substring
(0,H)+s_NoCase.substring(H+2);}
}
int TwoXG=-1; //以下將//轉換為/
for(int m=0;m＜5;m++){
TwoXG=s.indexOf("//");
if(TwoXG!=-1) {s=s.substring(0,TwoXG)+s.substring(TwoXG+1);s_NoCase=s_NoCa
se.substring(0,TwoXG)+s_NoCase.substring(TwoXG+1);}
}
int OneXG=s.indexOf("/");
if(OneXG==-1) {s=s+"/";s_NoCase+="/";} //將xx.xx.xx.xxx轉換為xx.xx.xx.xxx/的
標准形式
if (!s.startsWith("HTTP://")) {s="HTTP://"+s;s_NoCase="HTTP://"+s_NoCase;}
}
}
if(counts.containsKey(s_NoCase)) ((Counter)counts.get(s_NoCase)).increment();
else counts.put(s_NoCase,new Counter());
}
} catch(IOException e) {
System.out.println("st.nextToken() unsuccessful");
}
}

Collection values() { return counts.values(); }
Set keySet() { return counts.keySet(); }
Counter getCounter(String s) { return (Counter)counts.get(s); }

public static void main(String[] argv) throws FileNotFoundException {
try{
Class.forName("org.gjt.mm.mysql.Driver").newInstance();
}
catch (Exception E) {
System.out.println("加載Jdbc驅動程序失敗");
E.printStackTrace();
}
try{
Connection conn = DriverManager.getConnection(
"jdbc:mysql://localhost/Spider?user=root&password=mypassword");
Statement stmt = conn.createStatement();
String myurl;
for(int i=1;i＜=6;i++){
String query = "SELECT Url FROM link WHERE IsSearchLink=0 and Class="+(i-1)+"
ORDER BY Url";
ResultSet rs = stmt.executeQuery(query);
while (rs.next()) {
myurl = rs.getString("Url");
String StartOnly = null;
if(argv.length＞0) StartOnly=argv[0];
LinkToDB wc = new LinkToDB(myurl,StartOnly);
if(wc.reader!=null){
stmt.executeUpdate("UPDATE Link SET IsSearchLink=1 WHERE Class="+(i-1)+" a
nd Url='"+myurl+"'");
wc.countWords();
Iterator keys = wc.keySet().iterator();
while(keys.hasNext()) {
String key = (String)keys.next();
System.out.println("分析找到鏈接："+key + ": "+ wc.getCounter(key).read());
int ErrorDB=0;
if(StartWith==null(StartWith!=null&&key.startsWith(StartWith))){
try{//-------------------------- 找到的鏈接插入數據庫link -----------------
--
stmt.executeUpdate("INSERT INTO Link(Id,Url,Class) VALUES(0,'"+key+"',"+
i+")");
}
catch(SQLException ex){
ErrorDB=1;
System.out.println("插入數據錯 SQLException: " + ex.getMessage())
;
}
if(ErrorDB!=1){ //鏈接不重復就下載網頁到WebPageLocal
System.out.println("下載網頁:"+key);
int length; // 讀的字符數
int filelength=200000;
InputStreamReader read=null;
URL rurl=null;
URLConnection urlc=null;
String Content="";
try{ rurl = new URL(key); }
catch(MalformedURLException mu) {
System.out.println("打開下載網頁出錯:"+mu.getMessage());
}
if(rurl!=null){
int ucError=0;
try{ urlc = rurl.openConnection(); urlc.connect();}
catch(IOException io) { ucError=1; System.out.println("下載網頁打不開:"+ke
y); }
if(ucError==0){
try{
filelength=urlc.getContentLength();
if (filelength＞=200000) System.out.println("網頁太大，我不下載了。"+key);
else read = new InputStreamReader(rurl.openStream());
}
catch(IOException io) {System.out.println("下載網頁打不開:"+key);}
}
// 讀入 URL 並寫入數據庫
if(read!=null&&filelength＜200000){
try{
while((length = read.read(buffer)) != -1) {
String s = new String(buffer, 0, length);
Content=Content+s;
}
}
catch(IOException io) {
Content="";
System.out.println("不能讀入URL文件");
}
try{
Statement stmt2 = conn.createStatement(ResultSet.TYPE_SCROLL_SENSITIVE, Res
ultSet.CONCUR_UPDATABLE);
ResultSet uprs = stmt2.executeQuery("SELECT Id,Url,Content FROM WebPageLoca
l WHERE 0");//WHERE 0很重要，否則會耗盡內存
uprs.moveToInsertRow();
uprs.updateInt("Id",0);
uprs.updateString("Url",key);
uprs.updateString("Content",Content);
uprs.insertRow();
uprs.beforeFirst();
uprs.close();
stmt2.close();
}
catch(SQLException ex){
System.out.println("插入數據錯：" + ex.getMessage());
}
}//if(read!=null&&filelength＜200000)
}//
}
}
//------------------------------- 下載網頁 ----------------------------------
}//while(keys.hasNext())
wc.cleanup();
}//if(wc.reader!=null)
}//while rs.next
rs.close(); //關閉記錄結果
}//end for
stmt.close(); //關閉語句
conn.close(); //關閉連接
}//try
catch(SQLException ex){ System.out.println("SQL異常:" + ex.getMessage()); }
}//main()函數結束
}//類 LinkToDB 結束

三、編譯和運行此Java程序

d:\Spider\＞ set CLASSPATH=d:\j\mm.mysql.jdbc2;
d:\Spider\＞ d:\j\bin\javac LinkToDB.java
d:\Spider\＞ d:\j\bin\java LinkToDB

其中第一行命令是設置MySQL的JDBC驅動程序路徑。

四、由於網頁中含有大量的無用的格式信息，直接用它來搜索要浪費大量的時間，所以需要掉其中的HTML格式控制信息，並將太長的網頁截短，然後將整理後的用於搜索的信息存到另一個數據表中。由於PHP4中有一個很方便的函數strip_tags可以去掉其中的HTML格式標記，所以我們用PHP來整理。

MakeFast.php的內容如下：

＜?php
mysql_connect("localhost","root","mypassword");
$result = mysql_db_query("Spider","select Id,Url,Content from WebPageLocal whe
re Id＞$n1 and Id＜$n2");
while($mt = mysql_fetch_array($result)){
$Title = "";
$Body = "";
$mt2 = strtoupper($mt[2]);
$PosTitleL = strpos($mt2,"＜TITLE＞");
$PosTitleR = strpos($mt2,"＜/TITLE＞");
$PosBody = strpos($mt2,"＜BODY");
$PosHeadR = strpos($mt2,"＜/HEAD＞");
if($PosTitleL&&$PosTitleR) $Title = substr($mt[2],$PosTitleL+7,$PosTitl
eR-$PosTitleL-7);
$Title = eregi_replace("'","’",$Title);
if($PosBody) $Body = substr($mt[2],$PosBody);
else if($PosHeadR) $Body = substr($mt[2],$PosHeadR+7);
else if($PosTitleR) $Body = substr($mt[2],$PosTitleR+8);
else if($PosTitleL) $Body = substr($mt[2],$PosTitleL);
else $Body = $mt[2];
$BodyText = strip_tags($Body);
$BodyNoSpace = eregi_replace(" ","",$BodyText);
$BodyNoQuote = eregi_replace("'","",$BodyNoSpace);
$Body512 = substr($BodyNoQuote,0,511)." ";
$Id = $mt[0];
$Url = $mt[1];
$sql="Insert Into WebPageFindFast(Id,Url,Title,Content)
VALUES($Id,'$Url','$Title','$Body512')";
mysql_db_query("Spider",$sql) or die($sql);
echo $Id." ";
}
?＞

使用方式:

在浏覽器中輸入http://mywebsite/Spider/MakeFast.php?n1=1&n2=10000

五、以上是建立搜索引擎所用到的數據，下面編制用於用戶搜索的網頁和PHP腳本文件。首先是用於搜索的表單頁面SearchForm.htm，其內容如下。

＜html＞
＜head＞
＜title＞紅蜘蛛搜索引擎-V0.1＜/title＞
＜meta http-equiv="Content-Type" content="text/html; charset=gb2312"＞
＜link rel="stylesheet" href="../All.Css" type="text/css"＞
＜/head＞

＜body bgcolor="#eeffee" text="#000000"＞
＜table width="600" border="0" cellspacing="2" cellpadding="2" align="center" bgc
olor="#99CC00"＞
＜tr＞
＜td＞
＜div align="center"＞＜font color="#FF0000"＞＜b＞＜span class="pt16"＞紅蜘蛛搜索
引擎＜/span＞
＜span class="pt12"＞V0.1＜/span＞＜/b＞＜/font＞＜/div＞
＜/td＞
＜/tr＞
＜/table＞
＜form name="form1" method="post" action="Search.php"＞

＜table width="600" border="1" cellspacing="1" cellpadding="1" align="center" b
ordercolor="#99CC00"＞
＜tr＞
＜td＞

＜div align="left"＞＜span class="pt15"＞＜font color="#FF0000"＞＜b＞關鍵字＜/
b＞：＜/font＞＜/span＞
＜input type="text" name="KeyWords" size="40" maxlength="40"＞
＜/div＞
＜/td＞
＜td＞

＜div align="left"＞＜span class="pt15"＞＜font color="#FF0000"＞＜b＞查找范圍＜/
b＞：＜/font＞＜/span＞
＜select name="SearchIn"＞
＜option value="Content" selected＞網頁正文＜/option＞
＜option value="Title"＞網頁標題＜/option＞
＜/select＞
＜/div＞
＜/td＞
＜/tr＞
＜tr＞

＜td colspan="2"＞＜span class="pt15"＞＜font color="#FF0000"＞＜b＞查找方式＜/b＞：
＜/font＞＜/span＞
＜select name="Speed"＞
＜option value="Fast" selected＞快速查找＜/option＞
＜option value="Slow"＞更深查找＜/option＞
＜/select＞
＜/td＞
＜/tr＞
＜tr＞
＜td colspan="2"＞
＜div align="left"＞
＜input type="submit" name="Submit" value="搜索"＞
＜/div＞
＜/td＞
＜/tr＞
＜/table＞
＜/form＞
＜table width="600" border="0" cellspacing="2" cellpadding="2" align="center"＞
＜tr＞
＜td height="18"＞
＜p class="pt12"＞＜font color="#FF0000"＞＜b＞使用方法＜/b＞＜/font＞：僅需在要害字
一欄輸入查詢內容並按回車鍵（Enter)即可。
＜/p＞

＜p align="left" class="pt12"＞假如希望輸入多個條件，只需要用空格分隔即可：
＜/p＞
＜p class="pt12"＞例如：要查詢同時包含“西昌”和“衛星”的網頁，只需輸入[西
昌衛星]。＜/p＞
＜p class="pt12"＞又如：要查詢只包含要害字“西昌”而不包含“衛星”的網頁，
只需要輸入[西昌 -衛星]。注重中間的空格不能少。＜/p＞

＜p class="pt12"＞＜font color="#FF0000"＞＜b＞查找范圍＜/b＞＜/font＞：你可以選擇從
“網頁標題”中查找或者從“網頁正文”中查找。＜/p＞
＜p class="pt12"＞＜font color="#FF0000"＞＜b＞查找方式＜/b＞＜/font＞：“快速查找”
速度快但找到的網頁數可能較少，因為：＜/p＞

＜p class="pt12"＞“快速查找”只搜索網頁正文的前512個字符。＜/p＞
＜p class="pt12"＞“更深查找”搜索網頁正文的前2048個字符。＜/p＞
＜div align="right"＞＜a href="mailto:[email protected]"＞＜font color="#FF0000" class="pt13"＞＜b＞歡迎
提出寶貴意見＜/b＞＜/font＞＜/a＞＜/div＞

＜/td＞
＜/tr＞
＜/table＞
＜/body＞
＜/html＞

search.php根據用戶輸入的條件，完成搜索，顯示找到的網頁的鏈接地址、標題和提要信息
。內容如下：

＜TITLE＞紅蜘蛛正在搜索要害詞為[＜?php echo $KeyWords?＞]的網頁＜/TITLE＞
＜link rel="stylesheet" href="../All.css" type="text/css"＞
＜body bgcolor="#eeffee"＞
＜table width="96%" border="0" cellspacing="2" cellpadding="2" align="center" bgc
olor="#99CC00"＞
＜tr＞
＜td＞
＜div align="center"＞＜font color="#FF0000"＞＜b＞＜span class="pt16"＞紅蜘蛛搜索
引擎＜/span＞
＜span class="pt12"＞V0.1＜/span＞＜/b＞＜/font＞＜/div＞
＜/td＞
＜/tr＞
＜/table＞
＜form name="form1" method="post" action="Search.php"＞
＜table width="96%" border="1" cellspacing="1" cellpadding="1" align="center" b
ordercolor="#99CC00"＞
＜tr＞
＜td valign="top"＞＜font color="#FF0000"＞＜b＞＜span class="pt13"＞要害字＜/span
＞＜/b＞＜span class="pt13"＞：＜/span＞＜/font＞
＜input type="text" name="KeyWords" value="＜?php echo $KeyWords?＞" size="
30" maxlength="30"＞
＜input type="submit" name="Submit" value="重新搜索"＞
＜/td＞
＜td valign="top"＞＜font color="#FF0000"＞＜b＞＜span class="pt13"＞查找范圍＜/spa
n＞＜/b＞＜span class="pt13"＞：＜/span＞＜/font＞
＜select name="SearchIn"＞
＜option value="Content" ＜?php if ($SearchIn=="Content") echo "selected
";?＞＞網頁正文＜/option＞
＜option value="Title" ＜?php if ($SearchIn=="Title") echo "selected
";?＞＞網頁標題＜/option＞
＜/select＞
＜/td＞
＜td valign="top"＞
＜div align="left"＞＜font color="#FF0000"＞＜b＞＜span class="pt13"＞查找方式＜/
span＞＜/b＞＜span class="pt13"＞：＜/span＞＜/font＞
＜select name="Speed"＞
＜option value="Fast" ＜?php if ($Speed=="Fast") echo "selected";?＞＞快
速查找＜/option＞
＜option value="Slow" ＜?php if ($Speed=="Slow") echo "selected";?＞＞更
深查找＜/option＞
＜/select＞
＜/div＞
＜/td＞
＜/tr＞
＜/table＞
＜/form＞
＜?php
if($SearchIn=="Title") $SQL="SELECT Id,Url,Title,Content FROM WebPageFindFast
WHERE ";
else $SQL="SELECT Id,Url,Title,Content FROM WebPageFind$Speed WHERE ";
$KeyWords=str_replace("　", " ", $KeyWords);
if($KeyWords=="") {echo "要害字不能為空"; exit();}
$tok = strtok($KeyWords," ");
$i=0;
$j=0;
while($tok) {
$i++;
$tok = strtok(" ");
}
$key = strtok($KeyWords," ");
while($key) {
$j++;
if(substr($key,0,1)!="-") {
$SQL=$SQL.$SearchIn." LIKE '%".$key."%' ";
$Words[]=$key;
}
else {
$SQL=$SQL.$SearchIn." NOT LIKE '%".substr($key,1)."%' ";
}
if($j＜$i) $SQL.=" AND ";
$key = strtok(" ");
}
if($CurPos!="") $SQL.=" AND Id＞=$CurPos ";
$SQL.=" LIMIT 100";
//echo "\$SQL=".$SQL."
";
mysql_connect("localhost","root","mypassword");
$result=mysql_db_query("Spider",$SQL);
$RowCount=mysql_num_rows($result);
$FindCount=0;
?＞
＜table border=0 align=center width="96%"＞
＜tr＞
＜th nowrap width="41%"＞
＜div align="left" class="pt12"＞共找到要害字為＜font color=red＞
＜?php echo $KeyWords?＞
＜/font＞的網頁共＜font color=red＞
＜?php echo $RowCount;?＞
＜/font＞個＜/div＞
＜/th＞
＜td nowrap＞
＜/td＞
＜/tr＞
＜tr bgcolor="#FF0000"＞
＜th nowrap colspan="2" height="3"＞＜/th＞
＜/tr＞
＜?php while($row= mysql_fetch_array($result)){
$Pos=$row[0];
$FindCount++;
if($FindCount＞20) break;?＞
＜tr＞
＜td nowrap colspan="2"＞
＜?php echo $FindCount;?＞
＜a href="＜?php echo $row[1]?＞" target=_black＞
＜?php if($row[2]!="") echo $row[2];
else echo substr($row[3],0,64);
?＞
＜/a＞＜/td＞
＜/tr＞
＜tr＞
＜td colspan="2" ＞＜span class="pt13"＞摘要：＜/span＞
＜?php
if($SearchIn=="Title") {
$ZhaiYao=substr($row[3],0,1024);
}
else{
if($Speed=="Fast") $ZhaiYao=$row[3];
else{
$RowLen=strlen($row[3]);
if ($RowLen＜1024) {
$ZhaiYao=$row[3];
}
else {
$CutPos=0;
$PosWord1=strpos($row[3],$Words[0]);
if($PosWord1-512＜0) $ZhaiYao=substr($row[3],0,1024);
else {
for($i=24;$i＜500;$i++){ //避免將中文字符從半個字處截斷，選擇從英文處截斷
if(ord(substr($row[3],$PosWord1-$i,1))＜128) {$CutPos=$i;break;}
}
$ZhaiYao=substr($row[3],$PosWord1-$CutPos,1024);
}
}
}
for($i=0;$i＜count($Words);$i++){
$ZhaiYao=str_replace($Words[$i],"＜font color=red＞".$Words[$i]."＜/font＞", $ZhaiY
ao);
}
}
echo $ZhaiYao;
?＞
＜/td＞
＜/tr＞
＜tr＞
＜td colspan="2" align="right"＞＜a href="One.php?num=＜?php echo $row[0]?＞" tar
get=_black＞
＜font color="#0033FF" class="pt12"＞本地鏡像＜/font＞＜/a＞＜/td＞
＜/tr＞
＜tr bgcolor="#999933"＞
＜td nowrap colspan="2" height="1"＞＜/td＞
＜/tr＞
＜?php } ?＞
＜?php if($RowCount＞20){ ?＞
＜tr＞
＜td align="right" colspan="2" height="10"＞
＜form name="form2" method="post" action="Search.php"＞
＜input type="hidden" name="KeyWords" value="＜?php echo $KeyWords;?＞"＞
＜input type="hidden" name="SearchIn" value="＜?php echo $SearchIn;?＞"＞
＜input type="hidden" name="Speed" value="＜?php echo $Speed;?＞"＞
＜input type="hidden" name="CurPos" value="＜?php echo $Pos;?＞"＞
＜input type="submit" name="Submit" value="下20個網頁"＞
＜/form＞
＜/td＞
＜/tr＞
＜?php } ?＞
＜/table＞

One.php用於從本地鏡像中顯示一個找到的網頁。由於網頁的原始信息已經在WebPageLocal中存儲，所以
只需簡單的讀出，發給用戶。

＜?php
　mysql_connect("localhost","root","mypassword");
　$sql="select Url,Content from WebPageLocal where ";
　if($num!="") $sql=$sql."Id=$num";
　else exit();
　$result=mysql_db_query("Spider",$sql);
　$mt=mysql_fetch_row($result);
　echo $mt[1];
?＞