/*
作者:朱江 [email protected]
畢業於北京工業大學
工作嘛,呵呵,不說也罷,那是一個並不讓我引以為榮的地方
php4.X的系統所提供的fgetss()功能不完善,不能濾干淨HTML TAG,分析
其中忽略了某些情況,以下代碼是本人在開發過程中自制的土炮。
關於fgetss的BUG,可用如下代碼研究一下:
$fp=fopen("index.html","r");
while (! feof($fp))
{
$ms=fgetss($fp);
printf($ms);
}
fclose($fp);
版杈 :免費
*/
function mygets($myFile)
{
//while(!feof($myFile))
//{
$myline = fgets($myFile, 255);
$big=strlen(strstr($myline,">"));
$small=strlen(strstr($myline,"<"));
if($big>$small) //此句很重要,如果HTML代碼中間有換行時有用
{ //如果一行中首先出現的是>而不是<時有用
$myline=strstr($myline,">");
$myline=substr($myline,1);
}
$len=strlen($myline);
$startskip=false;
$outstring=""; //important!
for($i=1;$i<=$len;$i++) //去掉所有HTML代碼
{
$a=substr($myline,$i-1,1);
switch($a)
{
case "<":
$startskip=true;
//$myline=substr($myline,">");
//$myline=strstr($myline,1);
break;
case ">":
//$myline=substr($myline,1);
$startskip=false;
break;
default:
}
if(!$startskip && $a!=">") $outstring=$outstring.$a;
}
$outstring=str_replace(" "," ",$outstring);
//當然,以&開頭的東東如果不想要可以再加,如法炮制,這裡只是過濾
$outstring=str_replace(" ","",$outstring);
$outstring=str_replace(" ","",$outstring); //雙引號內為全角空格
$outstring=str_replace("
","",$outstring);
return $outstring;
//}
} ?>