程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> dede3.1分頁文字采集過濾規則詳說(圖文教程)

dede3.1分頁文字采集過濾規則詳說(圖文教程)

編輯:PHP綜合

本文旨在以一個有代表性的文字分頁的取樣規則和過濾規則為藍本,通過簡單的變通和改動,解決一般性文字分頁的采集問題

一、范例部分
范例分頁區域代碼:
范例分頁區域代碼:

范例分頁區域取樣代碼:
  分頁區域取樣(匹配):


范例分頁內容過濾規則:
分頁內容過濾規則:

范例采集內容預覽:
范例采集內容預覽:


范例全代碼(說明:此代碼為在原基礎上進行更改後的代碼,原代碼版本不同,直接導入後無效,因此在dede論壇中有許多朋友說過‘直接導入人家的代碼都不能用',確實如此):
輸出結果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
與原文比較下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
這是全部的代碼,可導入試下:
復制代碼 代碼如下:
{!-- 節點基本信息 --}

{dede:item name='論壇范例_工作總結_成功(改)'
    imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'}
{/dede:item}

{!-- 采集列表獲取規則 --}

{dede:list source='var' sourcetype='archives' 
          varstart='' varend=''}
  {dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}    
  {dede:need}{/dede:need}
  {dede:cannot}{/dede:cannot}
  {dede:linkarea}[var:區域]{/dede:linkarea}
{/dede:list}

{!-- 網頁內容獲取規則 --}

{dede:art}
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分頁區域]</b>{/dede:sppage}

  {dede:note field='dede_archives.title' value='[var:內容]' comment='文章標題' 
  isunit='' isdown=''}

    {dede:match}<title>[var:內容]</title>{/dede:match}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.sortrank' value='[var:內容]' comment='排序級別' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = time();{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.writer' value='[var:內容]' comment='文章作者' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.litpic' value='[var:內容]' comment='縮略圖' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = @litpic;{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.pubdate' value='[var:內容]' comment='發布時間' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.senddate' value='[var:內容]' comment='錄入時間' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}@me = time();{/dede:function}

  {/dede:note}

  {dede:note field='dede_addonarticle.body' value='[var:內容]' comment='文章內容' 
  isunit='1' isdown=''}

    {dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:內容]<table width="100%" border="0" cellspacing="0" cellpadding="0">
{/dede:match}
        {dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim}

    {dede:function}{/dede:function}

  {/dede:note}

  {dede:note field='dede_archives.source' value='[var:內容]' comment='文章來源' 
  isunit='' isdown=''}

    {dede:match}{/dede:match}

    {dede:function}{/dede:function}

  {/dede:note}
{/dede:art}

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved