本文旨在以一個有代表性的文字分頁的取樣規則和過濾規則為藍本,通過簡單的變通和改動,解決一般性文字分頁的采集問題
一、范例部分
范例分頁區域代碼:
范例分頁區域代碼:
范例分頁區域取樣代碼:
分頁區域取樣(匹配):
范例分頁內容過濾規則:
分頁內容過濾規則:
范例采集內容預覽:
范例采集內容預覽:
范例全代碼(說明:此代碼為在原基礎上進行更改後的代碼,原代碼版本不同,直接導入後無效,因此在dede論壇中有許多朋友說過‘直接導入人家的代碼都不能用',確實如此):
輸出結果:http://wen.soudata.net/html/guizeceshi/caijibiji/20070327/2044_2.html
與原文比較下吧:http://www.xiaocao.com/text/class1/class1/200609/text_28623.html
這是全部的代碼,可導入試下:
復制代碼 代碼如下:
{!-- 節點基本信息 --}
{dede:item name='論壇范例_工作總結_成功(改)'
imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'}
{/dede:item}
{!-- 采集列表獲取規則 --}
{dede:list source='var' sourcetype='archives'
varstart='' varend=''}
{dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}{/dede:url}
{dede:need}{/dede:need}
{dede:cannot}{/dede:cannot}
{dede:linkarea}[var:區域]{/dede:linkarea}
{/dede:list}
{!-- 網頁內容獲取規則 --}
{dede:art}
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font>[var:分頁區域]</b>{/dede:sppage}
{dede:note field='dede_archives.title' value='[var:內容]' comment='文章標題'
isunit='' isdown=''}
{dede:match}<title>[var:內容]</title>{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.sortrank' value='[var:內容]' comment='排序級別'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.writer' value='[var:內容]' comment='文章作者'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.litpic' value='[var:內容]' comment='縮略圖'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = @litpic;{/dede:function}
{/dede:note}
{dede:note field='dede_archives.pubdate' value='[var:內容]' comment='發布時間'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.senddate' value='[var:內容]' comment='錄入時間'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_addonarticle.body' value='[var:內容]' comment='文章內容'
isunit='1' isdown=''}
{dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:內容]<table width="100%" border="0" cellspacing="0" cellpadding="0">
{/dede:match}
{dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.source' value='[var:內容]' comment='文章來源'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{/dede:art}