大米CMS版本数据采集(
采集前请先备份您的数据库,如遇错误方便恢复
)
采集的列表页URL:
(表达式: http://www.dangdaitushu.com/zuixinxiaoxi/page_{2,3}.html)
详细页URL(不含http):
(表达式/zuixinxiaoxi/{*}.html或/zuixinxiaoxi/{(\d)+}.html)
以下是字段匹配规则:
所属分类:
请选择分类
{$option}
被采集的网页编码:
utf-8
gb2312
标题:
(表达式格式: <title>{*}<\/title>)
内容:
(表达式格式: <div id="content">{*}</div>)
{$vo.Field}
(正则表达式格式:<div id="****" >{*}</div>)