采集操作使用详细说明

更新时间：2007年03月06日 00:00:00 作者：

一、项目编辑--基本设置

　　项目名称：    电脑入门                         （注：随便写）
　　网站名称：    it.com.cn                        （注：随便写）
　　网站地址：    http://www.it.com.cn             （注：随便写）
　　新闻列表网址：http://www.it.com.cn/edu/readme/ （注：采集网站哪个网站的网址。）
　　项目备注：    记得经常采集这个栏目。           （注：随便写）

二、项目编辑--采集目标源码

　　列表开始代码：（注：要找到唯一的）
　　列表结束代码：频道精选
　　列表索引分页：（注：这里有三种，<设置标签>、<批量生成>、<手动添加>）

　　1、设置标签：
　　下页开始标记：下页结束标记：>下一页（注：要找到唯一的）
　　索引分页重定向：（注：不知何意，请老大指教！）

　　　2、批量生成（注：这里设置生成范围为 1 TO 5 是不行的，没index_1.html这个目标，有些网站是可以。）
　　原字符串：http://www.it.com.cn/edu/readme/index_{$ID}.html
　　生成范围：2 To 5

　　3、手动添加（注：这里不能添加：http://www.it.com.cn/edu/readme/index_1.html，理由同上）
　　http://www.it.com.cn/edu/readme/index_2.html
　　http://www.it.com.cn/edu/readme/index_3.html
　　http://www.it.com.cn/edu/readme/index_4.html
　　http://www.it.com.cn/edu/readme/index_5.html

三、项目编辑-- 采集列表

　　链接开始代码：链接结束代码： target=_blank      （注：要找到唯一的）
　　链接特殊处理：不作处理   重新定位              （注：不知何意，请老大指教！）
　　绝对链接字符：                                   （注：不知何意，请老大指教！）

　　这是分析后所得到的新闻绝对链接地址：http://www.it.com.cn/f/edu/051/15/68987.htm 请查看是否正确。（注：点击后的地址是：http://127.0.0.1/Admin/target=_blank BUG???）

四、项目编辑--采集目标内容页源码

　　标题开始标记：或：
　　正文开始标记：　（注：要找到唯一的）
　　正文结束标记：　（注：要找到唯一的）

　　作者设置：　　　（注：这里就不说了，设置标签和采集正文的一样）
　　关键字词设置：　（注：同上）
　　正文分页设置：　（注：这里演示<设置标签>）

　　设置标签
　　下页开始标记：下页结束标记：>[下一页]
　　分页绝对链接：（注：感觉没什么用处？不知何意，请老大指教！）

五、项目编辑--属性设置

　　（注：到这一步显示出正文，说明测试采集目标成功，这里要注意的是：文中的图片显示不出来是正常的，发表后自然会显示出来）

六：项目编辑--文章属性 （注：自己设置啦～～～）

　　过滤选项：（注：建议全部打上勾）

satan_zero兄的【经验之谈】几个关键：

　　1. 请选择文章中独一无二、每篇必存的代码作为代码。这要看你的心思了，这关都通不过，
　　嘿嘿，还是去买本有讲HTML的书或者找个教程看看

　　2. 请在不要复制2005版中的代码作为标签。因为在代码视图中有些代码不可见，这应该是中鸟（嘿嘿）采集失败的原因，
　　譬如：2个字节的空格的代码，代码视图中就看不到。
　　解决办法：用记事本或者文本编辑器打开源代码看。

文件比较大，传到自己的空间里，分三部分下载：
　　http://www.itcfan.com/cj/1.part1.rar
　　http://www.itcfan.com/cj/2.part2.rar
　　http://www.itcfan.com/cj/3.part3.rar

采集操作使用详细说明

EditPlus 3设置字体大小(附图)
EditPlus3是我们经常使用的编辑工具，至于如何设置字体大小的问题，有很多朋友在问，下面有个不错教程，大家可以感受下
2013-10-10
局域网遭遇ARP欺骗攻击的解决方法
局域网遭遇ARP欺骗攻击的解决方法...
2007-05-05
十个习惯让你精通新的开发技术
这篇文章，是从我的《高效开发人员的五个特征》一文中抽出的一个观点。从我自身的事业和习惯中，我考虑了很多方式怎么样才能有效地学习。
2008-04-04
EditPlus 2.12 使用技巧集萃
EditPlus 2.12 使用技巧集萃...
2006-07-07
Access中字段上自动打开的输入法的解决方法
打开Access数据库时，在里面数据表字段输入数值时，总是会跳出输入法来，很是烦人，在网上找了一下，找到了相应的解决办法：
2008-04-04
hotmail,MSN 邮箱无法登陆的解决方法秘密通道
hotmail,MSN 邮箱无法登陆的解决方法秘密通道...
2007-12-12
IE7的菜单栏位置的设置方法
IE7的菜单栏位置的设置方法...
2007-03-03
键盘操作优势 IE7快捷键集锦
键盘操作优势 IE7快捷键集锦...
2007-03-03
让一张700M CD光盘装下 900M文件的超级方法推荐
让一张700M CD光盘装下 900M文件的超级方法推荐...
2007-11-11
去除某些论坛帖子中自动添加的白色字体即乱码的方法
去除某些论坛帖子中自动添加的白色字体即乱码的方法...
2007-03-03

采集操作使用详细说明

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具