网站优化 搜索引擎收录网页的四个阶段
作为SEO从业者,不仅要被搜索引擎抓取,还要被收录,最重要的是在收录后有良好的排名,本文将简单分析下搜索引擎收录网页的四个阶段。每个网站、每个网页的排名都是不一样的,看看你的网站处于哪个阶段呢?
网页收录第一阶段:大小通吃
搜索引擎的网页抓取都是采取「大小通吃」的策略,也就是把网页中能发现的链接逐一加入到待抓取URL中,机械性的将新抓取的网页中的URL提取出来,这种方式虽然比较古老,但效果很好,这就是为什么很多站长反应蜘蛛来访问了,但没有收录的原因,这仅仅是第一阶段。
网页收录第二阶段:网页评级
而第二阶段则是对网页的重要性进行评级,PageRank是一种著名的链接分析算法,可以用来衡量网页的重要性,很自然的,站长可以用PageRank的思路来对URL进行排序,这就是各位热衷的「发外链」,据一位朋友了解,在中国「发外链」这个市场每年有上亿元的规模。
爬虫的目的就是去下载网页,但PageRank是个全局性算法,也就是当所有网页有下载完成后,其计算结果才是可靠的。对于中小网站来讲,服务器如果质量不好,如果在抓取过程中,只看到部分内容,在抓取阶段是无法获得可靠的PageRank得分。
网页收录第三阶段:OCIP策略
OCIP策略更像是PageRank算法的改进。在算法开始之前,每个网页都给予相同的「现金」,每当下载某个页面A后,A将自己的「现金」平均分给页面中包含的链接页面,把自己的「现金」清空。这就是为什么导出的链接越少,权重会越高的原因之一。
而对于待抓取的网页,会根据手头拥有的现金多少排序,优先下载现金最充裕的网页,OCIP大致与PageRank思路一致,区别在于:PageRank每次要迭代计算,而OCIP则不需要,所以计算速度远远快于PageRank,适合实时计算使用。这可能就是为什么很多网页会出现「秒收」的情况了。
网页收录第四阶段:大站优先策略
大站优先的思路很直接,以网站为单位来衡量网页的重要性,对于待抓取的URL队列中的网页,根据所述网站归类,如果哪个网站等待下载的页面最多,则优先下载这些链接。其本质思想是「倾向于优先下载大型网站URL」。因为大型网站往往包含更多的页面。鉴于大型网站往往是名站,其网页质量一般较高,所以这个思路虽然简单,但有一定依据。
实验表明这个算法虽然简单粗暴,但却能收录高质量网页,很有效果。这也是为什么许多网站的内容被转载后,大站却能排到你前面的最重要原因之一。
相关文章
- 这篇文章主要介绍了移动版Wap网站针对百度进行SEO优化的一些要点总结,包括内链和URL网址的设置等关键点的讲解,需要的朋友可以参考下2016-03-01
- 移动搜索引擎优化不仅仅只是给移动站排名,更重要的是还与PC网站排名有很密切的关系,那么移动网站该怎么优化呢?移动网站在优化过程中需要注意什么呢?本文将提供移动网页2016-01-27
- 昨天推荐了一款热点图神器,今天继续拿一个日本招聘网站开刀,从实战角度给同学们演示如何全方位优化整个网站,改善思路同样非常值得借鉴,满满当当的干货赶紧来收!2015-01-15
- 今天我们将对一个旅游网站进行彻底大变身,惊喜的是,借助神器的力量,改造思路非常清晰,改造效果非同一般地好。没有改版经验的设计师,看完你会回来转发的2015-01-13
- 对于摄影师而言,取景布局三分法是非常熟悉的概念。尽管它是非常引人入胜的概念,但是在进行网页设计的时候,几乎没有人会拿三分法来说事儿。2014-12-31
- 许多设计师喜欢将自己认为创意爆棚的UI设计直接应用到客户的网站上,但并没有考虑过这种设计是否符合网站的产品,是否符合目标用户群所需要的体验与需求,从这个角度上来说2014-12-17
- 有的网站打开网页需要等好长时间,没耐心的人直接就关上了,现在同类型的网站这么多,看谁的不是看啊,有多少网友愿意去等你的网页加载好了再看,这个问题可以直接减少好多2014-11-09
- 网站有哪些地方是不利于蜘蛛爬取的呢?下面脚本之家分享了一些蜘蛛爬取陷阱,让蜘蛛爬去不到页面的一些因素,需要的朋友可以参考下2014-10-13
- 优化关键词在网页制作和设置方面该怎么做?看看下文你就知道了2014-08-29
- 网站的流量从客观上反映了一个网站的受欢迎程度,流量越大,网站的排名越靠前,社会影响力也越大,特别是对网络媒体而言,权威性、公信力也越强。2014-08-20
最新评论