摘要:索引量与站点数据量的区别及意义百度在很多地方都记得,网站命令得到的“收录量”并不是实际的索引量,而自己站长平台上的数据就是实际的索引量。百度索引量的每日变化可能反映了您的网站前一天被百度实际索引的数量。其实,除了关注网站指令结果和索引量数据的数量外,最需要关注的应该是网站“有效收录”的数量。
百度索引量是百度站长平台推出的一款查询网站实际索引量的工具,在第八章也会提到,这里就和这个站长平台合作讨论一下百度索引量数据。百度记住在很多地方都说通过网站命令获取的“收录量”不是实际索引量,自己站长平台上的数据才是实际索引量。可能是因为大家使用网站时间太长百度收录量超过索引量,百度站长平台提供的数据往往和网站数据相差很大,很多朋友都在质疑这个数据的真实性和价值。
百度官方回应称,差异是由于数据不同步造成的。但通过跟踪一些大型网站两项数据的变化,我们可以总结出一些普遍但不一定适用于所有网站的规律:网站降级时,索引量通常远大于网站估算值。网站估算值大于索引量的网站往往在搜索中表现良好。索引量远高于网站估算值的网站,一般都存在大量垃圾页面。具体表现并不像百度官方回应中的“数据不同步”那么明显,因为笔者观察发现,有一个网站降级近一年,网站估算值只有几百万,峰值有两三千万,但索引量暴涨,峰值甚至超过1亿。此外,一些大型论坛、分类信息网站,由于信息质量参差不齐,也经常出现索引量远大于网站估算值的情况。
在实际工作中,网站结果数的变化趋势通常与网站流量的变化趋势成正比,如果网站的结果数为0百度收录量超过索引量,那么无论百度指数有多大,该网站都不会产生搜索流量。可以说,网站数据更新量的变化可能反映出你网站上真正参与搜索排名的网页的变化趋势。现在百度指数量已经把刷新频率改成天数了,百度指数量每天的变化可能反映出你网站前一天真正被百度收录的网页数量。所以,百度指数量可以作为判断网站每天更新的内容是否符合百度指数标准的参考,而网站结果数的变化趋势可以看作是网站权重的变化趋势,或者说网站质量的变化。当网站没有明显降权时,通常有这样的规律,如果网站已经明显降权,就不会有这样的规律了,很有可能是索引量和网站的估值有偏差。 两家都规模很大,但是没有全网的搜索排名和流量。
根据观察,site 命令结果数和索引量有“统一”的迹象,其实这两者还是有些区别的,这一点对于站长来说才是最重要的,如果百度把这两者的数据统一起来,那么站长们就不用两个都用了。如果这两者数据真的统一了,索引量也能查询到目录级别的精准数据,相对来说比 site 和 inurl 给出的结果数更有意义,那么 site 和 inurl 命令其实就回归到它们本身的意义了——“只是用来限制搜索范围的”。
其实,除了关注网站命令结果数和索引数据外,最应该关注的应该是网站的“有效收录”数。只有网站收录了流量才有意义,不管网站结果数和百度指数多高,如果没有搜索流量,都是没用的。相对而言,在流量的统计上,站长和SEO人员每天要花更多的精力去关注、监控和分析网站在搜索引擎的搜索词数和着陆页数。