实例分析网站卡快照文章不收录的原因
一、问题基本网站数据
如下,是问题网站的一些seo数据,该站域名年龄为3个月,快照整整停滞了一个月,收录一直为个位数,各主要关键词均在搜索引擎的二三页。而另外一网站,则有个别词上了搜索引擎首页,同样的空间服务器,同样的人员采用同样的手段,其结果却截然相反,笔者从多个方面来分析这两个网站。
二、网站结构分析
网站的结构主要体现在文章的链接深度,两个站均采用树形结构,网站首页都有新闻列表页,蜘蛛通过两次爬行就达到文章页。而且,笔者为增加更多的网站被蜘蛛爬行抓取,在文章狼蚁网站SEO优化与右侧,分别作了一个“相关文章”推荐与“随机文章”的板块。从优化的角度来说,相关文章推荐能添加网页的相关性,随机文章,能让网站内的其它文章有更多的链接入口,从而提高文章被蜘蛛爬行与抓取的概率。
三、网站文章质量分析
笔者认为,网站文章的质量主要体现在如下的几个方面,文章独特性、文章相关性、文章内容丰富度与是否有权威推荐。
1、网站文章独特性
网站网站独特性包括文章标题的独特性与内容的原创度,笔者一般撰写文章时,会参考搜索引擎数据中有无重复的标题,若有,则会更换。所以两个网站的文章title无问题。而网站的文章页内容是否独特,直接通过搜索引擎搜索就可以得知,如下图所示的文章页内容,在搜索引擎中无重复页面,说明内容独特性做得较好。
2、网站文章内容的相关性
笔者两个网站的内容,都是围绕主关键词小儿退热贴或退热降温相关话题而展开的,文章的相关性做得不错。其实,网站内容的相关性对收录的影响不是很多,只要做到网站内容相似度不要太大就可以。笔者注意到有部分同行网站的文章大都是“小儿退热贴厂家哪家好?”“哪家小儿退热贴厂家比较好?”,这样的文章标题,其相似度就太大,一般收录不会很好。
3、文章内容的丰富度
文章内容的丰富度主要体现在文章的创意,文章页面的长度,文章是否图文并茂等等,笔者文章基本合格。
4、其它
笔者认为,文章页质量的其它因素包括文章页面是否链接太多,网站内页是否权重太低,网页有无权威页面推荐等。作为一个新站,在链接方面笔者控制在某个文章页面在一至二个链接的样子,也基本合格。
通过上面分析,笔者两个网站的文章页面质量可以算合格,说明文章质量还过得去,而且第二个网站的文章确实收录不错。
四、其它因素分析
笔者认为,其它的主要因素为外部链接、蜘蛛爬行、网站模板等因素。
在外部链接建设方面,这两个网站都是同时建设的,可以说是两个网站的外链重复度有80%,而且外链的广泛度、相关性与权威性都还算不错,外链不仅仅有b2b、分类、bbs、bolg链接,还有各文库平台与软文外链。
一个网页要想被收录,首选看有没有蜘蛛通过外部链接来爬行。怎么看蜘蛛爬行,很简单查看网站日志就可以。如下是笔者一个退热贴网站今天的日志。通过日志分析,可以看出2.13.4.17日上午百度蜘蛛很正常的来网站进行爬行,虽然爬行页面与频率不多,但也还算正常。
分析到这里,两个同服务器空间,同优化手段的网站,为何快照、文章收录与会出现很大的问题呢?笔者猜测这与网站的结构布局与网站的模板有关。笔者后分析,个网站卡快照不收录文章页的网站模板,是该公司使用了四次的模板,除了新闻列表页的内容不同外,首页与其他页面的内容完全相同。更致命的是,与该站相似的四个网站全部被惩罚与降权,又同为医疗站。该站的首页与其他退热贴相关站相似度太大,所以卡快照,不收录。而另外一个站,则是一个较新的模板,而且网站首页结拜与布局较为合理,所以收录与快照正常。
很多时候,特别是做客的朋友会深有体会,一个好的模板,对排名,文章收录有很大的帮助。甚至,一个被用泛滥的模板,很有可能不会被搜索引擎收录。