“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,通常是那些显示网页的技术方法,目前很多浏览器在设计的时候考虑过这些因素,所以可能网页界面看起来非常正常,但这些蜘蛛陷阱会对蜘蛛程序造成障碍,如果消除这些蜘蛛陷阱,可以使蜘蛛程序收录更多的网页。SEO工作中,网页被收录是基础工作,但对于搜索引擎来讲,极少情况会100%收录你网站的所有网页,搜索引擎的爬虫程序设计的再精巧,也难以逾越所谓的蜘蛛陷阱。下面我们来分析一下七大蜘蛛陷阱。
1、登陆要求
有些企业站和个人站的设置一定要注册登陆后才能看到相关的文章内容,这种对蜘蛛不是很友好,蜘蛛不会注册、也不会登陆。
2、动态URL
什么叫动态URL、什么叫静态URL,简单的说就是带有问号、等号及参数的网址就是动态URL,动态URL不利于搜索引擎蜘蛛的爬行和抓取。
3、强制用Cookies
部分站长为了让用户记住登陆信息,强迫用户使用Cookies如果为开启,则无法进行访问,访问页面显示的也不会正常,这种方式会让蜘蛛无法进行访问。
4、框架结构
首先各位站长你知道什么叫框架结构的世界吗?如果你不知道恭喜你,这个蜘蛛陷阱你已经躲避了,也不要去了解,所以有关框架结构的设计给予做任何的介绍。
5、各种跳转
对搜素引擎来说只对301跳转相对来说比较友好,对其他形式的跳转都是比较敏感,例如:JavaScrit跳转、MetaRefresh跳转、Flash跳转、302跳转。有些网站的做法很让人无奈,当你打开网页后会自动转向其他页面,就算打开的页面和你要找的页面主体先关也算过得去。但是很大部分的网站转向让你无任何理由和目的这种转向不推荐大家使用,如果你非要做转向,只推荐用301永久跳转,可以将权重进行传递,除了此转向其他都不推荐,因为很多的占用其他转向欺骗用户和搜索引擎,也是heimao的一种手段,所以建议大家不要使用,以免网站被K。
6、Flash
有的网站页面使用Flash视觉效果是很正常的,比如用Flash做的Logo、广告、图表等,这些对搜索引擎抓取和收录是没有问题的,很多网站的首页是一个大的Flash文件,这种就叫蜘蛛陷阱,在蜘蛛抓取时HTML代码中只是一个链接,并没有文字,虽然大的Flash效果看上去很好,外观看着也很漂亮,但可惜搜素引擎看不到,无法读取任何内容所以为了能体现网站优化的最好效果,不提倡这种Flash做首页图片。
7、javascript链接
例:<a onclick="window.open('','');return false" href="#">网址</a>
我们知道了有七大蜘蛛陷阱,那么我们在SEO中该如何避免这七大蜘蛛陷阱呢?
1、采用session id的页面 有的销售类站点为了分析用户的某些信息会采用会话ID来跟踪用户,访问站点的时候每个用户访问都会增加一次session id而加入到URL中,同样蜘蛛的每一次访问也会被当做为一个新用户,每次蜘蛛来访问的URL中都会加入一个session id,这样就会产生了同一个页面但URL不同的情况,这种的一来会产生复制内容页面,造成了高度重复的内容页,同时也是最常见的蜘蛛陷阱之一。比如说有的网站的为了提高销售业绩,而进行弹窗会话等,比如说您好来自XXX地的朋友等。
2:常识性的蜘蛛陷阱
采用强制注册或登录才能访问的页面,这种的对于蜘蛛来说就相当为难了,因为蜘蛛无法提交注册,更无法输入用户名和密码登录查看内容,对于蜘蛛来说我们直接点击查看到的内容也是蜘蛛所能看到的内容。
3、对于喜欢采用flash的站点,之所以说是喜欢采用flash的站点是因为对于一些中小型企业来说,因为flash本身可以做很多种效果,尤其是放在导航上视觉效果强,所以不少企业站喜欢弄个flash来展示自己公司的实力,文化,产品等,甚至一些企业站点的网站首页就是一个flash,要么是在多长时间后通过flash跳转到另外一个页面,要么就是通过flash上的链接让用户自己点击后进入一个新的页面,但是对于蜘蛛来说一来是很难读取flash中的内容,所以蜘蛛也很难点击flash上的链接。
4、对于动态URL,在url中加入过多的符号或者网址参数等,这种蜘蛛陷阱我在url优化中曾经有提到,虽然说随着搜索引擎的的技术发展,动态url对于蜘蛛的抓取已经越来越不是问题了,但是从搜索引擎友好度上来讲,静态哪怕是伪静态url相对来说都比动态url要好,可以看下很多SEO同行对于url中的处理方式。
文章标题:不友好的网站结构-蜘蛛陷阱
文章评论 本文章有个评论