标签归档:网站结构优化

网站结构优化技巧

nofollow的使用技巧

nofollow是2005年由Google领头新创的一个标签属性,目前主流搜索引擎都支持。

nofollow最初目的是减少垃圾链接对搜索引擎排名的影响,标签意义是告诉搜索引擎这个链接不是经过站长自己编辑的,所以这个链接不是一个信任投票。搜索引擎看到这个标签就不会跟踪爬行链接,也不传递链接权重和锚文字。
nofollow标签通常用在博客评论、论坛帖子、社会化网站、留言板等地方,因为在这些地方任何用户可以自由留下链接,站长一般并不知道链接连向什么网站,也不可能一一查看验证,所以是垃圾链接最多出现的地方。现在主流的博客和论坛软件都自动在评论和帖子的链接中加上了nofollow。
nofollow另外一个用途,用于广告链接。给广告链接加上nofollow可以告诉搜索引擎,这是个广告,请不要传递链接权重。
由于nofollow属性能阻止蜘蛛爬行和传递权重,达到控制内部链接权重和PR流动及分布的目的。最常见的应用是在联系我们、隐私权政策、用户条款、用户登录等链接上。这些页面往往有整站链接,如果没有使用nofollow,整站的链接权重会平等地流动到这些网页上。而像隐私权政策这种网页一般来说用户很少关心,想通过搜索排名带来流量的可能性也极低。所以流动到这些搜索价值不高网页的权重浪费了很大一部分。

网站禁止收录机制

要确保页面不被收录,需要使用robots文件或Meta Robots标签。

搜索引擎蜘蛛访问网站时,会查robots.txt文件,robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容。建议就算允许抓取所有内容,也要建一个空的robots.txt文件,放在根目录下。
主流搜索引擎都遵守robots文件指令,robots.txt禁止抓取的文件搜索引擎将不访问,不抓取。但要注意的是,被robots文件禁止抓取的URL还是可能出现在搜索结果中。只要有导入链接指向这个URL,搜索引擎就知道这个URL的存在,虽然不会抓取页面内容,但是可能以下面几种形式显示在搜索结果中:
只显示URL,没有标题、描述。
显示重要目录收录的标题和描述。
导入链接的锚文字显示为标题和描述。
要想使URL完全不出现在搜索结果中,需要使用页面上的meta robots标签。
使用了noindex meta robots标签的页面会被抓取,但不会被索引,页面URL不会出现在搜索结果中。

网站子域名和目录和如何选择

搜索引擎通常会把子域名当做一个基本独立的站点看待,www.seodaxue.com其实是seodaxue.com的一个子域名,只是约定俗成,网站一般以www.seodaxue.com为首选域URL。

子域名的权重比一级目录稍微高一点,因为搜索引擎会把这个URL当做网站的首页。主域名很多时候会传递一小部分信任度给子域名。子域名比目录天生的权重和排名能力稍微高一点。但从SEO角度看,建议尽可能使用目录,而不是子域名。

子域名和主域名是两个完全不同的网站,要推广的也是两个网站,所有的优化工作都要多做一遍,尤其是外部链接建设,网站PR值、权重都会被这两个独立的网站分散。主域名经过外链建设获得高权重,不意味着子域名就获得了高权重。
子域名的使用会使网站变多,同时使每个子域名网站变小。目录会使一个网站越做越大。网站越大,包含的内容自然就越多,对用户的帮助越大,它所累积的信任度就更高。

在某些情况下,子域名是更适当的:

1.网站内容足够多,每一个子域名下涵盖的内容都足以成为一个独立的网站。
2.跨国公司不同国家的分部或分公司,采取子域名有利于建立自己品牌。而且各个分公司的网站内容很可能是由不同国家的团队自行维护的。
3.公司有不同的产品线,而且相互之间联系不大,或者完全是以不同的品牌出现的,这时每一个品牌或产品线可以用子域名甚至独立域名。
4.分类信息网站,不同城市使用不同的子域名。
5.平台类网站,每个用户都有自己相对独立的展示平台,使用自己的子域名对品牌建设、推广有好处。

注意:除了网站规模和类型,子域名和目录的选择有时还得看其他情况。目标搜索引擎如果是百度,使用子域名或独立域名更有利,因为百度给网站首页权重更高。相比之下,Google给予网站首页、目录及内页大致相同的机会。如果是做英文网站,采用目录结构,不会出现明显的不利。

网站的物理结构分类

网站物理结构指的是网站目录及文件所在的位置所结构,一般来说分为两种。一种是扁平式的,也就是所有网页文件都存在网站根目录下;另一种是树形结构或叫做金字塔结构,文件目录按照层级放置。

1.扁平结构。比较适合小型网站,大中型网站把文件都放在根目录下管理不便。扁平物理结构的一个优势是,根目录下的文件比深层目录中的文件天生权重高一点,排名能力好一点。
2.树形结构。根目录之下以目录形式分成多个分类,然后在每一个分类下再放上属于这个分类的具体产品文章页面。树形结构建议分类不超过两级。

避免网站蜘蛛陷阱8个方面

蜘蛛陷阱是指阻止蜘蛛程序爬行网站的设计技术,对搜索引擎来说很不友好,如flash、框架等。

1 Flash。在网页的某一小部分使用Flash增强视觉效果是很正常的,对搜索引擎抓取和收录没有影响。但是如果网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎是无法读取Flash文件中的文字内容和链接的。
有的网站在首页放一个Flash动画片头,用户访问网站看完片头后被转向到真正的HTML版本的文字网站首页。搜索引擎不能读取Flash,也没办法从动画跟踪到HTML版本页面。
如果Flash效果是必需的,至少也需要在首页加上一个通往HTML版本的链接。这个链接应该是在Flash文件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版本页面。

2.Session ID。有些网站使用Session ID跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中,对搜索引擎的访问也当新用户加上一个不同的Session ID,是最常见的蜘蛛陷阱之一。
搜索引擎遇到Session ID,成功判断出Session ID就可以去掉Session ID,收录正常URL,判断不出来,要么不愿意收录,要么收录多个带有不同Session ID的URL,内容却完全一样,形成大量复制内容,这两种情况对网站优化都不利。
通常建议跟踪用户访问应该使用cookies而不要生成Session ID,或者让程序判断访问者是蜘蛛还是普通用户,如果是搜索引擎蜘蛛,则不生成Session ID。

3.网页跳转。搜索引擎对301以外转向比较敏感,如302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。如果必须转向,301转向是搜索引擎推荐的用于网址更改的转向,可以把页面权重从旧网址转移到新网址。其他转向方式都对蜘蛛爬行不利,尽量不要使用301转向以外的跳转。

4.框架结构。不利于搜索引擎抓取,搜索引擎也无法判断框架中的页面内容应该属于主框架,还是属于框架调用的文件。网站设计建议不使用框架结构。

5.动态URL。动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态URL不利于搜索引擎蜘蛛爬行,如果参数多,url长,应该尽量做伪静态规范url。

6.JavaScript链接。由于JavaScript可以创造出很多吸引人的视觉效果,有些网站喜欢使用JavaScript脚本生成导航系统。这也是比较严重的蛛蛛陷阱之一。建议链接必须使用最简单标准的HTML链接,尤其是导航系统。用CSS做导航系统一样可以实现很多视觉效果。

7.网站要求登录。有些网站内容放在需要用户登录之后才能看到的会员区域,这部分内容搜索引擎无法看到。蜘蛛不能填写用户名、密码,也不会注册。

8.强制使用Cookies。有些网站为了实现某种功能,如记住用户登录信息、跟踪用户访问路径等,强制用户使用Cookies,用户浏览器如果没有启用Cookies,页面显示不正常,强制使用Cookies只能造成搜索引擎蜘蛛无法正常访问。

对搜索引擎友好的网站设计注意三个方面事项

在抓取、索引和排名时对搜索引擎蜘蛛友好的网站设计就是搜索引擎友好喜欢的。

1.搜索引擎蜘蛛能不能找到网页。要让搜索引擎发现网站首页,就必须要有外部链接连到首页,找到首页后,蜘蛛沿着内部链接找到更深的内容页,所以要求网站要有良好的结构,符合逻辑,并且所有页面可以通过可爬行的普通HTML链接达到。JavaScript链接、Flash中的链接等搜索引擎蜘蛛一般不能跟踪爬行,就会造成收录问题。

网站所有页面离首页点击距离不能太远,最好在四五次点击之内,建议网页层次设计三层以内。要被搜索引擎收录,页面需要有最基本的权重,良好的网站链接结构可以适当传递权重,使尽量多的页面达到收录门槛,建议站内锚文本。

2.找到网页后能不能抓取页面内容。被发现的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、Session ID、整个页面是Flash、框架结构、可疑的转向、大量复制内容等都可能使搜索引擎敬而远之。不希望被收录文件使用robots文件或meta robots标签禁止收录。

3.被抓取页面后怎样提炼有用信息。关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可以帮助搜索引擎理解页面内容,提取有用信息。

网站结构优化的4个目的

从SEO角度看,优化网站结构要达到以下几个目的。

1.提升用户体验。用户访问一个网站必须能够不假思索地自如点击链接,找到自己想要的信息。这有赖于良好的导航系统,适时出现的内部链接,准确的锚文字。从根本上说,用户体验好的网站也是搜索引擎喜欢的网站,用户在网站上的行为方式也很可能被计入排名算法中。

2.提高网站收录率。网站页面的收录在很大程度上依靠良好的网站结构。理论上,清晰的网站结构很容易说清楚,只要策划好分类或频道,然后在分类下加入文章产品页面,整个网站自然形成树形结构。

3.合理分配重要页面权重。网站内部页面权重分配很重要,哪些页面具备比较高的排名能力,取决于页面得到的权重。SEO人员必须有意识地规划好网站所有页面的重要程度,通过链接结构把权重倾向重要页面。

4.提升关键词相关性。锚文字是排名算法很重要的一部分,网站内部链接锚文字是最主要的增强关键词相关性的方法之一,要用合理的结构增加重要页面的锚文本链接,集中重要页面的权重。

设置404页面注意事项

用户访问网站上不存在的页面时,服务器通常应该返回404错误。如果站长没有在服务器端设置404页面,用户浏览器显示的将会是一个默认错误页面,这对用户体验不好。应该配置一个404页面。

1.404错误代码。当页面不存在时,一定要返回404代码。有些站长觉得既然页面不存在,就将用户301转向到首页,这也是搜索引擎不友好的设置,会让搜索引擎认为网站上有大量与首页内容相同的页面。

也不要使用JavaScript转向或Meta Refresh转向,尤其是时间比较短的如10秒以下的Meta Refresh转向。这些转向都使搜索引擎误以为页面存在,却返回重复内容。不存在页面一定要确保正确返回404状态码。可以用后面SEO工具部分介绍的服务器头信息检测工具,任意输入一个肯定不存在的URL,看服务器返回2.404页面设计注意事项。格式化404页面设计上需要注意几点。

一是404页面要保持网站统一模板、设计风格、logo及名称,不要让用户弄不清自己到了哪个网站上。

二是404页面应该在最醒目的位置显示错误信息,明确提示用户,要访问的页面不存在。还可以加上页面已删除、用户输入了错误的地址、链接中的地址错误、页面已转移到新的地址等。

三是错误信息下面还可以为用户提供几种点击选项,如网站地图,包括通往首页和重要分类页面的链接,建议用户可以访问的页面,还可以加上站内搜索框。

3.404错误与外链。站长可以用工具检查有哪些外部网站连向了哪些不存在的页面。这些外部链接连向不存在页面是个浪费,可以充分利用,或者联系对方站长改正错误地址,或者将错误地址做301转向到正确页面,或者干脆在本来不存在的URL上建一个页面,接收这些外部链接的权重。

网站的链接结构注意事项

网站链接结构也称为逻辑结构,是由网站内部链接形成的链接的网络结构,一般合理的链接结构通常是树形结构。

注意事项如下:
1.首页链接向所有分类首页。
2.首页一般不直接链接向产品页,除了几个需要特殊推广的产品。
3.所有分类首页连向其他分类首页,一般以网站导航形式体现。
4.分类首页都链接回网站首页。
5.分类首页链接向本分类下的产品页。
6. 分类首页一般不链接向其他分类的产品页。
7.产品页都链接向网站首页,一般以网站导航形式体现。
8.产品页链接向所有分类首页,一般以网站导航形式体现。
9.产品页可以链接向同一个分类的其他产品页。
10.产品页一般不链接向其他分类的产品页。
11. 在某些情况下,产品页可以用适当的关键词链接向其他分类的产品页。
对搜索引擎来说更重要的是链接结构,而不是物理结构。不少人有误解,认为物理结构比较深的页面不容易被搜索引擎收录,如果这个页面在网站首页上有一个链接,对搜索引擎来说它就是一个仅次于首页的链接结构意义上的二级页面。收录容易与否在于页面处于链接结构的什么位置,离首页有几次点击距离,而不是它的目录层次。

网站清晰导航应该注意的五个方面

清晰的导航系统是网站设计的重要目标,对网站信息架构、用户体验影响重大。站在SEO的角度,网站导航系统应该注意以下几点。

1.文字导航。尽量使用最普通的HTML文字导航,不要使用图片作为导航链接,更不要使用JavaScript生成导航系统,也不要用Flash做导航,不要在导航上给搜索引擎设置任何障碍。

2.点击距离及扁平化。网站页面与首页点击距离越近越好,内页离首页不要超过四五次点击,应该在链接结构上使网站尽量扁平化。

3.锚文字包含关键词。导航系统中的链接通常是分类页面获得内部链接的最主要来源,数量巨大,其锚文字对目标页面相关性有相当大的影响,因此分类名称应尽量使用目标关键词,分类名称以2~4个字为宜。

4.面包屑导航。面包屑导航对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的最好方法。正确使用面包屑导航使网站架构比较清晰。

5.避免页脚堆积。随着SEO被更多站长认识,近几年有一种在页脚堆积富含关键词的分类页面链接的倾向,搜索引擎比较反感这种做法,常常造成某种形式的惩罚。