针对网站404的角度理解

分类: 饭碗 | 标签: | 日期:2009-09-17

,网站莫名其妙的从搜索里降低权限,而网站管理者却并不知道是什么原因引起的。发现自己也没有作弊啊,更不懂优化啊,那为什么被封呢。

这里从404 说起以前我也写过很多类似 404 导致被搜索封掉的文章,并未引起足够的重视。 404错误的处理方式及对SEO的影响还有一个文章,关于404转化到301 可以缓解被封 什么是404 404页面的目的是:告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。

很多开源系统包括CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求,这让网站的权威性大打折扣。404页面该达到怎么样的效果才符合SEO要求?搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时,网站应该返回404状态码,告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码,搜索引擎就会为该链接建立索引,这导致大量不同的链接指向了相同的网页内容。结果是,搜索引擎对该网站的信任度大幅降低。

很多网站存在这个问题:404页面返回的是200或302状态码而不是404状态码。正确建立404页面的方法是:(仅适合Apache服务器)在.htaccess 文件中加入代码: EoDocument 404 /Eo.html 建立一个简单的html404页面命名 Eo.html把 Eo.html放置在网站根目录如果碰到困难,参考本站:错误网页、SEO十万个为什么的.htaccess文件。注意:不要将404错误直接转向到网站首页,这将导致首页不被收录; /Eo.html 前面不要带主域名,否者返回的状态码是302或200状态码。400 无法解析此请求。

401.1 未经授权:访问由于凭据无效被拒绝。 401.2 未经授权: 访问由于服务器配置倾向使用替代身份验证方法而被拒绝。 401.3 未经授权:访问由于 ACL 对所请求资源的设置被拒绝。 401.4 未经授权:Web 服务器上安装的筛选器授权失败。 401.5 未经授权:ISAPI/CGI 应用程序授权失败。 401.7 未经授权:由于 Web 服务器上的 UL 授权策略而拒绝访问。 403 禁止访问:访问被拒绝。 403.1 禁止访问:执行访问被拒绝。 403.2 禁止访问:读取访问被拒绝。 403.3 禁止访问:写入访问被拒绝。 403.4 禁止访问:需要使用 SSL 查看该资源。 403.5 禁止访问:需要使用 SSL 128 查看该资源。 403.6 禁止访问:客户端的 IP 地址被拒绝。 403.7 禁止访问:需要 SSL 客户端证书。 403.8 禁止访问:客户端的 DNS 名称被拒绝。 403.9 禁止访问:太多客户端试图连接到 Web 服务器。 403.10 禁止访问:Web 服务器配置为拒绝执行访问。 403.11 禁止访问:密码已更改。 403.12 禁止访问:服务器证书映射器拒绝了客户端证书访问。 403.13 禁止访问:客户端证书已在 Web 服务器上吊销。 403.14 禁止访问:在 Web 服务器上已拒绝目录列表。 403.15 禁止访问:Web 服务器已超过客户端访问许可证限制。 403.16 禁止访问:客户端证书格式错误或未被 Web 服务器信任。 403.17 禁止访问:客户端证书已经到期或者尚未生效。 403.18 禁止访问:无法在当前应用程序池中执行请求的 UL。 403.19 禁止访问:无法在该应用程序池中为客户端执行 CGI。 403.20 禁止访问:Passpot 登录失败。 404 找不到文件或目录。 404.1 文件或目录未找到:网站无法在所请求的端口访问。

注意 404.1 错误只会出现在具有多个 IP 地址的计算机上。如果在特定 IP 地址/端口组合上收到客户端请求,而且没有将 IP 地址配置为在该特定的端口上侦听,则 IIS 返回 404.1 HTTP 错误。例如,如果一台计算机有两个 IP 地址,而只将其中一个 IP 地址配置为在端口 80 上侦听,则另一个 IP 地址从端口 80 收到的任何请求都将导致 IIS 返回 404.1 错误。只应在此服务级别设置该错误,因为只有当服务器上使用多个 IP 地址时才会将它返回给客户端。 404.2 文件或目录无法找到:锁定策略禁止该请求。 404.3 文件或目录无法找到:MIME 映射策略禁止该请求。 405 用于访问该页的 HTTP 动作未被许可。

406 客户端浏览器不接受所请求页面的 MIME 类型。 407 Web 服务器需要初始的代理验证。 410 文件已删除。 412 客户端设置的前提条件在 Web 服务器上评估时失败。 414 请求 UL 太大,因此在 Web 服务器上不接受该 UL。 解决404方法 ,有很多高人提议 将404 转化为301 来执行。

我试验了,效果甚好。 将方法公布出来 在服务器iis里,先将 404 错误定义到 /404.htm 然后将404.htm 用301 定义到首页,或者错误的页面。我用了这个方法以后,搜索再也没有封过,一点小小的经验,可当护身符,保你搜索不死。搜索引擎对404大肆封杀行为也表明了目前搜索引擎对404 对seo 不能轻易区别,而用重典,一刀切。是搜索引擎极不负责的表现。 也显示搜索公司的无奈。

自定义404错误页面是提供用户体验的很好的做法,但在应用过程中往往并未注意到对搜索引擎的影响,譬如:错误的服务器端配置导致返回“200”状态码或自定义404错误页面使用Meta efesh导致返回“302”状态码。正确设置的自定义404错误页面,不仅应当能够正确地显示,同时,应该返回“404”错误代码,而不是“200”或 “302”。虽然对访问的用户而言,HTTP状态码究竟是“404”还是“200”来说并没有什么区别,但对搜索引擎而言,这则是相当重要的。

表情:<( ̄︶ ̄)> | (⊙ˍ⊙) | >﹏< | b( ̄▽ ̄)d | (─.─||) | (^_-)

[ Ctrl+Enter提交 ]