网页的中文URL应该如何编码才能有利于SEO?
2008.02.26 - 3条评论 »
最近在关注SEO方面的技术,碰到了一个关于中文的URL编码方面的问题。
很多朋友表示百度无法识别经过utf-8编码后的url链接。
星箭认为,是百度故意不识别utf-8编码后的url链接。
但是我注意到,这个现象应该是Google和Baidu对于编码后的url链接采用了不同的解码方式导致。
我们来看赶集网的热门标签页和土豆网的标签频道在搜索引擎中的表现:
先看赶集网的,赶集网的url编码采用了gb2312的编码方式
这是百度下的搜索结果页

这是google下的搜索结果页面

我们发现,baidu将赶集网的url编码转化为中文,而google则保留了原始链接。
再来看土豆网,土豆网采用了uft-8的url编码方式
这是在百度下的搜索结果页面

这是在google下的搜索结果页面

土豆的url被百度解码以后变成了乱码,而在google下则能正确地还原为中文。
结论:
- google对url采用utf-8的解码方式,百度则采用gb2312的解码方式;
- 对于一个网站来说,如果从baidu过来的流量比较大,可以尝试使用gb2312的url编码方法;
- google能把纯中文的url转化为utf-8编码,而baidu则完全无法收录。
附:
推荐一个Encode/Decode工具:http://seohelper.cn/tools/urlencode

评论
思路很清洗,结论很实用,学习了
“baidu则完全无法收录”?你确定?无法正确显示是对的,但至于是不是无法解析URL中的中文,我也很想知道。
@伍子欣 确实是这个情况。
看一下淘宝UED首页(http://ued.taobao.com/blog/)有这篇文章:《OpenSearch 初探》
链接为:http://ued.taobao.com/blog/2008/06/18/opensearch-初探/
google上的搜索结果:http://www.google.com/search?q=OpenSearch 初探&ie=utf-8&oe=utf-8&aq=t
baidu上的搜索结果:
http://www.baidu.com/s?wd=OpenSearch site:ued.taobao.com
发现百度无法收录这个页面。
发表您的评论