什么是动态网址与静态网址
在跟网络管理员沟通时经常会出现这种情形,一些广为传播的理念可能在曩昔是精确的,但是可能已不再切合目前的情况了。当我们Z近在跟几个同伙谈及关于网址的结构时就遇到这种情况。其中一个同伙很忧虑动态网址的使用,甚至认为"搜索引擎无法处理动态网址"。另外一个同伙觉得动态网址对搜索引擎来说完全不是题目,那些都是曩昔的事了。还有一个甚至说他从来都搞不懂动态网址和静态网址相比有什么区别。对于我们来说,这一刻使我们决定要好好研究一下动态网址和静态网址这个话题。首先,让我们来界定一下我们要评论辩论的主题:
什么是静态网址?
一个静态网址,顾名思义,就是一个不会发生转变的网址,它通常不包含任何网址参数。例如:http://www.soupv.com/example4673/archive/january.htm。您可以在搜索框里输入 filetype:html在谷歌上搜索静态网址。更新此种类型网址的页面会比较耗费时间,尤其是当信息量增加很快时,由于每一个单独的页面都必须更改编译代码。这也是为什么网站管理员们在处理大型的、经常更新的网站,像在线购物网站、论坛社区、博客或者是内容管理体系时,会使用动态网址的缘故原由。
什么是动态网址?
假如一个网站的内容存储于一个数据库,并且根据要求来表现页面,这时就可以使用动态网址。在这种情况下,网站提供的内容基本上是基于模板情势的。通常情况下,一个动态网址看起来像如许:http://code.google4673/p/google-checkout-php-sample-code/issues/detail?id=31。您可以通过探求像? = &如许的符号识别出动态网址。动态网址有一个缺陷是不同的网址可以拥有雷同的内容。如许导致不同的用户可能链向含有不同参数的网址,但是这些网址却都含有雷同的内容。这也是为什么网络管理员偶然候想要将这些动态网址重写成静态网址的缘故原由之一。
我是不是应该让我的动态网址看起来是静态的呢?
在处理动态网址时,盼望您能了解以下几点事实:
要精确地生成和维护从动态网址到静态化网址的重写变化现实上是一件很难的事情。
将原始的动态网址提供应我们会比较安全,请让我们来处理诸如探测和避开那些有题目的参数的事情。
假如您想重写网址,请去掉那些不需要的参数,同时请保持它动态网址的样子。
假如您想提供一个静态网址代替动态网址,那么您应该切实地生成响应的静态内容。
静态和动态网址,Googlebot 对于哪一个识别得更好呢?
我们遇到过许多网站管理员,像我们的同伙那样,认为静态或者看起来是静态的网址对于网站的索引和排名是有上风的。这种看法是基于如许一个假设,即认为搜索引擎在抓取和分析含有会话标识 (session ID) 和来源追踪器 (source tracker) 的网址时是有题目的。然而,事实是,谷歌在这两个方面都有了相称的进展。就点击率来说,静态网址可能略微有些上风,由于用户可以很容易地读懂这个网址。但是,就索引和排名来说,使用数据库驱动网站并不意味着显明的劣势。相比较将参数隐蔽以使他们看起来是静态的网址来说,我们更盼望网站将动态的网址直接提供应搜索引擎。
如今,让我们来看一些有关动态网址的广为传播的看法,并且来纠正一些蒙蔽网站管理员的假说。:)
传说:"动态网址不能被抓取。"
事实:我们可以抓取动态网址并且诠释不同的参数。假如您为了让网址看起来像是静态的,而隐蔽那些可以给谷歌提供有价值信息的参数,如许做反而会给该网址的抓取和排名带来麻烦。我们的建议是:请不要将一个动态网址改换格式以使其看起来是静态的。尽可能地使用静态网址来表现静态内容是可取的,但在您决定展示动态内容的情况下,请不要将参数隐蔽起来从而使他们看起来像是静态的,由于如许做会删除掉那些有助于我们分析网址的有效信息。
传说:"动态网址的参数要少于3个。"
事实:对于参数的数量是没有限定的。但是,一个好的经验是不要让您的网址太长(这个适用于所有的网址,不论是静态的照旧动态的)。您可以去掉一些对于 Googlebot 来说不紧张的参数,给用户一个悦目一点的动态网址。假如您不能确定可以去掉哪些参数,我们建议您将动态网址中所有的参数都提供应我们,我们的体系会弄晓畅哪一些是不紧张的。将参数隐蔽起来会影响我们精确地分析您的网址,我们也就不能识别这些参数,一些紧张信息可能也因此丢失了。
下面一些是我们认为您可能会存在疑问的一些题目。
这是否意味着我应该完全避免重写动态网址?
这是我们的建议,除非您能确保您只是去掉多余的参数,或能够把所有有可能有不良影响的参数完备地删除。假如您把本身的动态网址任意修改使其看起来像是静态的,您要清楚如许做是有风险的,有可能会导致有些信息不能被正常地编译和识别。假如您想给您的网站再增长一个静态的版本,请您肯定要提供一个真正意义上的静态的内容,比如生成那些可以通过网站响应路径而获取的文件。假如您仅仅是修改了动态网址的体现情势,而没有真正提供静态的内容,那么您有可能适得其反。请直接把标准的动态URL提供应我们,我们会主动找出那些冗余的参数。
你能给我举一个例子么?
假如您有一个像下面如许标准格式的动态网址:foo?key1=value&key2=value2,我们建议您不用改动它,谷歌会决定哪些参数可以去掉;或者您可以为用户去掉那些不需要的参数。不过要稳重,仅仅去掉那些不紧张的参数。这里有一个含有多个参数的动态网址的例子:
www.soupv.com/example4673/article/bin/answer.foo?language=en&answer=3&sid=98971298178906&query=URL
language=en – 标明这篇文章的语言
answer=3 – 这篇文章含稀有字3
sid=8971298178906 – 会话标识代码是8971298178906
query=URL – 使这篇文章被找到的查询是[URL]并不是所有的参数都提供额外的信息。所以将这个网址重写为www.soupv.com/example4673/article/bin/answer.foo?language=en&answer=3 可能不会引起任何题目,由于所有不相干的参数都去掉了。
下面是一些经过认为修改而看起来像是静态网址的例子。相比较没有重写、直接提供动态网址来说,这些网址可能会引起更多抓取方面的题目。
www.soupv.com/example4673/article/bin/answer.foo/en/3/98971298178906/URL
www.soupv.com/example4673/article/bin/answer.foo/language=en/answer=3/ sid=98971298178906/query=URL
www.soupv.com/example4673/article/bin/answer.foo/language/en/answer/3/sid/ 98971298178906/query/URL
www.soupv.com/example4673/article/bin/answer.foo/en,3,98971298178906,URL假如您将动态网址重写成如上所述的示例的话,可能会导致我们许多不需要的抓取,由于这些网址中都含有会话标识 (sid) 和查询 (query) 参数的可变值,这无形中生成了许多看起来不同的 URL ,而他们包含的内容却是雷同的。这些格式让我们很难理解通过这个网址返回的现实内容和参数URL以及98971298178906是无关的。不过,下面这个重写的例子却将所有无关的参数都去掉了:
www.soupv.com/example4673/article/bin/answer.foo/en/3尽管我们可以精确地处理这个网址,我们照旧不鼓励您使用如许的重写。由于它很难维护,而且一旦一个新的参数被加到原始的动态网址,那么这个网址就必要立刻更新。不如许做的话就会再次导致生成一个隐蔽了参数的貌似静态网址的 URL 。所以Z好的解决方法是通常将动态网址保持他们原来的样子。或者,假如您去掉不相干的参数,请记住肯定要保持这个网址是动态的: