为了能在极短的时间内响应用户的查询请求,搜索引擎除了在用户提交查询信息前就生成关键字对应的页面排序列表以外,还需要为那些查询Z频繁的关键字对应的页面排序列表建立缓存机制。

  经过统计,搜索引擎发现关键字查询的集中现象非常明显。查询次数Z多的前20%的关键字大约占了总查询次数的80%(就这是著名的80/20法则)。因此,只要我们对这20%左右的关键字建立缓存就可以满足80%的查询需求。

  由于用户查询时返回的信息主要是与关键字相关的页面排序列表,因此关键字缓存机制的建立主要是针对与关键字相关的页面排序列表。在对常用关键字的页面排序列表建立缓存后,搜索引擎就可以把缓存中的信息返回给用户,这样速度就会非常快,也就能满足绝大部分用户的需求。

  由于互联网中的信息是时刻都在增长的,如果搜索引擎每次都向用户返回同样的信息。不但用户得不到更高质量的信息,其他网站也不能向用户展示潮流的高质量信息,从而造成信息滞后。因此,搜索引擎还会对缓存中的内容进行定期更新。