搜索引擎检索系统概述

2014/1/21 15:15:07

前面简要介绍过了搜索引擎的索引系统，实际上在建立倒排索引的Z后还需要有一个入库写库的过程，而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部，并且对数据进行压缩，这涉及到的过于技术化在此就不多提了。今天简要给大家介绍一下索引之后的检索系统。

检索系统主要包含了五个部分，如下图所示：

索引&检索.jpg

（1）Query串切词分词即将用户的查询词进行分词，对之后的查询做准备，以“10号线地铁故障”为例，可能的分词如下（同义词问题暂时略过）：

10 0x123abc

号 0x13445d

线 0x234d

地铁 0x145cf

故障 0x354df

（2）查出含每个term的文档集合，即找出待选集合，如下：

0x123abc 1 2 3 4 7 9…..

0x13445d 2 5 8 9 10 11……

……

（3）求交，上述求交，文档2和文档9可能是我们需要找的，整个求交过程实际上关系着整个系统的性能，这里面包含了使用缓存等等手段进行性能优化；

（4）各种过滤，举例可能包含过滤掉死链、重复数据、色情、垃圾结果以及你懂的；

（5）Z终排序，将Z能满足用户需求的结果排序在Z前，可能包括的有用信息如：网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等，之后会详细给大家介绍。

推荐文章

网站SEO优化

SEO操作			SEO类型

网站定位
明确网站定位、用户定位,根据产品属性结合用户搜索习惯进行关键词研究和建立。
站内优化
网站结构及HTML代码优化、标题、描述、关键词定义；
图片ALT优化、快照缩略图优化、H\STRONG\FONT\P\DIV\LI标签优化
链接A标签设置、URL优化、死链、空链、#号链等处理
文本匹配与关键字设置、导航优化、目录优化、详情页优化
站外优化
百度收录主动请求代码、网站Sitemap.xml索引设置
高质量外链和友情链接建设、URL引导收录提交
搜索体验及缩略图优化、网页快照优化、权重评级提升
文章发布技巧
标题醒目、准确传递文章思想，标题具备高度的总结性和概括性
关键字设置从文章标题里提炼，必修按词组提炼有指数的关键词
文章摘匹配关键字并统揽全局，摘要必须准确表达文章的观点
文章配图必须121x75的倍数，文章发布后必做URL收录提交
SEO策略与技巧
确保链接被收录形成快照，确保网页快照参与权重评级
标题用部分匹配原则，描述用完整匹配原则
排名靠前的内链引导靠后的，提高搜索展现率和有效点击
内容用完整匹配、关键字加粗，内链锚文本与导出链接相关
链接层级扁平化、目录简短，合理使用网站导航和分类
重要链接放到第一屏，文案内容匹配长尾词而非主词
快速排名
单个键词是否进入搜索首页或前三
关键字必须在搜索引擎结果有排名
网站不需要过多调整、局部优化
排名速度快、一般2周左右
按约定验收客户指定的关键词
整站优化
整个网站从搜索引擎过来的流量
只要网站收录大于100条即可
网站每级都要做站内调整优化
整站优化初期相对较慢
根据主词持续扩展长尾词

SEO问题（FAQs）

网站TDK怎么定义?

明确网站定位、用户定位,根据产品属性结合用户搜索习惯进行关键词研究和建立。
站内优化包含什么内容？
站内优化主要包含网站代码优化和网站内容调整，如下：
1. 网站结构及HTML代码优化、标题、描述、关键词定义；
2. 图片ALT优化、快照缩略图优化、H\STRONG\FONT\P\DIV\LI标签优化
3. 链接A标签设置、URL优化、死链、空链、#号链等处理
4. 文本匹配与关键字设置、导航优化、目录优化、详情页优化

深度传播，精准获客

网站优化邀请您一起推进营销精准化、简单化！