从技术层面分析百度和谷歌

2014/4/13 22:13:42

从技术层面分析百度和谷歌

1，搜索引擎必要对抓取到的效果进行管理。当索引效果越来越多时，保证存储和查询速度，保证数万台服务器内容同等的难度越来越高。Google于03至06年左右宣布了三篇论文，描述了GFS、BigTable、MapReduce三种技术以解决这些题目。因为Google并没有宣布算法细节，因此由雅虎牵头，在06年左右建立了开源项目Hadoop，目的是根据Google的三篇论文，实现一个大规模的管理计算体系。但直到08年，Hadoop同Google宣布的一些关键指标仍有几倍的差距。百度曾经由王选院士的一个博士带领，想基于Google论文自力实现(金字塔计划)一个本身的体系，但开发难度过大项目短命，Z终也转向了Hadoop。现在，Amazon、Facebook、Yahoo包括百度都在大规模应用Hadoop，而Google已经从2010年开始迁移到新的三驾马车Caffeine、Pregel、Dremel上了。单就搜索技术而言，Google不是领先百度，而是领先全世界。

2，2009-2012年，Google宣布了世界上第一个全球化的数据库体系Spanner，这套体系将分布在全球各地的数据中间连接到一路，行使原子钟和GPS，打破了地理间隔，实现了全球规模具有同等性和实时性的数据库。在Google之前，许多人认为这种体系不可能做出来，但Google做到了[1]。

另外，除了搜索，Google在深度学习和机器人方面也是全球领先的，尤其是后者。尽管百度也有深度学习研究院，但在这两方面跟Google比起来完全是空白。

事实上，让百度来和谷歌比是很不公平的，搜索只是Google的一个部门，但却是百度一整个公司。Google的竞争对手是Apple、Amazon、Facebook和Microsoft，百度的竞争对手是360、搜狗。Google没了搜索，还有Chrome、Android、Motorola、Youtube，百度没了搜索，那就什么都没有了。

Exclusive: Inside Google Spanner, the Largest Single Database on Earth

本文作者：Kenny Chao 文章来源：知乎

推荐文章

网站SEO优化

SEO操作			SEO类型

网站定位
明确网站定位、用户定位,根据产品属性结合用户搜索习惯进行关键词研究和建立。
站内优化
网站结构及HTML代码优化、标题、描述、关键词定义；
图片ALT优化、快照缩略图优化、H\STRONG\FONT\P\DIV\LI标签优化
链接A标签设置、URL优化、死链、空链、#号链等处理
文本匹配与关键字设置、导航优化、目录优化、详情页优化
站外优化
百度收录主动请求代码、网站Sitemap.xml索引设置
高质量外链和友情链接建设、URL引导收录提交
搜索体验及缩略图优化、网页快照优化、权重评级提升
文章发布技巧
标题醒目、准确传递文章思想，标题具备高度的总结性和概括性
关键字设置从文章标题里提炼，必修按词组提炼有指数的关键词
文章摘匹配关键字并统揽全局，摘要必须准确表达文章的观点
文章配图必须121x75的倍数，文章发布后必做URL收录提交
SEO策略与技巧
确保链接被收录形成快照，确保网页快照参与权重评级
标题用部分匹配原则，描述用完整匹配原则
排名靠前的内链引导靠后的，提高搜索展现率和有效点击
内容用完整匹配、关键字加粗，内链锚文本与导出链接相关
链接层级扁平化、目录简短，合理使用网站导航和分类
重要链接放到第一屏，文案内容匹配长尾词而非主词
快速排名
单个键词是否进入搜索首页或前三
关键字必须在搜索引擎结果有排名
网站不需要过多调整、局部优化
排名速度快、一般2周左右
按约定验收客户指定的关键词
整站优化
整个网站从搜索引擎过来的流量
只要网站收录大于100条即可
网站每级都要做站内调整优化
整站优化初期相对较慢
根据主词持续扩展长尾词

SEO问题（FAQs）

网站TDK怎么定义?

明确网站定位、用户定位,根据产品属性结合用户搜索习惯进行关键词研究和建立。
站内优化包含什么内容？
站内优化主要包含网站代码优化和网站内容调整，如下：
1. 网站结构及HTML代码优化、标题、描述、关键词定义；
2. 图片ALT优化、快照缩略图优化、H\STRONG\FONT\P\DIV\LI标签优化
3. 链接A标签设置、URL优化、死链、空链、#号链等处理
4. 文本匹配与关键字设置、导航优化、目录优化、详情页优化

深度传播，精准获客

网站优化邀请您一起推进营销精准化、简单化！