5月20日百度站长平台在北京举办了“2013百度站长平台高端SEO俱乐部”活动,邀请了多家知名网站、资深SEOR及站长参与,就百度站长平台、百度分享的动态,及近期推出的“石榴”与“起源”原创算法、原创项目等问题,进行了深度的交流与分享。现场的网站负责人们提了很多宝贵的反馈和建议,Lee也就站长们普遍反映的问题一一进行了解答。

 

Lee在沙龙活动中分享的主要内容:

  • 站长平台新工具:百度站长平台近期将推出网站异常提醒功能,及时告知网站负责人网站的异常信息,例如网站出现大量死链、网站遭遇黑客攻击、错误屏蔽百度蜘蛛服务器以及百度抓取出现异常等情况,增强百度与网站主之间的互动。
  • 百度分享:功能将全新升级,分享的数据将会应用于搜索系统中。
  • 原创项目:百度原创项目已启动,将会逐步覆盖更多的原创网站,鼓励并优待原创内容。 
  • 外链判断:lee对之前的<<谈外链判断>>文章中的内容进行了详细解读。

以下为本次活动中的精彩问答:


 一、百度分享方向方面的问题:


1、能否分享下大网站使用百度分享之后的数据,比如:分享量多少,流量增加了多少,给还未使用的网站一些参考?

Lee:我们近期会整理下这类数据,推出一些实例分享。 


2、百度分享的速度问题:百度分享的性能是否可以做进一步优化?

Lee:我们Z近会推进性能优化,解决加载速度的问题。 


3、百度分享,有安装百度分享的网站,网站流量不高,但是分享量很大,是什么原因?

lee:这方面可能存在作弊的情况,我们会优化这部分数据,但是不会去惩罚,只是会把额外展现的收益去掉。 


4、百度搜索结果中,网站分享量不更新的问题?

lee:搜索中的展现和预期有些不符,我们已经安排去优化这部分数据,让这部分数据的展现更准确。


 二、百度站长工具相关的问题:


1、sitemap提交:提交了之后,只收录了两个页面,sitemap的使用效果是什么样的?

lee:这样不太符合预期,但是系统会对网页内容进行判断,区分网页的时效性价值,时效性高的内容会优先快速的收录,sitemap收录效果我们这边也会进行监控分析。 


2、google会显示sitemap中多少url建立了索引,百度是否可以显示。

lee:二者的应用方不同,google收录了,但是一般页面的都不会被用户搜索到;百度收录的话,展现会比较好,只是建库的时间会稍微长一点。

索引的进度方面:sitemap近期会升级,会将抓取的进度进行展现。 


3、百度站长平台工具里的抓取异常报错提示,能不能按照url进行分类?

lee:近期抓取异常工具会升级,将各种抓取异常情况进行细分。还可设置监控的网页,定制的量会比较大一些。  


4、baiduspider对网站robots文件的访问频率是什么样的,百度一天只访问一次,但是google访问的比较多,百度只访问一次还是多次?robots中屏蔽了动态url,但是在百度中还是展现。 

lee:robots一般是几个小时抓一次,但是要根据网站的情况进行区别,robots生效的时间可能会有点长。且要删掉之前已经抓取的url,会涉及到更新周期的问题,更新周期时间会长一点。 


5、时效性比较高的资讯类内容,11年的内容,搜索的时候仍排到首页,投诉之后未处理。

lee:这是个比较复杂的算法问题,比较老的历史页面,积累了比较多的权重;搜索引擎会考虑时效性,新的网页会加权后与老页面去pk,偶尔会出现老页面过多或者新页面过多的情况,这个就是个平衡的问题。我们还是会争取通过系统去解决这个问题。 


6、死链提交:提交的文件被频繁的来抓。

lee:文件中有更新周期,需要合理设置这个周期,目前是会根据设置的更新周期来抓取。 


7、异常提示方面能否给一些页面更深入的异常提示,如内容质量不高等

lee:异常信息方面会给一个详细的展示,但是对于内容方面的问题需要想办法看下,需要一个合适的产品形式才能去做,这个比较敏感。 


8、抓取异常报错,能不能提供抓取的页面是哪个,目前内部查比较困难,

lee:这个量会比较大,不过我们会先评估下这方面的数据,再看怎样解决这个问题。


三、百度网页搜索相关问题 


1、有一系列网页,按照技术规则,一部分无内容,一部分有内容(百万级的),会不会造成整个pattern受影响。如果出结果,直接将这些页面设为404会不会有影响?

lee:前者可能会有影响。后者404的页面希望数量不要太大,每个网站都会有一定的抓取压力,如果垃圾页面过多,会影响对其他新网页的抓取。  


2、如果一个页面中推荐很多相关的内容,百度会怎样看这个页面?

lee:用相关专题,相关链接形式展开是合适的,但是不要罗列堆积关键词。  


3、网站针对不同地区做的地域跳转,是否会对网站在搜索引擎中的表现产生影响的?

 lee:baiduspider出口目前在有限的几个地区,之后会进行扩展,同时也准备针对这方面的问题做这些规范,希望大家按规范填写,现在已开始调研。


四、百度原创项目相关问题:


1、能不能有工具直接看到原创的效果

lee:这个也在考虑的计划中,将会整体看下这个工具。


2、小网站写了原创,大网站转载,spider去小网站不频繁,百度会先收录大网站,之后收录小网站,百度怎样去判断原创。

lee:我们之后希望中小网站能够通过ping机制ping给百度,这样就可以从时间上进行初步区分。大网站有用户等权重积累,用户也倾向于点击大网站的链接,我们希望通过适当引导改变这种现状。


3、原创识别后,排序的权重有多高?

lee:具体的排序会根据用户的需求query在排序上有所区分。用户需求明确搜原创文章时,原创的排名肯定会比较高。但是需求比较泛时,就不一定了。 


4、原创是不是排名加分的因素之一?

Lee:原创是比较重要的一个因素,在相同的内容中,优先出原创结果。


5、百度新闻啥时候能够应用原创?

lee:原创现在在百度新闻中已近同步上线。