下午和孙波一起与百度Lee、Google朱健飞进行了对谈,气氛挺热烈,我个人还有点意犹未尽,但由于时间关系,比预定结束时间晚了近半小时后不得不结束了。期待下次和他们交流的机会。
大脚在这里发布了下午议程的录音,可以听到全部访谈内容。下面简单记录对谈主要内容。
关于百度Lee、Google朱健飞及Matt Cutts
百度Lee是中国站长圈大名鼎鼎的人物,百度搜索部门员工,近两年在SEO社区比较活跃,热情回答大家的问题。先是在百度站长俱乐部,后搬到百度站长平台社区。实际上百度Lee背后是个团队,其中主要人物是百度王淘。Lee和王淘,以及百度站长平台的员工们,对推动百度与SEO、站长圈交流功不可没。
朱健飞是Google美国总部反垃圾部门中日韩语组负责人。我们上次见面是4年多前南京的SMX会议上,那以后,由于众所周知的原因,Google退出中国,健飞也就没再来过了。其实,Google是非常愿意和SEO们沟通的。健飞很随和、健谈,据Robin说很喜欢卡拉OK,希望以后朱健飞和其他Google员工能多参与SEO圈的活动。
Matt Cutts是Google反垃圾部门的老大,名字在世界SEO行业如雷贯耳。一直以来我们都知道Matt Cutts是Google前100位员工之一,但不知道具体是第几位,这次健飞透露,Matt Cutts的工号是71。
百度点击器的影响已基本控制
我注意到2012年底左右很多曾经有效果的百度点击器纷纷失效,Lee确认百度点击器的影响已经被控制在很小很小的范围。Lee的一句话挺有意思,百度关注的倒不是某一个点击器,而是它的行为和影响。
绿萝、熊猫、企鹅算法名称的由来
百度绿萝算法2013年2月份推出,旨在打击链接买卖。设计这个策略的是位小姑娘,所以命名的权利也给了这位小姑娘,她选择了绿萝这个名称,暗合反作弊的净化之意。
2011年上线的Google熊猫算法和中国一点关系也没有,写算法的那位工程师姓Panda,是个印度人,这个更新算法就被命名为Panda。
后来的企鹅算法主要是对付垃圾链接,名字Penguin是为了延续熊猫算法 — 黑白的动物。可能以后Google需要想更多黑白动物作为算法名称了。
百度怎样判断买卖链接
主要是通过买卖的链接与正常链接的表现行为对比,找出异常之处。我的理解是,不同网站、不同链接,一定有不同的模式,不管站长做得多小心。人类往往只能关注局部,无法在头脑中构建出完整的图景,但大量数据通过算法的提炼会呈现出我们平常看不到的模式、规律。
朱健飞补充说,软文、乱七八糟的博客、论坛垃圾链接等等都是信号,一个网站经常干这些事,搜索引擎就能大致判断这个网站在做链接作弊。
什么样的链接是终极安全的?
Google、百度现在对链接的接受度都在收紧,一些以前还算有效的链接建设方法,比如免费提供模板,现在渐渐失效,有时甚至被认为是作弊,那么什么样的链接才是永远安全的?健飞如预想的回答,自然的链接是最安全的。Lee表示很赞同,这方面他们没有区别。自然,这是个貌似简单,其实难度巨大的事情。
健飞也透露,马上要上线的Penguin新版本影响很大。
搜索引擎工程师来做SEO的话会怎么做?
朱健飞提到,SEO不是件容易的事,他自己来做也不一定能做得更好。即使知道算法,不作弊,又要快速达到好的排名,也是非常困难的。除了认真做内容,还要有创意。公平的世界本来就应该这样,必须花功夫,花心思,没有不费力就得到好结果这种事。
通过垃圾链接可能排名会短期内提升很多,但一旦被检测出来,被惩罚,要去掉这些垃圾链接是非常非常麻烦的。即使能清理完全,网站还是要靠认真、创意吸引高质量链接,重新获得排名,逃不掉这一步。
Lee提到美丽说、蘑菇街等网站SEO就做得很好,也没有买卖或交换链接,建议大家学学他们是怎么做的,别只是关注某些不正当的行业。
关于共同引用(Co-Citation)
Co-citation最初是SEOMoz的Rand提出来的猜想,后来得到很多人的认同。简单举个例子,假如网站A在页面上提到了(注意,不是链接,只是提到或者说引用)网站B和C,那么搜索引擎可能认为网站B和C也是相关的。
与此紧密相关的是共同出现(Co-Occurrence),指的是,比如关键词A与B经常大量一起出现,搜索引擎可能就会认为A与B相关,一个页面获得关键词A的好排名,也很可能因此获得关键词B的排名,就算页面没有优化关键词B,甚至可能没有出现关键词B。
关于共同引用和共同出现,卢松松的博客有一篇翻译帖子可以参考。
朱健飞和Lee都明确否认共同引用或共同出现对排名的影响,更不会取代链接和锚文字。这是我第一次看到搜索引擎明确否认这个猜想。
王淘对这种现象其实有很好的解释,一个网站被引用得多,说明有比较高的权威性,很可能也就有比较多的链接,进而有好的排名,但排名是因为链接,而不是引用,只不过链接和引用是基本成正比的。
我也补充说明了一下,这是比较典型的关联现象与因果的区别。公鸡早上打鸣和太阳升起来是有关联的、总是一起先后发生的现象,但不能说明公鸡打鸣是太阳升起来的原因。
搜索引擎的工程师可以做自己的网站吗?
百度:有严格限制,需要向内审部报备,不经报备私下做网站,一经发现就开除。但其实搜索引擎内部的人经常不擅长做网站。
Google:随便做。工程师自己做的网站经常可以促进算法改进。Google鼓励他们做网站,但做好网站不是那么容易的事。
竞争对手能否通过给我的网站买链接陷害我?
买链接、群发链接会导致被惩罚,那么如果竞争对手给我的网站买链接、群发链接,意图陷害我,能成功吗?Google以前的官方说法是这种可能性非常小,站长不必太担心。我追问朱健飞,所谓可能性小,到底小到多少?是否还是有成功的可能性。朱健飞明确回答,迄今为止,还没有发现这种负面SEO成功影响竞争对手的案例。这也是我第一次听到Google关于这个问题这么明确的说法。当然,这种可能性不能100%排除,只是到目前为止没有发现成功的例子。
如果SEO怀疑某些链接可能带来惩罚,可以在Google Webmaster Tool和百度站长工具中拒绝这些链接,表明这些链接不是自己做的,使这些链接无效。
百度对301转向的处理为什么那么慢?
这与百度的技术体系有关。百度这个系统是分成很多小块,由不同组负责,而301策略的修改需要涉及很多区块的改动,因此比较困难。百度最近在测试一个联合项目,处理301速度比较快,而去对其它功能没有大影响,最近可能和站长平台的一个工具一起上线。我猜测,可能是首选域设置功能。
百度原创内容的判断上什么时候会有改进
Lee介绍,百度正在做一个原创识别的项目,第一期已经上线,但只解决了百分之几的问题。原创识别是个需要比较长时间的过程,希望一两年内可以彻底解决。
与此有关的是百度2013年网站趋势报告中提到的原创星火计划,指的是百度通过算法及人工的方式选出一些原创内容网站,以此验证百度的排名算法,也为算法提供一些素材。我原来以为星火计划是个SEO能报名参加的联盟之类的东西呢,看来误解了。
泛IP+端口站群作弊问题
泛IP+端口站群页面经常秒收,排名也不错,百度是否发现?会怎么处理?Lee回应,百度通常发现问题会尽快解决,这次是因为系统出现了一些问题,处理时间比较长,但现在已经解决得七七八八了。
百度自己的内容这么多,其他站长怎么办?
包括最近推出的百度微购,加上以前的百度百科、知道、文库、贴吧、词典等等,这些百度自己的内容经常占据一大部分搜索结果,其他站长怎么活?
Lee解释,百度当初做自己内容的目的是满足用户需求,因为有很多查询没能提供好的结果,而当时没有内容网站满足这些需求。百度做的这些内容不仅在百度排名好,在Google等搜索引擎排名也很好,正说明这些内容满足了用户需求。百度项目的推出是在满足用户需求的前途下,在商业和用户体验上做出平衡。
这大概是百度能做出的最好的答案了,但显然不能使很多站长满意。
在百度site:域名,首页不在第一是否说明被惩罚?
Lee回答,site:域名,首页不在第一,与惩罚没什么大关系。site:语法有比较大的随机性,并不是一个排序语法。
|
|