关于百度相关关键字的个人猜想

今天我和大家讲讲有关于百度相关关键字的个人猜想,也许大家从网上的百度宣传广告与竞争视频上都可以看出,百度对自己的汉字理解能力非常自负,在同样的条件下,百度的汉字理解能力比某国外搜索引擎要好,那么这是不是真的呢?我认为对汉语的认识方面,百度对谷歌高一点,但不是很显明的优势,而在对网站变化的反应速度上,谷歌远比百度要牛的多,这一点,相信不光是站长,其它的网民也都有感觉。

为什么要了解百度相关关键字匹配知识

作为一个SEO,要了解对自己工作有作用的知识,本文中我会讲到百度相关关键字匹配知识,学习这一知识点的话,你就可以在以后的选词,分词,页面关键词密度及优化长尾关键词这些方面有更好的更多的选择了。这就是学习本文知识点的直接作用。下面开始讲正文了。

百度相关关键字匹配能力的体现

上面我说到对汉语的认识方面,百度对谷歌高一点,那么百度相关关键字匹配能力是怎样看出来的呢,或者说,它在我们日常使用百度时会以哪些方式展现出来呢?我列出几种大家可以看看。

1、错别字更正:比如搜索“电脑得品牌”时,百度会识别当时的错别字,进而在第一条时就会提示你:

 

2、汉语拼音理解能力:当你输入拼音时,百度会自动理解成与当前拼音最接近的汉字,比如搜索“shanghaidieyou”,会出现:

 

3、近义(字)词匹配:当你输入一个词进行搜索,但你所搜索的词结果太少,这时百度就会匹配它认为意思相近,但搜索结果很多的关键词,比如搜索“蝶友财务服务咋样”,百度会将“咋样”自动匹配为“怎么样”。

 

4、更正词序:有时我们搜索关键词时,不一定按公允的语言进行搜索,当关键词当中的小词组顺序混乱时,百度会自动更正词序,从而列出更好更准确的搜索结果,比如搜索“会计服务 上海”这个词时,百度会自动更正为“上海会计服务”。

 

5、敏感词规避:有时词是不适合公开或不适合完全公开搜索结果的,这时,百度会将这些词的搜索结果进行规避,比如说搜索“三唑仑”(也就是安眠药)时,会提示

 

以上五条是我总结了百度相关关键字匹配能力的体现方式,了解了这些后,下面我来讲讲我对百度汉字认知能力的猜想。

百度汉字智能识别能力大猜想

百度有这样的智能,自然是因为它们强大后台程序在起作用,根据上面说到的五点体现方式,我猜想百度后台至少有四个功能性模块在起作用,它们各有各的功能,从而使百度的使用者有了很好的用户体验。下面一一来谈谈我的猜想。

一 近义(同义)词库:必须要有一个独立的近义(同义)词库才能实现近义(字)词匹配和错别字更正这两个功能,道理很好理解,而对于这一模块的内部结构,我的猜想是这样的:就像我们摆放厨房用品一样,盘子是盘子,碗是碗,无论大碗小碗,青花碗,流金碗,而对于某些有三重近义关系的词,可将其另放一处,就像某个大汤碗一样,你即可以当碗用,也可以当汤盘来用,这种用品可以另放一处,当盘子在使用时处于缺省时,就拿这个大汤碗来匹配(这个比喻还可以吧)。

二 热点词库:我们知道,互联网有二个特点:1更新快,2数据海量。这个世界每天都有热点事件,比如近期出现的“抗强拆被拦腰砸死”事件,而过段时间后,这个词的热度就会被新的热点事件关键词所取代,所以百度要迎合关注热点事件的庞大网民群体,它就必须要有一个独立的热点词库,它可以通过监控每天百度关键词搜索量和关键词媒体关注度来添加新的热点事件关键词,形象点来说就像是我们去理发店,你无须亲自体验每一家理发服务技术,只要在某个时段里监控这些理发店的来往人群,就可以知道“哪家店是本区域最热门的理发店”,得到数据后,就把它收录在你的生活日记备忘录中。以上就是百度热点词库增加内容的方式,至于删除关键词是这样的:一段时间后,再次监控这个词的搜索量,同比上期大幅度下降后,则自动删除这个热点关键词。

三 稳定词词库:有时关键词一年到头的搜索量与搜索方式都很稳定,我猜想百度会为它们单独设立一个模块,比如电脑品牌、上海财务公司、上海人才招聘等等,这样做的好处在于:当小部分网民搜索这类词时出现错误,比如把词的顺序搞颠倒了(人才招聘上海),百度就可以通过稳定词的词库自动的把这一错误更正过来。

四 敏感词词库:敏感词词库数量不如以上三个词库,但它对于一个搜索引擎的社会责任度、用户体验度、使用安全性、公正性都是至关重要的,不可小视。而添加这些敏感词,我猜想百度应该都是人工添加,因为机器添加的话,会出现大的错误,比如“骚”这个词,“骚女”和“离骚”,前者敏感词,后者正规词,所以不是人工添加的话,一般二般的程序干不了这事。

百度汉字智能识别能力在SEO工作中的应用

百度与谷歌相比,最大的优势就是对汉语的认知能力,从上面的文字中,大家一定对此有了肯定。那么我认为百度一定会对百度用户放大它的这一优势,那么我们这些SEO工作者就可以在以后的工作中好好的利用百度这一特性,有一点大家要明白:要想打赢一场拉锯战,你一定要先洞察对方的特性。那么具体来说,我们怎么样做呢?

首先第一点,网站的所有文字与图片内容上尽量不要出现百度划定的“敏感词”,但不是说一定不能出现,因为现在有些敏感词,你加上几个字就成了另一种意思,这是汉语的魅力所在,百度自然明白这一点,所以在对待一些模凌二可的敏感词时,百度非常的谨慎小心,这里我说的“不能出现敏感词”是指“不能独立出现”,比如说“”这个词是敏感词,你不能让它独立出现,比如你写的一篇文章里有句话“三唑仑,国内购买此药品是很严格的”,这就是独立出现,因为三唑仑的后面有个逗号,把这句话分成了二小段话,百度会认为“三唑仑”是独立的一句话或一个词,进而会影响到它对当前页面的评分,明白了吧。又如“三唑仑在国内购买此药品是很严格的”,这样就可以,因为它没有独立出现,而是作为一个词组出现在一句话里面。

其次第二点,“学会写错别字”,我这样话的道理是这样的:有些词,按正确的写法的话,要做上百度第一页不容易,但如果把其中一个字小小的改一下,改成错别字,那么词的竞争度就会大大降低,从而轻易的排到第一页,而大家应该知道,有不少的人会写错别字,这样的话,正中了我们的下怀,我还是来举例说明:“上海代理记账”这个词,正确的写法是贝字旁的“账”,错误的写法是“上海代理记帐”(巾字旁的帐),而后者比前者竞争度小的多,但搜索的人却是很多很多。那么我们就可以利用这一点轻易的跳过我们强大的竞争对手,做上同样的关键词,获得大量的有效IP,呵呵。

再其次第三点,颠倒词语顺序,上面我说到,当关键词当中的小词组顺序混乱时,百度会自动更正词序,从而列出更好更准确的搜索结果。这里有个大前提:在没有完全匹配的结果时,百度会自动更正,但如果真有这样的的词可以完全匹配的话,那么大部分情况下,百度不但会把它显示出来,而且还会放在靠前的位置。所以很多时候,大家不要一心钻到那么难竞争的词上,要学会“剑走偏峰”。

最后一点,也是第四点:多做通俗词,我们知道中国地方很大,每个地方的人,他们想表达同一个意思时,往往会用不同的说话方式,但特点都是一样的:词义通俗,意愿明确。比如上海人“出具审计报告多少钱”;广东人“出具审计报告几多钱”;北京人“出具审计报告的费用(价格)”;另外还有很多种说法“出具审计报告费用是多少”;“出具审计报告要多少钱啊”等等,我查过,这些词里,“出具审计报告多少钱”竞争度最大,做上去不容易,这时,你就应该考虑把全部精力放在其它几个竞争度小的词里,在SEO行业里,做五个竞争度小的词要比做一个竞争度大的词效果要好,这样一来,无论他们哪里的人,按他们的习惯进行搜索时,你的信息全部排在第一页。

  • 留言列表: