百度K掉众多淘宝客网站动态API内容原因分析
昨天晚上的大更新,大量淘宝客网站的动态API内容都被百度给K了,一些收录过百万的站现在K的都剩下几万。看来百度开始下手调整淘宝客网站了,其实百度开始删除这些动态API内容也是有其原因的。
1、绝大部分的淘宝客网站动态API内容相似,包括网页的结构也相似,随着淘宝客网站的猛烈增长,因此导致百度数据存在大量重复内容。现在对这些内容进行清理也是正常之举。
2、淘宝客网站动态API的内容页面的title比较混乱,这个title都是通过API接口从淘宝获取的。这些title都是淘宝网卖家发布商品时设置,90%的商品都存在关键字堆砌的问题。由于这个原因导致百度搜索的匹配度降低,例如我的网站,有人在百度搜索“iphone手机不能开机”,搜索这个关键词会进入到我站的一个动态API的iphone手机商品页面。百度为了提高他的搜索匹配度,K掉这些动态API内容也在情理之中。