深度分析网站日志的作用及使用方法

 

许多优化人员忽略了网站日志的作用,而更多的优化人员只通过日志分析工具去查看,所查看的内容也不过是各搜索引擎蜘蛛的访问数量、停留时间、抓取页面数、抓取目录、返回代码等,真正愿意从代码中去看日志的,少之又少。

先不说看日志源码的作用有多大,作为一个SEO人员,应该掌握的知识有很多,除了会做外链、内链、站内结构外,还应掌握HTML代码、CMS系统、部分PHP、ASP、数据库等知识,会看网站日志也是必备技能之一。

掌握这些知识的好处有很多,例如:

第一、可以扩大知识面,在优化中,可以站在更宽广的角度思考问题、解决问题;

第二、在没有足够团队配置的情况下,不影响进度,也就拥有了“全天候作战能力”;

第三、维护网站安全、防盗链、防采集、放挂马等。

这里,海魄先带加大认识一下日志的源代码,以IIS服务器日志为例,首页日志开头声明格式:

#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes   





另外日志源码还有一个非常实用的功能:查看网站是否被采集。

许多采集软件会伪装成搜索引擎抓取你网站,这里通过日志代码可以更好的识别出来,具体识别方法以WIN操作环境为例,假设要核查蜘蛛的IP为220.181.108.78:

首先打开本地DOC,输入-nslookup 220.181.108.78,看返回值中是否声明了来源(如:Name: baiduspider-220-181-108-78.crawl.baidu.com,这便证明是百度蜘蛛),百度是一定会声明来源的,所有匿名的百度蜘蛛都是伪装IP,需要警惕!

  • 留言列表: