高端定制网站

【渭南网站建设】什么是网站日志如何分析SEO网站日志

阅读  ·  发布日期 2019-11-16 11:19

作为一名站长,如果连 网络日志 是什么都不知道,或者对其根本不屑一顾,我只能说你是一个不称职的网站站长,一旦网站出问题,必定是束手无策!即便掌握了SEO基础知识也要善于分...

详细信息

  作为一名站长,如果连网络日志是什么都不知道,或者对其根本不屑一顾,我只能说你是一个不称职的网站站长,一旦网站出问题,必定是束手无策!即便掌握了SEO基础知识也要善于分析网站日志。

许多新手SEO网站管理员可能会觉得,他们是否不分析网站日志并不重要。我相信每个人都在自己的网站上安装了网站统计代码,比如谷歌分析、量子统计、百度统计、cnzz、51。La等。这些工具可以统计网站的流量,但它们都不能统计主机上资源的原始访问信息,例如谁下载了图片,或者没有添加统计代码的地方,例如后台操作页面。

SEO网站日志分析

绝大多数收费主机提供原始访问日志。网站服务器将自动记录每个访问者访问时的一些信息,并将其保存在原始访问日志文件中。如果您的主机不提供日志功能,建议您在到期后更改主机。日志记录了网站上所有资源的访问信息,包括所有网页打开过程中加载的资源,如图片、CSS、JS、flash、HTML、MP3等,并记录了谁访问了这些资源,使用了哪些资源进行访问,访问结果如何等等,原始访问日志记录主机的所有资源使用情况。

分析网站日志的作用是什么?

一。我们可以准确定位搜索引擎蜘蛛来抓取我们的网站,并屏蔽假蜘蛛(此类蜘蛛主要被收集,这将增加我们服务器的成本);

2。通过对网站日志的分析,可以准确定位搜索引擎蜘蛛爬行的网页和时间长度。我们可以依次微调我们的网站;

三。HTTP返回状态码,搜索引擎蜘蛛和用户每次访问我们的网站都会生成类似于301404200的状态。我们可以参考这些信息,对网站出现的问题进行简单的诊断,并及时处理。

如何分析网站日志的内容?

一、注意经常访问的资源

如果您发现日志中经常访问某个资源(网页、图片、MP3等),则应注意该资源的使用位置!如果这些请求的来源(referer)不是您的网站或是空的,并且HTTP代码是200,这意味着您的资源可能会被盗。你可以通过转介者找到链盗的网站,也许这就是你网站流量急剧增加的原因。你应该做好防盗链。

2。注意网站上不存在的资源请求

如果请求的某些信息不是站点的资源,则HTTP代码是403或404,但从名称分析来看,它可能是保存数据库信息的文件。如果信息被其他人拿走,攻击你的网站就容易多了。启动这些请求的目的是扫描网站上的漏洞。通过随机扫描和下载这些已知的漏洞文件,您可能会在您的网站中发现漏洞。通过观察,您可以发现用于这些请求的代理几乎都是非常规浏览器类型,如Mozilla/4.0、Mozilla/5.0或libwww Perl/。以上是我在日本提供的日志格式化程序集成了这些请求的警报功能。我们可以通过禁用这些代理的访问权限来防止它们被扫描。具体方法如下所述。

三、观察搜索引擎蜘蛛的造访

通过观察日志中的信息,你可以看到蜘蛛访问你的网站的频率,然后你可以看到你的网站是否受到搜索引擎的青睐。这些都是SEO关心的问题。日志格式工具集成了搜索引擎蜘蛛的提示功能。常见搜索引擎蜘蛛使用的代理列表如下:

Google spider:Mozilla/5.0(兼容;Google bot/2.1;+)

百度蜘蛛+(+)

雅虎!蜘蛛:Mozilla/5.0(兼容;Yahoo!Slurp/3.0;)

雅虎!中国蜘蛛:Mozilla/5.0(兼容;Yahoo!斯鲁普中国;)

微软必应蜘蛛:MSNBot/2.0B(+)

谷歌Adsense蜘蛛:mediapartners谷歌

蜘蛛:Mozilla/5.0(兼容;youdaobot/1.0;)

Sosoblogspider+(+)

搜狗蜘蛛网/4.0(+ා07)

Twisser爬虫程序:Mozilla/5.0(Twisser-0.9)

谷歌图片搜索蜘蛛:谷歌机器人图片/1.0

俄罗斯yandex搜索引擎蜘蛛:yandex/1.01.001(兼容;win16;I)

亚历山蜘蛛:iaúu archiver(+)

Feedsky spider:Mozilla 5.0(兼容;Feedsky Crawler/1.0)

雪人蜘蛛,韩国:雪人/1.0(NHN公司)

四、游客行为观察