石家庄网站建设 > 博客教程 > 展为博客 >

石家庄建网站网站建设

发布时间:2020-08-19

日志文件分析可以提供有关Googlebot在您的网站上所做的操作的一些最详细的见解,但这可能是一个令人生畏的话题。在本周的“白板”星期五中,小甜甜布兰妮(Britney Muller)分解了日志文件分析,以使各地的SEO可以更轻松地访问它。
 
 
 
 
 
单击上方的白板图像,在新选项卡中打开高分辨率版本!
视频转录
嘿,莫兹迷。欢迎使用《星期五白板》。今天,我们将讨论日志文件分析的所有内容,这是非常重要的,因为它确实告诉您Googlebot在您的网站上进行的操作的来龙去脉。
 
因此,我将向您介绍三个主要方面,第一个是您可能会从特定站点看到的日志类型,它的外观,信息的含义。第二个是如何分析数据以及如何获得见解,第三个是如何使用数据来优化您的页面和站点。
 
有关什么是日志文件分析及其在SEO中的应用的入门知识,请查看我们的文章:如何将服务器日志分析用于技术SEO
1.类型
因此,让我们开始吧。日志有三种主要类型,主要是Apache。但是您还将看到W3C,弹性负载平衡,在诸如Kibana之类的产品中可能会看到很多。但是您也可能会遇到一些自定义日志文件。因此,对于那些较大的网站,这并不罕见。我知道Moz有一个自定义的日志文件系统。快速是自定义类型设置。因此,请注意那些都在那里。
 
记录数据
那么您将在这些日志中看到什么?此处输入的数据主要来自这些彩色数据。
 
因此,您希望可以肯定地看到:
请求服务器IP;
时间戳记,即发出此请求的日期和时间;
所请求的URL,那么他们正在访问哪个页面;
HTTP状态代码,是否为200,是否已解决,是否为301重定向;
用户代理,因此对于我们的SEO,我们只查看那些用户代理的Googlebot。
 
因此,日志文件通常会存储所有数据,个人访问量和访问量,但是我们要分析Googlebot的访问量。有时包括方法(获取/发布),然后花费的时间,客户端IP和引荐来源网址。所以这看起来像是gglibbery。
 
 
这是我刚刚编成的一个字,看起来像那样。就像闪闪发光。那是什么?看起来很疯狂。这是一种新语言。但从本质上讲,您可能会看到该IP,即那个红色的IP地址,该时间戳(通常看起来像这样),该方法(获取/发布),我对此并不完全了解,或者不一定需要在某些方法中使用它。分析,但最好了解所有这些内容,所请求的URL,状态代码以及所有这些内容。
 
2.分析
那么您将如何处理这些数据?我们如何使用它?因此,有很多工具非常适合为您完成一些繁重的工作。尖叫青蛙日志文件分析器很棒。我已经用了很多。我真的非常喜欢。但是您必须使日志文件采用特定格式,以便他们使用。
 
 
Splunk也是一个很好的资源。Sumo Logic,我知道还有很多。如果您使用的是大型站点,就像过去一样,您将在这里遇到问题,因为它不在通用的日志文件中。因此,您可以做的就是自己手动执行其中的一些操作,我知道这听起来有些疯狂。
 
手动Excel分析
但是挂在那里。相信我,这很有趣,也很有趣。因此,我过去所做的就是将CSV日志文件导入Excel,并且将使用“文本导入向导”,您基本上可以描述出这种疯狂的分隔符是什么。因此,无论是空格,逗号还是引号,您都可以将其分解,以便每个人都住在自己的列中。我不会担心会有多余的空白列,但是您可以将它们分开。从那里开始,您只需要创建数据透视表即可。因此,我可以链接到有关如何轻松实现此目的的资源。
 
热门页面
但是从本质上讲,您可以在Excel中看到的是:好的,按频率显示,Googlebot排名靠前的页面是什么?根据请求的次数,这些首页是多少?
 
热门文件夹
您还可以查看顶部的文件夹请求,这确实很有趣而且非常重要。最重要的是,您还可以查看以下内容:哪些最常见的Googlebot类型影响了您的网站?是Googlebot移动版吗?是Googlebot图片吗?他们在寻找正确的资源吗?超级重要。您也可以使用状态码创建数据透视表,然后进行查看。我喜欢将其中一些紫色的内容应用到首页和文件夹报告中。因此,现在您可以洞悉以下内容:好的,这些首页中的某些页面是如何解析的?顶部的文件夹是什么样的?
 
您也可以针对Googlebot IP进行此操作。这是我在日志文件分析中发现的最佳技巧。我将在此处使用Googlebot IP创建一个数据透视表。所以我通常会得到,有时是一堆,但是我会得到所有独特的,而且我可以在大多数标准计算机上的计算机上运行终端。
 
 
我试图画它。看起来像那样。但是,您要做的就是输入“主机”,然后输入该IP地址。您可以使用此IP地址在您的终端上执行此操作,然后将其解析为Google.com。这证明它确实是Googlebot,而不是其他一些欺骗Google的爬虫。因此,这些工具往往会自动处理这些问题,但是也有一些方法可以手动进行,这是个不错的注意。
 
3.优化页面并抓取预算
好吧,那么您如何优化这些数据并真正开始增加抓取预算?当我说“抓取预算”时,它主要是指Googlebot访问您的网站的次数以及它们通常抓取的页面数。那是什么呢?搜寻预算是什么样的?如何提高其效率?
 
服务器错误意识:所以服务器错误意识是非常重要的。最好留意某些页面上500个错误的增加。
404s:有效吗?Referrer ?:另外要看的一件事是Googlebot找到的所有400s。看到是如此重要:好的,那是400个请求,它是有效的400吗?该页面不存在吗?还是该页面应该存在并且不再存在,但是您可以修复?如果那里有错误,或者应该不存在,那么引荐来源是什么?Googlebot是如何发现这一点的?您如何开始清理其中的某些东西?
隔离301s并修复常见的301链: 301s,因此在这些日志文件中有很多关于301s的问题。我已经发现,并且我知道其他人也发现了,最好的技巧就是隔离并修复最常见的301链。因此,您可以在数据透视表中执行此操作。当您将其与爬网数据配对时,这样做实际上要容易得多,因为现在您对该链有了更多了解。您可以做的是,查看最常见的301,然后查看:该链是否有任何简单,快速的解决方法?有什么可以删除并迅速解决的问题,就像一跳或两跳吗?
移动优先:您可以先关注移动。如果您的网站首先使用移动设备,则可以对其进行挖掘,查看日志并评估其外观。有趣的是,Googlebot仍然看起来像这个兼容的Googlebot 2.0。但是,它将在括号中包含所有移动含义。因此,我确信这些工具可以自动知道这一点。但是,如果您要手动执行某些操作,则最好了解其外观。
遗漏的内容:所以真正重要的是看一下:Googlebot发现和抓取的内容是什么,它们完全丢失了什么?因此,最简单的方法是与您的站点地图进行交叉比较。这是一种非常实用的方法,可以查看可能遗漏的内容以及原因以及如何以及可能的情况下如何重新安排站点地图中的数据优先级或将其集成到导航中。
比较点击率与点击量:这是我在Twitter上获得的很棒的提示,我不记得是谁说的。他们说比较Googlebot命中率和点击率。我认为这很了不起,因为您不仅可以看到潜在的相关性,而且还可以看到您可能想要增加爬网流量或在特定的高流量页面上进行爬网的位置。看一下真的很有趣。
网址参数:看看Googlebot是否使用参数字符串访问任何网址。你不要那样 它通常只是重复的内容,或者可以在Google Search Console中使用参数部分分配的内容。因此,在那里进行任何电子商务,都一定要检查一下,并弄清一切。
评估天,​​周,月:您可以评估命中的天,周和月。那么,每个星期三都有高峰吗?每月都有峰值吗?知道这有点有趣,但不是很严格。
评估速度和外部资源:您可以评估请求的速度,以及是否有潜在的外部资源可以清理并加快爬网速度。
优化导航和内部链接:您也想优化导航,就像我之前说的,并使用该meta no索引。
元noindex和robots.txt不允许使用:因此,如果您不想在索引中包含某些内容,并且不想从robots.txt中进行检索,则可以添加所有这些内容并开始也可以帮助解决这些问题。
重新评估
最后,将爬网数据与其中的某些数据连接确实很有帮助。因此,如果您使用的是Screaming Frog或DeepCrawl,它们将允许与不同的服务器日志文件进行这些集成,从而为您提供了更多的见解。从那里开始,您只需要重新评估。因此,您想反复地继续此循环。
 
您想查看正在发生的事情,进行一些努力,是否正在清理它,然后从那里去。所以我希望这会有所帮助。我知道很多,但是我希望它能对日志文件分析进行广泛的概述。我期待您在下面提出的所有问题和意见。我将很快在另一个星期五的白板上再次见到您。谢谢。

网站建设
Website
客户案例
Customer case
关于展为
About ZHANWEI
展为致力于网站建设与网络营销,微信营销,专业领域包括网站建设、网站seo优化推广、移动互联网营销、三网合一网站建设,微信营销小程序开发,与其他网站建设及系统开发公司不同,我们的整合解决方案结合了展为网络建设经验和互联网整合营销的理念,并将策略和执行紧密结合,且不断评估并优化我们的方案,为客户提供一体化全方位的互联网品牌整合方案!

扫码咨询

Copyright © 石家庄展为网络有限公司. 冀ICP备14018173号-6 Copyright 2010-2020版权所有
展为网络
网站建设
客户案例