网站维护工作人员,为避免网站服务器被攻击;SEO工作人员为确定搜索引擎爬虫访问网站情况,都避免不了要分析网站日志。但是我的得到的网站日志原始数据往往都是一大堆乱七八糟的数据。拿到这些原始数据后我们该怎么办呢?黑月分享一下如何利用Excel表格分析网站日志方法!

步骤/01.

登录“FTP”账号,链接到网站数据,找到网站日志文件夹。(注意:一般情况下,网站日志所在文件夹都是与网站文件同级文件夹,且带有log字样。只有少数情况下,网站日志文件夹在网站根目录下。)

步骤/02.

打开文件夹,下载日志压缩文件!(下载方法很简单,只要选中文件直接拖到电脑桌面,然后左下方的本地浏览下载目录的文件上“右键—传输队列”即可!)

步骤/03.

解压下载的日志文件,而后将解压后文件的后缀改为“txt”

步骤/04.

新建一个excel表格,并打开!找到顶端工具栏的“数据”工具

步骤/05.

点击“导入数据”,默认“直接打开数据文件”,再选择“选择数据源”。

步骤/06.

选中解压后的txt文档,并打开!

步骤/07.

默认“其他编码” 并“下一步”;

步骤/08.

选择“分隔符号”,并“下一步”;

步骤/09.

勾选所有选项,然后“下一步”;

步骤/10.

默认“常规”,并“完成”;

步骤/11.

如图,网站日志数据项之间全部分隔开;

步骤/12.

接下来只要保留自己需要的数据项即可。删除不需要的数据项!(如图,仅保留了数据分析需要的访客ip、访问文件、访问状态码以及访客名称四项数据。)

步骤/13.

选中访客名称一整列,然后点击“开始”栏目的“筛选”工具

步骤/14.

点击访客名称一列上方的三角下拉按钮;

步骤/15.

取消“全选”,找到百度蜘蛛的访客名称,选中并“确定”;

步骤/16.

如图所示,我们就可以得到百度蜘蛛访问网站的所有数据。

各大搜索引擎综合索引名称
百度蜘蛛:Baiduspider  谷歌爬虫:Googlebot
360爬虫:360Spider  必应爬虫:bingbot
搜狗爬虫:Sogou News Spider


网站日志也可以在服务器/主机管理面板中下载。得到的百度访问日志还需要分辨真假蜘蛛,并非所有蜘蛛都是真实百度蜘蛛,如站长工具的虚拟蜘蛛等。

吐槽一下   我要支持