什么是網站日志,如何分析SEO網站日志?

SEO基礎 尹華峰 瀏覽 評論來源:www.006333.live

  作為一名站長,如果連網站日志是什么都不知道,或者對其根本不屑一顧,我只能說你是一個不稱職的網站站長,一旦網站出問題,必定是束手無策!即便掌握了SEO基礎知識也要善于分析網站日志。

  很多新手SEO站長可能覺得不去分析網站日志也無關緊要,相信大家都在自己的網站上安裝了網站統計的代碼,如Google analytics、量子統計、百度統計、cnzz、#等。這些工具可以統計網站的流量,但是這些統計工具都不能統計你主機上資源的原始訪問信息,例如某個圖片被誰下載了,也不能統計到那些沒有添加統計代碼的地方,比如后臺操作頁面。

SEO網站日志分析

  絕大多數收費主機都提供原始訪問日志,網站服務器會把每一個訪客來訪時的一些信息自動記錄下來,保存在原始訪問日志文件中,如果你的主機不提供日志功能,建議你到期后還是換主機吧。日志中記錄了網站上所有資源的訪問信息,包括圖片、CSS、JS、FLASH、HTML、MP3等所有網頁打開過程載入的資源,同時記錄了這些資源都被誰訪問了、用什么來訪問以及訪問的結果是什么等等,可以說原始訪問日志記錄了主機的所有資源使用情況。

  分析網站日志有什么作用?

  1、我們可以比較準確的定位搜索引擎蜘蛛來爬行我們網站的次數,可以屏蔽偽蜘蛛(此類蜘蛛多以采集為主,會增加我們服務器的開銷);

  2、通過分析網站日志,我們可以準確定位搜索引擎蜘蛛爬行的頁面以及時間長短,我們可以依次有針對性的對我們的網站進行微調 ;

  3、http返回狀態碼,搜索引擎蜘蛛以及用戶每訪問我們的網站一次,服務器端都會產生類似301,404,200的狀態嗎,我們可以參照此類信息,對我們出現問題的網站進行簡單的診斷,及時處理問題。

  如何分析網站日志中的內容?

  一、注意那些被頻繁訪問的資源

  如果在日志中,你發現某個資源(網頁、圖片和mp3等)被人頻繁訪問,那你應該注意該資源被用于何處了!如果這些請求的來源(Referer)不是你的網站或者為空,且狀態碼(Http Code)為200,說明你的這些資源很可能被人盜鏈了,通過 Referer 你可以查出盜鏈者的網址,這可能就是你的網站流量暴增的原因,你應該做好防盜鏈了。

  二、注意那些你網站上不存在資源的請求

  如果某些請求信息不是本站的資源,Http Code不是403就是404,但從名稱分析,可能是保存數據庫信息的文件,如果這些信息讓別人拿走,那么攻擊你的網站就輕松多了。發起這些請求的目的無非就是掃描你的網站漏洞,通過漫無目的地掃描下載這些已知的漏洞文件,很可能會發現你的網站某個漏洞哦!通過觀察,可以發現,這些請求所使用的Agent差不多都是Mozilla/4.0、Mozilla/5.0或者libwww-perl/等等非常規的瀏覽器類型,以上我提供的日志格式化工具已經集成了對這些請求的警報功能。我們可以通過禁止這些Agent的訪問,來達到防止被掃描的目的,具體方法下面再介紹。

  三、觀察搜索引擎蜘蛛的來訪情況

  通過觀察日志中的信息,你可以看出你的網站被蜘蛛訪問的頻率,進而可以看出你的網站是否被搜索引擎青睞,這些都是SEO所關心的問題吧。日志格式化工具已經集成了對搜索引擎蜘蛛的提示功能。常見搜索引擎的蜘蛛所使用的Agent列表如下:

  Google蜘蛛 :Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

  Baidu蜘蛛 :Baiduspider+(+http://www.baidu.com/search/spider.htm)

  Yahoo!蜘蛛 :Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)

  Yahoo!中國蜘蛛 :Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)

  微軟Bing蜘蛛 :msnbot/2.0b (+http://search.msn.com/msnbot.htm)

  Google Adsense蜘蛛 :Mediapartners-Google

  有道蜘蛛 :Mozilla/5.0 (compatible; YoudaoBot/1.0; http://www.youdao.com/help/webmaster/spider/)

  Soso搜搜博客蜘蛛 :Sosoblogspider+(+http://help.soso.com/soso-blog-spider.htm)

  Sogou搜狗蜘蛛 :Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)

  Twiceler爬蟲程序 :Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)

  Google圖片搜索蜘蛛 :Googlebot-Image/1.0

  俄羅斯Yandex搜索引擎蜘蛛 :Yandex/1.01.001 (compatible; Win16; I)

  Alexa蜘蛛 :ia_archiver (+http://www.alexa.com/site/help/webmasters)

  Feedsky蜘蛛 :Mozilla 5.0 (compatible; Feedsky crawler /1.0)

  韓國Yeti蜘蛛:Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/)

  四、觀察訪客行為

  通過查看格式化后的日志,可以查看跟蹤某個IP在某個時間段的一系列訪問行為,單個IP的訪問記錄越多,說明你的網站PV高,用戶粘性好;如果單個IP的訪問記錄希希,你應該考慮如何將你的網站內容做得更加吸引人了。通過分析訪客的行為,可以為你的網站建設提供有力的參考,哪些內容好,哪些內容不好,確定網站的發展方向;通過分析訪客的行為,看看他們都干了些什么事,可以揣測訪客的用意,及時揪出惡意用戶。

  總結:還有一點要介紹的是當網站遭遇搜索引擎K掉的時候,網站日志可以給我們提供被K掉的原因(我是為站群的朋友考量),并且通過網站日志相關數據,可以看到網站什么時候搜索引擎恢復正常訪問,這樣我們可以選擇繼續做或者放棄,雖然很無奈,但卻也是不得已而又明智的選擇。

    青海快三的研究 600801华新水 浙江20选5开奖顺序 棋牌斗牛在线下载 nba无插件在线直 优乐江西抚州麻将下载 兼职网快速赚钱 浙江麻将怎么玩法介绍 nba湖人队 广东26选5开奖 刘伯温全年资料大全