程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> 關於.NET >> Google Analytics獲得GOOGLE真正的收錄網站數據指標

Google Analytics獲得GOOGLE真正的收錄網站數據指標

編輯:關於.NET

我們的站點究竟有多少頁面被 Google 收錄(裝的技術性一點就叫:“索引”)呢?

這個提問所引發的問題時常出現在SEO世界中,並且,其曝光率大有蔓延飛漲之勢。問題通常都是由於某個像下列這樣的搜索行為所引起的:

1 簡單五步, 搞定真正收錄數

Google的搜索結果生成根域名下有93800個頁面被搜索引擎索引。這聽起來美妙不堪,但是當我們在一周後使用同樣的搜索請求時,索引的數字卻變成了大約75000個,這時我在大概一分鐘後對Google.co.uk使用同樣的搜索請求,返回的極富戲劇性的數字結果更讓人感到困惑:

2 簡單五步, 搞定真正收錄數

我們在 Google.com 的搜索結果頁中點擊一下“刷新”怎麼樣:

3 簡單五步, 搞定真正收錄數

哦看吧!谷歌剛剛刪除掉了我搜索的站點在他們索引中的8500個頁面。太不靠譜了對吧?但其帶來的不便卻遠未及得上主管,營銷總監和CEO…等等一切使用這些數字作為KPI的家伙們對於你工作產生的負面印象!我說明白了吧?一個小小的數字就讓你一無所有了…不同的數據中心間約計300%的浮動可以改變人們的瞬時注意力,或給人一個可行的洞察行為契機作為一種商業度量指標?

額,不幸的是,的確如此。

但不幸中的萬幸是,我們可以通過一種簡單的方法來獲得較之利用搜索引擎提供的通過“site:xxx.com”語法能搜到的更多,更翔實的數據。那麼接下來,我們將向您一步步展示如何按部就班的獲得真正的數據指標。

步驟一:到你的Web Analytics工具中查看流量來源吧

4 簡單五步, 搞定真正收錄數

點擊位於Google Analytics 或 Omniture中的 “Traffic Sources”(中文版中名曰“流量來源”)鏈接。(它在其他的分析工具中或許被稱作“Referring Source”即-“引薦來源”)

步驟二:選擇搜索引擎分組啊!

5 簡單五步, 搞定真正收錄數

我們想要知道究竟有多少網頁被搜索引擎收錄(或說“索引”)了的話,很顯然,下一步就是點擊搜索引擎分組了。

步驟三:選擇一個目的搜索引擎吧

6 簡單五步, 搞定真正收錄數

選擇你需要的要將真實的指標提取出的搜索引擎點擊它。如果你對於這個搜索引擎同時具備付費放置與自然流量的話,在這一步中要顯示的則只有自然流量一項。

步驟四:選擇登錄頁過濾

7 簡單五步, 搞定真正收錄數

在KeyWord下拉菜單中的“Landing Page”(“目標網頁”又或者叫“登陸頁”)過濾器能夠將每個你選擇的單獨頁面從搜索引擎獲得流量展示給你。這同時也產生了神奇的獲得的“Total”(全部)流量數據,將在下一步驟中做進一步解釋。

步驟五:記錄位於底部的數據

8 簡單五步, 搞定真正收錄數

這個數字告訴了你哪些網頁是通過使用 Google 搜索行為引導最少來過一次的具有獨立編號的網頁(很拗口- -|| 就是至少有人用 Google 搜索到並查看過一次的網頁…)。就是它!數據中的聖杯(意指:特別想做的事)— 一個你始終能夠精確跟蹤到得數字,而且它表現出了搜索引擎真的在漸漸收錄(索引)你的站點!就其本身而言,它並非十分有用。但隨著時間的推移(原文作者通常建議是每月記錄一次,但對於部分站點來說,每2-3個月記錄一次顯得更有意義。)它無論在你將頁面做的更好或是更糟的情況下,都將給出一個直觀的流量增減曲線。

現在,從技術層面來講,我厚顏無恥的准備在這放點臭氣。這個數字並沒有告訴你故事的全部 — 你網站被搜索引擎抓取或說收錄(索引)的真實總數並非你所見到的那樣,但他確實告訴了你至少被搜索到並浏覽過一次的網頁數量。以我的觀點來看,這個數據距離精確與更加可靠差的還遠。第一個形容詞 – 精確 - 是很難爭論出結果的(特指此文中可以看到的數據),但第二個形容詞,則需要更進一步來解釋。

為什麼被訪問過一次的頁面總數就可靠呢?

首先,孤立的看待收錄數量(索引數量)是毫無價值可言的。商業與網站使用這玩意來作為KPI是因為那些頭頭們想要弄清楚(或許他們也並沒在意- -|||),隨著時間的推移,是否能讓自己的網頁更多的跻身搜索引擎“指數”中。我必須要提出的是:你並不關心你的網頁是否在搜索引擎中占有一席之地,而是你在意的是你的網頁是否有足夠多的機會去吸引更多的流量。

如果你的頁面出現下面給出的一條或幾條特征,那就說明還有需要改進的地方:

1、搜索結果中的頁面出現過低的PageRank/Link Juice

2、搜索引擎無法對正在顯示的內容正確的解析

3、缺乏能夠創造流量的關鍵詞與內容

4、死鏈,錯鏈等

5、復制其他網頁的話搜索引擎會對權重進行重新排名

然而,你長久以來想要計算的度量標准並非被收錄(索引)的網頁數量(於大多數情況下適用),而是能夠吸引流量的網頁數量究竟是多少。也就是說這才是你真正想要提升的數據指標,這個數字才是你希望營銷專員集中注意的,同樣也是對 KPI 真正有意義的。它能夠告訴你在一個人在進行一次搜索請求時,搜索引擎是否在不斷地爬行,收錄與在搜索結果中顯示了你的網頁,並且那個人也真正的點擊了該頁。

如果這個數字下降了,你可以通過將以往輸出到表格記錄的數據(上一個月,或上一個周期的數字)進行橫向比較來推斷出究竟有哪些頁面已經不再能讓你從其獲得流量了。如果這個數字呈上升趨勢,你也可以通過對比看到有哪些頁面讓你獲得了新的流量。這些獨立的 URLs 將告訴你一個完整的故事 – 有問題的頁面,出錯的鏈接,遠低於分頁結果顯示的或是去了內容來源唯一性。這種指數化的操作流程遠優於一個或可叫做黑箱 SEO 操作的過程,這就可以避免根據 “site:xxx.com” 語法獲得的收錄(索引)數字常常偏低這個現象。

一些重要的注意事項:

這種方法論也絕不是完美的,其中有一些十分重要的點是你需要知道的:

1、Google Analytics(或其他的分析工具)使用了數據模型模擬真實的結果。如果你想要確保得到數字式絕對真實的,那麼就別嫌麻煩了把數字錄入到表格中,然後靜下心來在數據表格中做橫向對比吧。你甚至可以將兩個時間段中相似的結果中那些吸引來/未吸引來流量的頁面刪掉。大多數情況下,你可能只關注那些獲得/或丟失5/10/20+浏覽者的頁面。

2、高精確度的數據只能從相對較短的時間段中獲得,但在分析一個依靠長尾吸引流量的的網頁時,或許在表格中看起來是相對較少的。所以應當適當調整,為不完整數據做計劃。這個理論也並非萬全之策,但在我看來,總比那些單純的依靠“site:”的輪盤賭來的靠譜。

3、這個技巧並不能幫助你發掘到其他的SEO問題就比如重復的內容(在某些情況下適用,但不及其他工具的報告來的方便准確)還有301重定向,302重定向的問題等等。那些都是需要爬行來給出解決方案的。

當然我很願意得到您的反饋。我知道有很多從業人員也好,發燒友也罷都對使用“site:”指令得到的數字來衡量網站的進展情況懷有十分的推崇或說近乎膜拜的情緒,所以我很有可能對於在其他方面產生的意義與價值沒做到足夠多的考慮。我也曉得您十分信任谷歌網站管理員工具(Google Webmaster Tools)基於Sitemaps爬行提供的數據(同樣我也對其產生的報告中的數據表示不那麼信任)鄙人也十分樂意聽到您關於如何從這些數據中挖掘價值的思考與總結!

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved