国产男女精品_免费黄网在线观看_av综合在线观看_在线v片_欧美一区二区三区激情视频_99视频只有精品

18577034138
網站分析中數據的統計學顯著性檢驗

概述:

在網站分析中,經常會做網站優化測試,就會比較不同方案的轉換率,例如跳出率,訂單購買率,按鈕點擊率等;也會記錄訪客或者客戶的詳細數據表現。但很多時候差異都很小,究竟是保持現狀還是全面采用新方案的內容,很難有結論,于是兩者差異在統計學的意義是否顯著就變得

在網站分析中,經常會做網站優化測試,就會比較不同方案的轉換率,例如跳出率,訂單購買率,按鈕點擊率等;也會記錄訪客或者客戶的詳細數據表現。但很多時候差異都很小,究竟是保持現狀還是全面采用新方案的內容,很難有結論,于是兩者差異在統計學的意義是否顯著就變得很重要。

  這篇文章主要講解兩種檢驗數據的方法:分別是在Excel中使用已經寫好函數的數據顯著性計算器,和使用SPSS對詳細客戶數據進行顯著性檢驗。

  一、Excel-數據顯著性計算器

  假設有下列的數據:

  社交媒體來源訪問數訂單訂單購買率

  YouTube250008903.56%

  Facebook48002405%

  那么我們可以使用Avinash Kaushik介紹的Excel-數據顯著性計算器來檢驗,詳細請查看http://www.kaushik.net/avinash/excellent-analytics-tip1-statistical-significance/

  Excel文件可從此處下載: http://vdisk.weibo.com/s/cz9E6

  輸入數據后計算得知(Number of Test Participants是分母,Number of Conversions是分子),差異是顯著的,因為方框中顯示了”Yes”

  

數據顯著性

 

  以上方法的原理是兩組數據的差異超過了數據置信區間的話,那么就會出現數據顯著性差異的結果。

  以上的方法適用于簡單的兩個比率之間的對比,接下來要說說高級點的內容,SPSS中的假設檢驗問題來比較兩個樣本的均值。

  二、兩獨立樣本T檢驗

  SPSS中比較均值的方法包括:

  假設檢驗的方法樣本變量關系范例

  均值(單雙因素)單樣本變量之間網站分析師的月(工資、經驗、工作地點)關系

  單樣本T檢驗單樣本變量自身iPhone的機身長度

  兩獨立樣本T檢驗雙樣本變量之間不同促銷方案的效果、男女性的身高

  配對樣本T檢驗同一總體雙樣本變量自身不同月份訪客的購買行為

  在介紹兩獨立樣本T檢驗之前,先說下均值的比較情況,由淺入深。

  1.均值的檢驗

  假設檢驗的步驟一般分為以下幾步:

  1)確定原假設和備選假設(原假設就的意思是對總體的比例、均值或分布做出某種假設)

  2)選擇檢驗統計量

  3)計算檢驗統計量觀測值發生的概率,P值

  4)給定顯著性水平α, 如果P<α, 即小概率事件發生,即原假設發生的概率很小,那么推翻原假設,如果P>α, 那么原假設成立。

  假設有以下兩種情況:

  1)工廠的質量管理員說:產品缺陷率只有1/1000, 然后你開始抽查,抽了5件,就有2件是有問題的,那么問題就大單了。

  因為1000件中最大缺陷數是1件,現在有2件,也就是概率極小的事情發生。

  最大缺陷數原假設檢驗結論

  11/10002/5否定

  2)工廠的質量管理員說:產品缺陷率只有1/100,然后你開始抽查,抽了5件,就有2件是有問題的,那么問題也挺大單。

  1000件中最大缺陷數是10,現在有2件,接下來還有995件要查,那么有兩種可能:

  *產品缺陷率遠遠高于1%,質量管理員忽悠人;

  *碰巧抽到有缺陷的產品,接下來的995件很少有缺陷的了。

  概率計算:

  

概率計算

 

  原假設:也就是假設產品缺陷率是1/100, 前面抽了5件,就有2件次品的概率是0.088%;

  最大缺陷數原假設檢驗結論

  101/1002/5未定

  抽5件中2件,后續抽查產品缺陷率小于1/100的的概率為0.088%;抽5件中2件,后續抽查產品缺陷率大于1/100的的概率為99.912%,即原假設發生的概率<α,如果α為5%,那么0.088%<5%, 即檢驗中的小概率事件發生,原本不太可能的事情發生了,那么推翻原假設。

  注意:數據案例來自李洪成老師的SPSS資料

  2.兩獨立樣本T檢驗

  兩獨立樣本T檢驗指的是兩個樣本來自的總體相互獨立,目的是分析兩個獨立樣本的均值是否有顯著的統計差異。接下來的案例背景是:不同優化方案影響訪客訂單價值的情況。

  一、前提條件:

  要進行兩獨立樣本T檢驗,要滿足以下條件:

  1)總體相互獨立

  2)總體服從正態分布

  3)樣本的方差相同

  原始數據如下:

  

數據源

 

  1.數據設置

  1)選擇分析-描述統計-探索

  

探索性分析

 

  2)將訪客銷售額(sales)填入因變量列表,不同方案(test類型)填入因子列表:

  

探索性分析

 

  3)點擊繪制,勾選直方圖和帶檢驗的正態圖

  

探索性分析

 

  2.數據報告

  由下圖得知,兩個方案各有200個樣本:

  

描述性分析報告

 

  由下圖得知:

  1) 0方案的銷售額均值(1697)大于1方案的銷售額均值(1570)

  2)二者的標準差相差不大,657/610標準差比為約等于1。

  

描述性統計分析報告

 

  下圖是0方案的直方圖(驗證是否具有正態性)

  

 

  下圖是1方案的直方圖(驗證是否具有正態性)

  

 

  從下圖得知,0和1方案的P值(sig)都大于0.05,因此都具有正態性。

  

 

  二、正式分析兩獨立樣本的T檢驗

  點擊分析-比較均值-獨立樣本T檢驗:

  

 

  將sales放進檢驗變量,test放進分組變量,同時點擊“定義組”,分別用0和1來填充:

  

 

  兩獨立樣本檢驗假設了兩種情況,分別是方差相等和方差不相等的T檢驗結果。

  方差方程的Levene檢驗的P值為0.94,大于0.1,說明兩個獨立樣本的方差是齊性的,因此選擇假設方差相等的情況。

  方差相等情況下,SIG(P值)為0.047,小于顯著性水平0.05,因此說明1方案的消費金額顯著不同于0方案的消費金額,0方案在統計上比1方案具有顯著性特征。

  

 

  注意:以上SPSS數據庫的數據是導入excel數據生成的,以上excel數據是虛擬的,可通過rand()函數隨機生成。

  以上就是對于數據的統計學意義的驗證,隨著大數據時代的到來,單純的網站前端數據分析顯得比較簡單,客戶數據和訂單數據的分析需求會越來越多,希望對工具的熟練掌握能夠幫我們理順這一切。

 

主站蜘蛛池模板: 成人免费看片| 成人小视频在线播放| 亚洲精品三区| 欧美三级黄色大片| 日韩中出| 国产 中文 字幕 日韩 在线| 色综合久久五月| 亚洲二区视频| 亚洲日本精品| 日韩a毛片| 国产日韩欧美精品在线| 日韩av免费网址| 狠狠干av| 成人久久久久| 男人天堂99| 男人影院在线观看| 成人免费播放视频| 热久久av| 日本久久精品| 欧美三级黄色大片| 青草一区二区| 中国特黄一级片| 91人人干| 污网站在线免费看| 亚洲成人福利视频| 91高清免费观看| 一级亚洲| 精品人伦一区二区| 人人狠狠| 久久伊人99| 中文日韩在线观看| 在线v片| 在线观看日批视频| 午夜亚洲国产| 亚洲 欧美 日韩 综合| 国产区第一页| 成人精品在线看| 日本a级大片| 精品免费看| 亚洲精品欧美精品| 日韩精品在线观看视频|