【Excel】統計概念與實作 - Medium

文章推薦指數: 80 %
投票人數:10人

計算選取之數值資料的樣本變異數. 敘述統計實作:Excel 分析工具箱. Excel 分析工具箱. Step 1. 要進行敘述統計時固然可以利用上述函數,另外一項做法,就是利用Excel ... GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWritePublishedinNTUDataAnalyticsClub【Excel】統計概念與實作本堂社課將由Tim郭俊東講師帶大家複習常見的統計概念,並且利用Excel實作跑統計。

不論是學過統計但對某些概念仍然模糊,或是剛入門統計的新手,這篇文章都相當適合你閱讀!本篇文章keytakeaway:敘述統計概念推論統計概念差異檢定講師Tim郭俊東簡介臺大健康政策與管理研究所博士,曾任哈佛大學公衛學院博士後研究員、國防醫學院兼任教師,專長教學論文寫作、統計學及統計軟體。

敘述統計概念1.標準差概念:【Excel】統計概念介紹-NTUDataAnalyticsClub2.函數(這邊要注意連續型變數才適用以下函數)=MEAN(數值資料範圍)計算選取之數值資料的平均值=MEDIAN(數值資料範圍)計算選取之數值資料的中位數=STDEV.P(數值資料範圍)計算選取之數值資料的母體標準差=STDEV.S(數值資料範圍)計算選取之數值資料的樣本標準差=VAR.P(數值資料範圍)計算選取之數值資料的母體變異數=VAR.S(數值資料範圍)計算選取之數值資料的樣本變異數敘述統計實作:Excel分析工具箱Excel分析工具箱Step1.要進行敘述統計時固然可以利用上述函數,另外一項做法,就是利用Excel的資料分析功能。

點選最上方【資料】的【資料分析】後,選取「敘述統計」。

Step2.在「輸入範圍」拉選欲分析的數字資料範圍,若範圍包含標題,需勾選「類別軸標記是在第一列上」。

接著勾選「摘要統計」,若要獲得信賴區間的誤差範圍(marginoferror),可勾選「平均數信賴度」並輸入信心水準。

Step3.一次獲得集中趨勢和離散趨勢如平均數、標準差、變異數等敘述統計數值。

推論統計概念抽樣概念(可參考NTUDAC第二屆的社課精華文章):【Excel】統計概念介紹-NTUDataAnalyticsClub標準誤以平均值作為統計量為例,若對母體重複抽樣,集合所有抽樣結果的平均值之分布,稱為抽樣分布(Samplingdistribution)。

在資料分布中,「單一數字」與「所有數字之平均值」的差異,稱為離差(Deviation)。

在抽樣分布中,「單一樣本平均值」與「所有樣本平均值的平均值(等於母體平均值)」的差異,特稱為誤差(Error)。

標準差用來衡量各個數字與平均值的差異,而標準誤則是衡量各種抽樣結果的平均值與母體平均值的差異。

中央極限定理抽樣的重點是代表性,我們不能抽取一部份樣本就認為可以代表為母體,將有以偏概全(選樣誤差,Selectionbias)的風險,就像我們不能撈湯的表面就說整鍋湯都是油的。

承接連結文中的選舉民調例子,要怎麼利用所抽的選民樣本數值去推論母體的數值呢?中央極限定理就派上用場啦!不論母體分佈如何,只要我們所抽樣本的樣本數夠大(一般為30,多少才算足夠仍取決於母體分布),各種抽樣結果平均值的分佈(即抽樣分布)就會接近常態分佈,我們可再利用常態分佈的特性,將樣本平均值加上誤差範圍,就能做出區間估計。

利用Z轉換將常態分佈標準化Z轉換方式:(數值-平均數)/標準差,也可以使用Excel公式=STANDARDIZE(範圍,平均值,標準差)差異檢定這邊結合假說檢定流程,利用獨立樣本t檢定進行差異檢定1.差異分析可以依靠假說檢定來幫助做判斷。

若我們想探討電商平台的創新介面跟原有介面版本,在銷售金額平均上是否有顯著差異(即確認這個差異並非來自抽樣的隨機誤差),那要先列出:虛無假說(H0):原有介面平均銷售額=創新介面平均銷售額對立假說(H1):原有介面平均銷售額≠創新介面平均銷售額2.接著我們要設定顯著水準αlevel,通常是5%,p值小於5%時則拒絕H0、結論支持H13.計算統計值,這邊我們點選【資料】中的【資料分析】,選擇「t檢定:兩個母體平均數差的檢定,假設變異數相等」,將A欄(原有介面銷售額)放入「原有介面銷售額的資料範圍」,B欄(創新介面銷售額)放入「創新介面銷售額的資料範圍」,由於選取的資料範圍有包含標題,因此要勾選「標記」,顯著水準「α」輸入0.05,按下確認後,就可以得到t檢定分析結果。

4.在這張Excel替我們做出的t檢定表中,注意「P(T<=t)雙尾」後的值「1.6E-17」,代表雙尾檢定的p值遠小於0.05,達到顯著水準,因此應拒絕H0,結論支持H1,代表「原有介面平均銷售額≠創新介面平均銷售額」,此結果值得我們繼續探討造成兩者差異的原因。

同場加映:好用又免費的統計軟體—JASPTim特別推薦JASP統計軟體(Jeffrey’sAmazingStatisticsProgram),其介面簡單、操作直覺,並附有範例資料。

下圖為使用JASP進行差異分析的示意圖,大多數的統計分析如:t-檢定、卡方檢定、信度、迴歸分析等,皆能動動手指點選就完成。

更強大的是,這個軟體無須付費,若沒有經費購買SPSS軟體,JASP會是很好的替代方案!感謝Tim深入淺出地講解統計概念,並且使用Excel實作分析讓這些抽象的概念變得更容易理解。

這些統計概念,將為日後做專案的洞察提供強而有力的支撐,強化社員與業主的溝通邏輯!歡迎各位拍手交流,NTUDAC也會持續在Medium、Facebook與LinkedIn更新每週社課的資訊,歡迎對資料有興趣的大家持續關注,跟我們交流想法!!!MorefromNTUDataAnalyticsClub臺大資料分析與決策社(NTUDAC)為一群對資料科學抱有熱忱的臺大學生創立,旨在教授學員如何利用數據分析解決商業問題的商業性社團。

ReadmorefromNTUDataAnalyticsClubAboutHelpTermsPrivacyGettheMediumappGetstartedNTUDataAnalyticsClub1.5KFollowers臺大資料分析與決策社(NTUDAC)為一群對資料科學抱有熱忱的臺大學生創立,旨在教授學員如何利用數據分析解決商業問題的商業性社團,在Medium將分享社團課程與實作專案內容,以期推廣資料分析的相關資訊。

FollowHelpStatusWritersBlogCareersPrivacyTermsAboutKnowable



請為這篇文章評分?