數學

卡方分布在Excel的應用(下)

卡方分布在Excel的應用(下) (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系 湯育全

連結:卡方分布在Excel的應用(上)

例題三、卡方同質性檢定(引用自沈 [ 96 ] 之例題)

設今有甲、乙、丙三種治療香港腳藥膏,其治療效果如表一。我們想要測驗三種藥膏對治療香港腳的效果是否相同。

表二、甲乙丙藥膏治療香港腳結果表。(單位:人數)(表格來源:沈 [民 96 ])

合計
治癒 24 30 21 75
沒改善 12 18 10 40
合計 36 48 31 115

卡方分布在Excel的應用(上)

卡方分布在Excel的應用(上) (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系 湯育全

關於卡方分布的檢定可參考「類別資料分析」系列下的《列聯表與獨立性檢定》、《同質性檢定》、《McNemar test》與《費雪精確性檢定等文章,本篇主要的目的是示範 Excel 進行卡方分布相關檢定時的操作方式,提供讀者在實務上進行資料分析時作為參考。

例題一、卡方適合度檢定(引用自沈 [ 96 ] 之例題)

設有某農藥商宣稱其新出品的殺蟲劑之殺蟲效率為 \(80\%\),今實際試驗 \(500\) 隻某昆蟲,結果有 \(375\) 隻死亡,我們欲測驗實際的試驗結果是否與藥商所宣稱的效果相符合。

類別資料分析—同質性檢定

類別資料分析—同質性檢定(Categorical Data Analysis – Test of Homogeneity)
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

同質性檢定與獨立性檢定同為應用卡方分布的檢定法,兩者檢定可用來檢驗記數型的資料,其資料通常表示為 \(r \times c\) 列聯表的型態。列聯表的格式與採用卡方分布進行獨立性檢定的方法將另文介紹(參閱「列聯表與獨立性檢定」),本篇將介紹卡方分布進行同質性檢定的方法。同質性檢定目的是比較數組記數型資料的結果是否一致,如採用兩種教學方法對學生進行教學,探討不同教學法下學生測驗成績的等第分布是否相同。

伯努力試驗與二項分布

伯努力試驗與二項分布 (Bernoulli Trial and Binomial Distribution)
國立成功大學統計系/東吳大學財務工程與精算數學系專任統計助教 杜柏毅

在生活中,有很多的事情都只有兩種結果 (outcome),例如考試是否及格、明天是否下雨、丟擲銅板並觀察其結果。當一個試驗只有兩種可能結果(成功與失敗),且兩個結果出現之機率為固定(若成功機率為 \(p\),則失敗機率為 \(1-p\)),我們稱這樣的試驗為伯努力試驗 (Bernoulli trial)。當我們重複進行多次相同的伯努力試驗(如丟擲一相同硬幣數次),且已知這些試驗之間的結果互相獨立(即這次試驗的結果不影響下次試驗的結果),則稱為二項實驗 (binomial experiment)。

淺談分配:甚麼是「機率分配」?

淺談分配:甚麼是「機率分配」? (Distribution: “What is Probability Distribution” ?)
國立成功大學統計系/東吳大學財務工程與精算數學系專任統計助教 杜柏毅

簡單而言,機率分配 (probability distribution) 是一個「衡量特定事件發生機率」的函數。在真正開始談論機率分配之前,我們必須先對機率函數 (probability function) 有所了解:

假設有一隨實驗 (random experiment),其可能結果之樣本空間為 \(S\)。樣本空間中元素之集合稱為事件 (event),記為 \(C_i\),將樣本空間中所有事件之集合定義為 \(B\)。則機率函數 (probability function) 為 \(B\) 中事件發生的機率。

我們可以把隨機實驗理解為一個工廠,工廠中所有不同的產品即是樣本空間 \(S\)。將不同的產品包裝在一起成為組合商品則是事件 \(C_i\),而所有的組合商品的集合就可以被定義為 \(B\)。機率函數就是 \(B\) 裡面,不同的產品被銷售出去的機率。

無偏性、有效性及一致性

無偏性、有效性及一致性(Unbiasedness ,Efficiency and Consistency)
國立臺灣大學農藝學系 鍾秉元

一、前言

在統計中,推論統計是很重要的一個部分。當我們進行抽樣之後,期望以抽取出來的樣本,對母體的一些參數進行估計。點估計與區間估計是進行估計的兩種方法。當我們進行點估計時,我們會對樣本取得的數據進行統計量的計算,並且以計算出的統計量來估計母體的參數。但是這就面臨一個問題,我們應該如何知道我們所利用的統計量是否真的能夠推算出我們需要的母體參數呢?對於點估計來說,我們可以利用無偏性、有效性、一致性,三個性質作為判斷的依據。

類別資料分析—列聯表與獨立性檢定

類別資料分析—列聯表與獨立性檢定
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

卡方檢定的兩種主要的應用為獨立性及同質性檢定。兩者檢定可用來檢驗記數型的資料,資料都可以寫成 \(r \times c\) 列聯表的型態,本篇介紹列聯表與獨立性檢定。獨立性檢定適用於檢定兩個隨機變數之間是否獨立,例如抽菸與否變數和得不得肺癌變數之間是否獨立。

型 I 錯誤、型 II 錯誤與 p 值

型 I 錯誤、型 II 錯誤與 p 值(Type I Error, Type II Error, and p-value)
國立臺灣大學農藝所生物統計組碩士班 陳丘原

假設檢定是先對母體參數提出假設,然後利用樣本的資訊,再決定是否接受或否決該假設;而在進行假說檢定的決策時,可能會犯兩種錯誤(表一):

一、型 I 錯誤 (Type I Error):

若 \(\mathrm{H_0}\)(虛無假說)為真,但結論卻否決 \(\mathrm{H_0}\),則犯了第一型錯誤,而稱犯第一型錯誤的機率為第一型錯誤率 (Type I Error Rate),其發生的機率以 \(\alpha\) 表示,或稱顯著水準 (significant level)。

二、型 II 錯誤 (Type II Error):

若 \(\mathrm{H_1}\)(對立假說)為真,但結論卻接受 \(\mathrm{H_0}\),則犯了第二型錯誤,而稱犯第二型錯誤的機率為第二型錯誤率 (Type II Error Rate),其發生的機率以 \(\beta\) 表示。另外,統計上常稱 \(1-\beta\) 為檢定力 (Power)(圖一)。

計數型資料分析—卡方適合度檢定

計數型資料分析—卡方適合度檢定 (Categorical Data Analysis — Chi-Square Test of Goodness of Fit)
國立臺灣大學農藝所生物統計組碩士生 賴薇云

一、前言

一般經由試驗所獲得的資料型態可分為數種,其中較常見的為連續型資料及計數型資料。連續型資料代表資料的量是可被測量的,數值也不受整數的限制。像是病患的身高、土壤中的重金屬含量……等,均可用連續型資料來呈現。

計數型資料則多以次數的多寡來呈現,例如在淹水處理下,所觀測到的種子發芽次數。連續型資料分析的方包括 T-test、回歸分析等。而卡方檢定則是處理計數型資料的統計方法中較為常見的,常見的檢定依據不同的用途分為 4 種,包括適合度檢定 (test of goodness of fit)、獨立性檢定 (test of independent)、同質性檢定 (test of homogeneity)、McNemar 檢定 (McNemar’s test) 等,本篇主要介紹卡方適合度檢定,其餘檢定將在其他章節介紹。

次數分配與其圖表

次數分配與其圖表 (Frequency Distribution and Its Tables and Figures)
國立臺灣大學農藝學系 劉素萍

前言

當你收到你的考試成績時,除了知道自己的成績(例如  \(85\) 分)之外,你一定也會對其他同學的成績感到興趣。這時,你可能會想了解,有多少同學跟你一樣得到 \(85\) 分?有多少同學的成績高於 \(85\) 分?又有多少同學的成績是低於 \(85\) 分?如果根據原始的數據來看,你可能無法快速清楚地看出這些訊息。但是,如果我們將全班分數依據大小以及發生的次數 (frequency) 來加以排列,就能夠快速有效率地獲得這些資訊。這種將分數依發生的次數來呈現的表達方式稱為「次數分配」。

Pages