機率統計
伯努力試驗與二項分布
伯努力試驗與二項分布 (Bernoulli Trial and Binomial Distribution)
國立成功大學統計系/東吳大學財務工程與精算數學系專任統計助教 杜柏毅
在生活中,有很多的事情都只有兩種結果 (outcome),例如考試是否及格、明天是否下雨、丟擲銅板並觀察其結果。當一個試驗只有兩種可能結果(成功與失敗),且兩個結果出現之機率為固定(若成功機率為 \(p\),則失敗機率為 \(1-p\)),我們稱這樣的試驗為伯努力試驗 (Bernoulli trial)。當我們重複進行多次相同的伯努力試驗(如丟擲一相同硬幣數次),且已知這些試驗之間的結果互相獨立(即這次試驗的結果不影響下次試驗的結果),則稱為二項實驗 (binomial experiment)。
淺談分配:甚麼是「機率分配」?
淺談分配:甚麼是「機率分配」? (Distribution: “What is Probability Distribution” ?)
國立成功大學統計系/東吳大學財務工程與精算數學系專任統計助教 杜柏毅
簡單而言,機率分配 (probability distribution) 是一個「衡量特定事件發生機率」的函數。在真正開始談論機率分配之前,我們必須先對機率函數 (probability function) 有所了解:
假設有一隨實驗 (random experiment),其可能結果之樣本空間為 \(S\)。樣本空間中元素之集合稱為事件 (event),記為 \(C_i\),將樣本空間中所有事件之集合定義為 \(B\)。則機率函數 (probability function) 為 \(B\) 中事件發生的機率。
我們可以把隨機實驗理解為一個工廠,工廠中所有不同的產品即是樣本空間 \(S\)。將不同的產品包裝在一起成為組合商品則是事件 \(C_i\),而所有的組合商品的集合就可以被定義為 \(B\)。機率函數就是 \(B\) 裡面,不同的產品被銷售出去的機率。
無偏性、有效性及一致性
無偏性、有效性及一致性(Unbiasedness ,Efficiency and Consistency)
國立臺灣大學農藝學系 鍾秉元
一、前言
在統計中,推論統計是很重要的一個部分。當我們進行抽樣之後,期望以抽取出來的樣本,對母體的一些參數進行估計。點估計與區間估計是進行估計的兩種方法。當我們進行點估計時,我們會對樣本取得的數據進行統計量的計算,並且以計算出的統計量來估計母體的參數。但是這就面臨一個問題,我們應該如何知道我們所利用的統計量是否真的能夠推算出我們需要的母體參數呢?對於點估計來說,我們可以利用無偏性、有效性、一致性,三個性質作為判斷的依據。
類別資料分析—列聯表與獨立性檢定
類別資料分析—列聯表與獨立性檢定
國立臺灣大學農藝所生物統計組碩士班 賴薇云
一、前言
卡方檢定的兩種主要的應用為獨立性及同質性檢定。兩者檢定可用來檢驗記數型的資料,資料都可以寫成 \(r \times c\) 列聯表的型態,本篇介紹列聯表與獨立性檢定。獨立性檢定適用於檢定兩個隨機變數之間是否獨立,例如抽菸與否變數和得不得肺癌變數之間是否獨立。
型 I 錯誤、型 II 錯誤與 p 值
型 I 錯誤、型 II 錯誤與 p 值(Type I Error, Type II Error, and p-value)
國立臺灣大學農藝所生物統計組碩士班 陳丘原
假設檢定是先對母體參數提出假設,然後利用樣本的資訊,再決定是否接受或否決該假設;而在進行假說檢定的決策時,可能會犯兩種錯誤(表一):
一、型 I 錯誤 (Type I Error):
若 \(\mathrm{H_0}\)(虛無假說)為真,但結論卻否決 \(\mathrm{H_0}\),則犯了第一型錯誤,而稱犯第一型錯誤的機率為第一型錯誤率 (Type I Error Rate),其發生的機率以 \(\alpha\) 表示,或稱顯著水準 (significant level)。
二、型 II 錯誤 (Type II Error):
若 \(\mathrm{H_1}\)(對立假說)為真,但結論卻接受 \(\mathrm{H_0}\),則犯了第二型錯誤,而稱犯第二型錯誤的機率為第二型錯誤率 (Type II Error Rate),其發生的機率以 \(\beta\) 表示。另外,統計上常稱 \(1-\beta\) 為檢定力 (Power)(圖一)。
計數型資料分析—卡方適合度檢定
計數型資料分析—卡方適合度檢定 (Categorical Data Analysis — Chi-Square Test of Goodness of Fit)
國立臺灣大學農藝所生物統計組碩士生 賴薇云
一、前言
一般經由試驗所獲得的資料型態可分為數種,其中較常見的為連續型資料及計數型資料。連續型資料代表資料的量是可被測量的,數值也不受整數的限制。像是病患的身高、土壤中的重金屬含量……等,均可用連續型資料來呈現。
計數型資料則多以次數的多寡來呈現,例如在淹水處理下,所觀測到的種子發芽次數。連續型資料分析的方包括 T-test、回歸分析等。而卡方檢定則是處理計數型資料的統計方法中較為常見的,常見的檢定依據不同的用途分為 4 種,包括適合度檢定 (test of goodness of fit)、獨立性檢定 (test of independent)、同質性檢定 (test of homogeneity)、McNemar 檢定 (McNemar’s test) 等,本篇主要介紹卡方適合度檢定,其餘檢定將在其他章節介紹。
次數分配與其圖表
次數分配與其圖表 (Frequency Distribution and Its Tables and Figures)
國立臺灣大學農藝學系 劉素萍
前言
當你收到你的考試成績時,除了知道自己的成績(例如 \(85\) 分)之外,你一定也會對其他同學的成績感到興趣。這時,你可能會想了解,有多少同學跟你一樣得到 \(85\) 分?有多少同學的成績高於 \(85\) 分?又有多少同學的成績是低於 \(85\) 分?如果根據原始的數據來看,你可能無法快速清楚地看出這些訊息。但是,如果我們將全班分數依據大小以及發生的次數 (frequency) 來加以排列,就能夠快速有效率地獲得這些資訊。這種將分數依發生的次數來呈現的表達方式稱為「次數分配」。
資料散佈圖與相關係數
資料散佈圖與相關係數 (Scatter Diagram and Correlation Coefficient)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠
一、前言
許多人會將因果性與相關性混淆,因果有必然性,如果說 A 和 B 有因果性,則當 A 發生時,B 一定會發生,但如果說 A 和 B 有相關性,我們只能說當 A 發生時,B 有較高的發生機會,它們的發生率有著相同的趨勢,如酒測酒精濃度高與交通事故相關性高,人們因酒駕造成交通事故發生的機會較高,但卻不能說二者是因果,畢竟交通事故的原因還可能包括其他如道路狀況、駕駛員技術等。
單變數線性迴歸模式
單變數線性迴歸模式 (Simple Linear Regression Model)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠
一、前言
簡單迴歸分析 (simple regression analysis) 是建構一適當的數學方程式來表示兩個變數(分別稱為自變數與應變數)之間的關係,此數學方程式即稱為迴歸方程式。其中自變數與應變數或稱為其他別名(表一)。
若應變數和自變數之間有線性的函數關係存在,則此迴歸模式為單變數線性模式 (simple linear regression);若應變數和自變數之間存在有非線性的函數關係,則為單變數非線性迴歸 (simple nonlinear regression)。
