機率統計

從數學建模觀點看最「適配」直線(二)

 從數學建模觀點看最「適配」直線(二)
(The best fit straight line in the view of mathematical modeling)

國立臺灣師範大學數學所博士班黃俊瑋

連結:從數學建模觀點看最「適配」直線(一) 

當我們觀察某組二維數據之散佈圖後,若發現這兩變數間呈現出正比趨勢,或具高度的直線相關時,自然會聯想到利用直線 \(y=\beta_0+\beta_1x\) 模型來適配這組二維數據。

假設這條理想的直線為 \(y=\beta_0+\beta_1x\),數學上一般會利用最小平方法(least squares method)來探求此理想直線的參數 \(\beta_0\) 與 \(\beta_1\)。統計學裡,將每一筆資料 \((x_i,y_i)\) 的觀察值 \(y_i\) 與此直線的垂直差距稱為「殘差(residual)」,當然殘差平方越小,表示該筆資料與最佳直線的垂直距離也越小,即越接近該直線。

因此,直觀上我們不難想像,當一條直線能使得所有資料的殘差平方和越小,則此直線越「適配」這組資料,亦即適配度越佳(goodness of fit)。而所謂的最小平方法,本質上即是使得所有殘差之平方和最小時,所得之直線,此直線即為一般所謂的迴歸直線、最小平方直線或也被稱為最適配直線、最佳直線等。例如圖一當中的紅色直線即為這些數據的最適配直線,而藍色線段所示即當中某些資料 \(y_i\)的殘差。 

從數學建模觀點看最「適配」直線(一)

從數學建模觀點看最「適配」直線(一)
(The best-fit straight line in the view of mathematical modeling)

國立臺灣師範大學數學所博士班黃俊瑋

二千年前,天文學家托勒密 (Ptolemy, c.90-c.168) 的地心說,以地球為中心建立了太陽依圓形軌道繞地球運轉的天體運動模型,更一般性地,他在《天文學大成》(Almagest)一書中闡述了天體的運動軌跡為大圓的數學模型。

到了十六世紀天文學家哥白尼 (Copernicus, 1473-1543) 則改成以太陽為中心,地以圓形軌道繞日運行,大大簡化了模型的複雜度(將托勒密理論中的均輪和周轉圓,從原本的77個化減化34個)。

再到十七世紀克卜勒 (Kepler, 1571-1630) 除了接受哥白尼的日心說之外,依據其老師弟谷 (Tycho Brahe, 1546-1601) 的大量觀測數據,進一步建立了地球以橢圓形軌道繞太陽運行的天體運動定律,而這樣的數學模型更為「簡潔」而且「漂亮」。上述大家耳熟能詳的例子,都是現實生活與天文學研究中的數學建模實例。

交換禮物中的機率問題(The probability of exchanging gifts)

交換禮物中的機率問題(The probability of exchanging gifts)
臺北市立和平高中黃俊瑋教師

每到聖誕節時,許多人喜歡舉辦交換禮物活動,假設總共有 \(n\) 個人參與,規定每個人各自帶來一件禮物,收集所有人的禮物後,便將禮物貼上編號,每個人再從中隨機抽出一樣禮物帶回家。總有人幸運地抽中自己心儀的禮物,也似乎常會有人不幸地抽中自己所帶來的禮物,真的是這個人運氣不好嗎?再者,若參與的每個人都沒有抽中自己的禮物是正常的嗎?

首先,我們從簡單的情況開始討論起。

當 \(n=1\) 時,必定拿回自己的禮物,所以機率為 \(P(A_1)=1\)(不過,一般應該沒有人自己和自己交換禮物)。

當 \(n=2\) 時,假設有 \(A_1\) 與 \(A_2\) 兩個人,各拿出 \(G_1\) 與 \(G_2\) 兩個禮物。
這時,想像隨機將 \(G_1\) 與 \(G_2\) 兩個禮物排列,其中的第一個位置代表 \(A_1\) 的禮物、第二個位置代表 \(A_2\) 的禮物,則有 \(G_1G_2\) 和 \(G_2G_1\) 兩種可能性。
換句話說,要嘛兩個人都拿到對方帶來的禮物,要嘛拿回自己禮物,而且兩者機率相同,因此,有拿回自己禮物的機率為 \(P(A_1\cup A_2)=\frac{1}{2!}\),其中 \(P(A_1\cup A_2)\) 指的是 \(A_1\) 或 \(A_2\) 拿回自己禮物的機率。

標準差

標準差 (Standard Deviation)
臺北市立和平高中黃俊瑋教師

給定一筆資料 \(x_1\)、\(x_2\)、\(\cdots\)、\(x_n\),算術平均數 \(\mu=\frac{\sum_{i=1}^{n}x_i}{n}\) 一般用作為數據的代表值或衡量數據集中趨勢的統計量。雖然,算術平均數是數據重要代表值,但是可能發生下列情況:甲班與乙班某次數學考試的平均數皆為 \(50\) 分,但甲班同學的成績皆分佈在 \(40-60\) 分之間,而乙班約一半的學生都是 \(90\) 分以上,另一半學生都是個位數。這樣來看,這兩班的成績雖有相同的「中心」,即算術平均數,但它們整體的分散、分佈、變異情況大不相同。此時「\(50\) 分」這個數字之於兩班成績的意義以及可解釋數據的程度亦不同。

撲克牌遊戲與機率(二)

撲克牌遊戲與機率(二) (Poker game and the probability II)
臺北市立和平高中黃俊瑋教師

連結:撲克牌遊戲與機率(一) 

〈撲克牌遊戲與機率(一)〉一文中,介紹了撲克牌遊戲─梭哈─的前五種牌型之組合數與出現機率,接下來,本文繼續介紹如何求得其它四種牌型的組合數與機率。最後,表列出各類牌型對應的組合數與機率之實際計算結果,並作一簡單討論與說明。

6. 三條(three of a kind

所謂的三條指的是 \(5\) 張牌當中,有三張數字相同,另兩張則都不相同。

例如:\(AAAKQ\)、\(99962\)、\(777Q8\) 等皆是,亦即其牌型為 \(aaabc\)。

我們可以利用下述方式計算出其組合數:先從 \(13\) 個數字中選出 \(1\)個作為 \(a\),

再從其它 \(12\) 個數字中選出 \(2\) 個作為 \(b\) 與 \(c\)(這裡請注意,\(bc\)不需考慮順序,直接一次選取即可。否則若依序選完 \(a\),再選 \(b\),再選 \(c\) 會發生重複的情況,例如 \(AAAKQ\) 與 \(AAAQK\))。

接著,從 \(4\) 種花色的數字 \(a\) 恰選三張:\(C_3^{4}\),從 \(4\) 種花色的數字 \(b\) 恰選一張:\(C_1^{4}\),

最後,從 \(4\) 種花色的數字 \(c\) 恰選一張:\(C_1^{4}\)。

如此,利用乘法原理可計算出所有的三條共有:\(C_1^{13}C_2^{12}C_3^{4}C_1^{4}C_1^{4}=54,912\) 種。

其出現的機率為:\(\displaystyle\frac{C_1^{13}C_2^{12}C_3^{4}C_1^{4}C_1^{4}}{C_5^{52}}\)。此值約為 \(0.02113\)。

撲克牌遊戲與機率(一)

撲克牌遊戲與機率(一) (Poker game and the probability I)
臺北市立和平高中黃俊瑋教師

一副公正的撲克牌(Poker)共有四種花色(黑桃、紅心、方塊與梅花),各種花色包含\(13\)種數字(\(2\)、\(3\)、\(\cdots\)、\(10\)、\(J\)、\(Q\)、\(K\)、\(A\))各一張,總共\(52\)張,有時會再加上\(2\)張鬼牌。而撲克牌相關遊戲種類相當多,其中,一種常見的遊戲方式是每人發五張牌,依據牌面花色與點數所形成的牌型來決定勝負(即一般人口中所謂的梭哈)。多年前,賭神、賭俠、賭聖系列等多部膾炙人口的電影,當中藉以比賽的撲克牌遊戲皆為此類。

遊戲當中,各類牌型的勝負比較如下:同花順 > 鐵隻 > 葫蘆 > 同花 > 順 > 三條 > 兩對 > 一對 > 其它(亂牌)。當然在同一牌型之下,必需依據相對應的數字大小來作比較。數字由大至小依序為:\(A>K>Q>J>10>9>\cdots>2\);而在某些組合中 \(A\) 也可被視為 \(1\)。也由於各類牌型的機率計算上,僅需要古典機率與組合的概念即可,因此,無論是當年的聯考或者高中機率單元的補充教材裡,皆可看見此遊戲的蹤跡。

你也許會好奇,為什麼這些牌型大小需如此規定呢?問題的答案與機率有關。首先,從 \(52\) 張牌中取 \(5\) 張牌的所有可能性共有 \(C_5^{52}\) 種。以下,我們便對各類牌型的組合數與機率作一簡單討論與說明。在本文中,將先討論前五種牌型,而〈撲克牌遊戲與機率(二)〉中繼續討論另外四種牌型,並作進一步綜合討論。屆時讀者不難了解遊戲設計者如此規定的原因。

我們同一天生日(二)!(We have the same birthday!)

我們同一天生日(二)!(We have the same birthday!)
臺北市立和平高中黃俊瑋教師

連結:我們同一天生日(一)!(We have the same birthday!)

〈我們同一天生日(一)〉一文中討論了下述問題:某一群人數共有 \(n\) 人,其中有某 \(2\) 個人同一天生日的機率為何?特別地,當這群人的人數到達 \(23\) 人以上時,有某 \(2\) 個人同一天生日的機率將大於 \(1/2\)。

該文中利用反面作法,先計算 \(n\) 個人生日皆不同天的機率為:

\(\frac{{365}}{{365}} \times \frac{{364}}{{365}} \times \frac{{363}}{{365}} \times\cdots\times \frac{{365 – n + 1}}{{365}}\)。

因此,\(n\) 個人當中有某 \(2\) 個人同一天生日的機率為:

\(1 – \left( {\frac{{365}}{{365}} \times \frac{{364}}{{365}} \times \frac{{363}}{{365}} \times\cdots\times \frac{{365 – n + 1}}{{365}}} \right)\) 。

欲計算不同的 \(n\) 相對應的機率,除了可以利用計算機與電腦之外,我們還可以利用對數的概念與查表的方式,計算出上述各機率值。這裡先來看看人數為 \(4\) 個人時的例子。

首先,計算出四個人生日皆不同天的機率 \(\frac{{364}}{{365}} \cdot \frac{{363}}{{365}} \cdot \frac{{362}}{{365}}\),這裡我們取常用對數:

\(\begin{array}{ll}\log (\frac{{364}}{{365}} \cdot \frac{{363}}{{365}} \cdot \frac{{362}}{{365}})&=\log 364+\log 363+\log 362-3\log 365 \\ &=\log (3.64 \cdot {10^2}) + \log (3.63 \cdot {10^2}) + \log (3.62 \cdot {10^2}) \\&~~~- 3 \cdot \log (3.65 \cdot {10^2})\\&=\log 3.64 + \log 3.63 + \log 3.62 – 3 \cdot \log 3.65\end{array}\)

我們同一天生日(一)!(We have the same birthday!)

我們同一天生日(一)!(We have the same birthday!)
臺北市立和平高中黃俊瑋教師

生活中,許多人聚會的場合裡,不免會討論生日或星座問題。也許你會發現,當人數夠多時,總是會發生某兩人同一天生日的情況。特別是在同一個班級裡,人數動輒 \(40\) 人或更多時,總會有某兩個同學同一天生日,看起來非常不可思議。所謂有緣來相聚,這是巧合嗎?還是天註定?一群人裡,有某兩人要剛好同一天生日的機率直觀上似乎很低,但真是如此嗎?數學將帶你看穿真相!

以下,我們不考慮 \(2\) 月 \(29\) 日生日,僅考慮一年 \(365\) 天的一般情況。

首先,兩個人恰好在同一天生日的機率為 \(\frac{{C_1^{365}}}{{{{365}^2}}}\),

亦即從一年 \(365\) 天當中選出一天將某這兩個人的生日塞進去。

或者你也可想成第一個人不指定哪一天,但第二個人必與第一個人同一天生日,

故機率為 \(\frac{{365}}{{365}} \cdot \frac{1}{{365}} = \frac{1}{{365}}\) 此值約為 \(0.0027\)。一片生日蛋糕(A piece of cake)!

獨立事件 (Indenpent Event)

獨立事件 (Indenpent Event)
國立蘭陽女中陳敏晧教師

已知 \(A\) 與 \(B\) 為樣本空間中的兩個事件,

若 \(P(A\cap B)=P(A)\cdot P(B)\),則稱 \(A\) 事件與 \(B\) 為獨立事件;
若 \(P(A\cap B)\ne P(A)\cdot P(B)\),則稱 \(A\) 事件與 \(B\) 為相關事件。

另一種解釋獨立事件的方式為當 \(B\) 事件的發生並不影響事件 \(A\) 發生的機率,
即 \(P\left( {A\left| B \right.} \right) = P\left( A \right) \Leftrightarrow \frac{{P\left( {A \cap B} \right)}}{{P\left( B \right)}} = P\left( A \right) \Leftrightarrow P\left( {A \cap B} \right) = P\left( A \right)P\left( B \right)\)。

若已知事件 \(A\) 與 \(B\) 為獨立事件,則

  1. \(A\) 與 \(B’\) 為獨立事件。其中 \(B’\) 為之補集合。
  2. \(A’\) 與 \(A\) 為獨立事件。
  3. \(A’\) 與 \(B’\) 為獨立事件。

證明:

(1) \(\begin{array}{ll}P\left( {A \cap B’} \right) &= P\left( A \right) – P\left( {A \cap B} \right) = P\left( A \right) – P\left( A \right)P\left( B \right) \\&= P\left( A \right) \cdot \left( {1 – P\left( B \right)} \right) = P\left( A \right)P\left( {B’} \right)\end{array}\),得證。參閱圖一。

54719_p1

圖一

蒙提霍爾問題(一)決勝21點

蒙提霍爾問題 (Monty Hall problem)(一) 決勝21點
國立屏東高級中學數學科楊瓊茹老師

在 2008 年上映的美國電影《決勝21點》中,劇中主角班 (Ben Campbell)在非線性代數的課堂上與授課教授米奇(Mickey Rosa) 有一段精彩的對話:

米奇:「假設你正參加一個遊戲節目,你有機會從三扇不同的門裡選一扇,其中一扇門後面有一輛新車,另外兩扇門後面各有一頭山羊?你要選擇哪一扇門?」

班:  「一號門。」

米奇:「好!這時節目主持人,順便一提,他知道門後的秘密,他去打開另一扇門,比方說他開了三號門,後面是一頭山羊。這時節目主持人說:「班,你想要堅持選擇一號門,還是換成二號門?」現在問題是–改變選擇(換另一扇門)是否對你有利?」

班:  「是的」

米奇:「記住!主持人知道那輛車在哪裡,你怎麼知道他不是在耍你?……」

Pages