神奇的正態(tài)分布源于“加”。
時(shí)隔多年,或許你早就記不得歲那年夏天高中悶熱的教室,但可能會(huì)記得有一天數(shù)學(xué)老師說(shuō)著要給大伙看個(gè)稀奇——一塊祖?zhèn)鞯母郀栴D板。盡管班上大多數(shù)同學(xué)都叫不出它的名字,卻也從小到大在科技館、博物館見(jiàn)多了,一點(diǎn)都提不起勁兒。老師一本正經(jīng)地開(kāi)始講,這個(gè)圖形就是正態(tài)分布,它有諸多的性質(zhì)……午后的時(shí)光更加昏沉而緩慢地流逝。
不過(guò),這里面蘊(yùn)含的數(shù)學(xué)可一點(diǎn)都不無(wú)聊,讓我們來(lái)觀察一下高爾頓板的結(jié)構(gòu)。
從最上方的節(jié)點(diǎn)往下,是幾排交錯(cuò)排列的釘子。從入口扔下的小球撞上一個(gè)釘子,就像觸網(wǎng)的乒乓球一樣,彈向左邊和右邊的概率相等。咦?這不就是老早學(xué)過(guò)的楊輝三角嗎?最上方只有一種可能,下降之后,左右兩邊比例變成,繼續(xù)這個(gè)步驟,第行的比例系數(shù)其實(shí)就是次二項(xiàng)式的展開(kāi)系數(shù)或者。正因如此,這種分布被稱(chēng)為二項(xiàng)分布。
楊輝三角/圖片來(lái)源:維基百科
二項(xiàng)式系數(shù)看起來(lái)與正態(tài)分布風(fēng)馬牛不相及,但是從高爾頓板的實(shí)驗(yàn)看來(lái),要是增加釘子的層數(shù)和底部的格子數(shù)(也就是增加),那么二項(xiàng)分布將逼近于正態(tài)分布:
二項(xiàng)分布逼近正態(tài)分布的過(guò)程丨圖片來(lái)源:維基百科
為什么一個(gè)離散的分布會(huì)跟一個(gè)連續(xù)的分布扯上關(guān)系呢?這個(gè)結(jié)論最早由法國(guó)數(shù)學(xué)家棣莫弗在1738年證明,他發(fā)現(xiàn),如果不斷地拋一枚硬幣,那么得到的正面次數(shù)服從二項(xiàng)分布,只要拋得次數(shù)夠多,那最終將逼近正態(tài)分布。也就是說(shuō),假如賭博勝和負(fù)的概率是對(duì)半分的,那么賭博次的盈虧最終就是上面這個(gè)分布。
棣莫弗(Abraham de Moivre 1667-1754)丨圖片來(lái)源:維基百科
不過(guò)這一結(jié)論在當(dāng)時(shí)并沒(méi)有引起重視,畢竟并不是所有賭徒都能像梅雷一樣交上帕斯卡這樣的朋友。百年之后,拉普拉斯試圖挽救這個(gè)定理的人氣,依然沒(méi)有成功。為了紀(jì)念這對(duì)“難兄難弟”,現(xiàn)在人們把這個(gè)定理稱(chēng)為棣莫弗-拉普拉斯定理。
這種逼近的本質(zhì)究竟是什么呢?我們看到,不管是高爾頓板,還是多次賭博,二項(xiàng)分布拆成每一步都是簡(jiǎn)單的概率事件。那么就可以說(shuō),二項(xiàng)分布是這樣的一步一步“加”起來(lái)的。
如果是比更復(fù)雜的分布,把它們大量加起來(lái)是否仍然有類(lèi)似的性質(zhì)呢?高斯等人在研究實(shí)驗(yàn)物理學(xué)時(shí)發(fā)現(xiàn),如果對(duì)一個(gè)物理量進(jìn)行多次測(cè)量,最終的測(cè)量誤差總是像這樣的:
誤差演示丨Python作圖
在物理學(xué)中,誤差來(lái)自于無(wú)關(guān)因素的微小擾動(dòng)。這些擾動(dòng)加起來(lái),就是整體的誤差。這個(gè)整體誤差雖然層次不齊,但形狀與正態(tài)分布還是大致吻合的。從那以后,實(shí)驗(yàn)的誤差一般都當(dāng)作是正態(tài)分布。為了紀(jì)念高斯的貢獻(xiàn),也把正態(tài)分布稱(chēng)為高斯分布。
至此,我們已經(jīng)大概能想象到,正態(tài)分布的逼近與這種“加”的性質(zhì)有關(guān),剩下證明就是數(shù)學(xué)家的事了。如今,我們把這一系列逼近正態(tài)分布的性質(zhì)稱(chēng)為“中心極限定理”,結(jié)論從最初的二項(xiàng)分布,已經(jīng)擴(kuò)展到了任意分布(包括同分布和不同分布)的廣闊天地。就如同上一段中的誤差——即便我們對(duì)微觀下的擾動(dòng)一無(wú)所知,也能通過(guò)這種極限形式,了解大樣本下的整體行為。
應(yīng)用這一思想的最為經(jīng)典的例子當(dāng)屬統(tǒng)計(jì)力學(xué)。假如有一大堆粒子,每個(gè)都雜亂無(wú)章地運(yùn)動(dòng),我們自然無(wú)從知曉每一個(gè)粒子的運(yùn)動(dòng)狀況。不過(guò),如果把每一個(gè)粒子的動(dòng)量當(dāng)作是一個(gè)隨機(jī)分布的話(huà),那就可以把所有這些分布“加”起來(lái)當(dāng)做整體的動(dòng)量。如此一來(lái),中心極限定理豈不是大有用處?
的確如此。如果對(duì)理想氣體應(yīng)用中心極限定理,得到的正是大名鼎鼎的麥克斯韋速度分布:
這正是均值為,方差為的正態(tài)分布。結(jié)論并不出乎意料,畢竟速度是矢量,并沒(méi)有明顯的方向取向,所以均值是。方差的意義略微復(fù)雜一些,就此略過(guò),不過(guò)可以直觀地理解:對(duì)于溫度越高,粒子質(zhì)量越小的氣體,其速度就越不穩(wěn)定。
要想得到速率(速度大?。┑姆植?,只需要考慮速度分布這個(gè)三維空間中的一個(gè)球殼就行了。即是說(shuō),在上面那個(gè)式子基礎(chǔ)上乘
麥克斯韋速率分布丨圖片來(lái)源:維基百科
物理學(xué)中一般是用玻爾茲曼分布來(lái)推導(dǎo)麥克斯韋分布的,但玻爾茲曼分布本身也可以用中心極限定理間接推導(dǎo)出來(lái)。之所以說(shuō)是間接,只需要看它的形式
這根本不是正態(tài)分布。歸根結(jié)底,能量的分布在這里不能相加,但在推導(dǎo)過(guò)程中,還是能見(jiàn)到正態(tài)分布。具體操作會(huì)稍微復(fù)雜一些,這里就不扯遠(yuǎn)了。
責(zé)任編輯:lq
-
測(cè)量
+關(guān)注
關(guān)注
10文章
4859瀏覽量
111310 -
物理
+關(guān)注
關(guān)注
0文章
101瀏覽量
25089 -
系數(shù)
+關(guān)注
關(guān)注
0文章
15瀏覽量
8245
原文標(biāo)題:中心極限定理:從高爾頓板到麥克斯韋分布
文章出處:【微信號(hào):bdtdsj,微信公眾號(hào):中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論