在假設(shè)檢驗(yàn)中,我們會(huì)使用樣本中的數(shù)據(jù)來(lái)描繪有關(guān)總體的結(jié)論。首先,我們會(huì)進(jìn)行假設(shè),這被稱為原假設(shè)(以 H0 表示)。當(dāng)您進(jìn)行原假設(shè)時(shí),您也需要定義備擇假設(shè) (Ha),其與原假設(shè)正相反。樣本數(shù)據(jù)將用于判斷 H0 是否可以被否定。如果其被否定,則統(tǒng)計(jì)結(jié)論將認(rèn)為備擇假設(shè) Ha 正確。
請(qǐng)記住這一檢驗(yàn)的功效,或是在原假設(shè)不正確時(shí),原假設(shè)被否定的可能性。
它可以解釋為“檢驗(yàn)在應(yīng)該拒絕原假設(shè)時(shí)拒絕原假設(shè)的能力”。如果原假設(shè)不正確,則有很高概率拒絕原假設(shè)是很有意義的。功效與類型 2 的錯(cuò)誤相關(guān)(功效 = 1 - 類型 2 錯(cuò)誤),請(qǐng)見(jiàn)下表。類型 2 錯(cuò)誤是當(dāng)備選假設(shè)正確時(shí)不拒絕原假設(shè)的概率。因此,確保有足夠高的功效,才能保證類型 2 錯(cuò)誤較低或“可以接受”。確保檢驗(yàn)有足夠功效的一種常用方法是收集足夠的數(shù)據(jù),因?yàn)楣πУ挠?jì)算取決于樣本數(shù)量等因子。樣本數(shù)量越大,功效越高。換言之,未能收集足夠的數(shù)據(jù)將導(dǎo)致低功效和大量類型 2 錯(cuò)誤。
最重要的是要找到合適的樣本數(shù)量。顯而易見(jiàn),未能收集足夠的數(shù)據(jù)會(huì)導(dǎo)致更多的類型 2 錯(cuò)誤。但是,收集“過(guò)多”的數(shù)據(jù)也會(huì)增加類型 1 錯(cuò)誤,因?yàn)闄z驗(yàn)的功效會(huì)更高。因此,該檢驗(yàn)可能會(huì)檢測(cè)到與假設(shè)值的微小差異,即使該差異可能沒(méi)有任何實(shí)際意義,尤其是與抽樣成本有關(guān)時(shí)。檢驗(yàn)功效的計(jì)算應(yīng)當(dāng)基于實(shí)際意義。
Minitab 具有通過(guò)多種不同統(tǒng)計(jì)檢驗(yàn)計(jì)算功效的功能,在下列示例中,分析人員在 Minitab 中通過(guò)單比率檢驗(yàn)和單樣本 t 檢驗(yàn),進(jìn)行了功效和樣本數(shù)量分析。
單比率檢驗(yàn)樣本數(shù)量
考慮將產(chǎn)品分類為好或差的制造過(guò)程,其中有 1% 的不良品率。如果不良品率上升至 3%,則會(huì)對(duì)整個(gè)組織造成嚴(yán)重的成本問(wèn)題。他們需要確定合適的樣本數(shù)量,以滿足:類型 I 錯(cuò)誤率為 0.05,檢驗(yàn)功效為 0.80,以檢測(cè)出不良品率從 1% 上升至 3% 或更高。
因?yàn)榉治鋈藛T對(duì)不良品率研究感興趣,他們使用了單比率檢驗(yàn)。原假設(shè)和備選假設(shè)是:
Ho: P = 0.01
Ha: P > 0.01
其中 P 為實(shí)際缺陷比率。
為了找出需要多少數(shù)據(jù)點(diǎn)才能達(dá)到至少0.8的功效,分析人員在 Minitab 中進(jìn)行了單比率檢驗(yàn)的功效和樣本數(shù)量分析。
單樣本 t 檢驗(yàn)的樣本數(shù)量
將產(chǎn)品分類為好或差很簡(jiǎn)單,但會(huì)損失很多信息。將好產(chǎn)品視為在 5 到 10 之間。假如有 2 個(gè)單元測(cè)得的數(shù)值為 4.9 和 10.01,并因而歸入差的分類。假如有另外 2 個(gè)單元測(cè)得的數(shù)值為 2.3 和 14.1,并因而歸入差的分類。請(qǐng)注意,如果只是簡(jiǎn)單的區(qū)分好和差,這兩種情況是相同的。因此,如果測(cè)量產(chǎn)品質(zhì)量特征是可行的,那么分析人員應(yīng)該記錄質(zhì)量特征的實(shí)際值,并使用記錄的數(shù)據(jù) – 無(wú)需轉(zhuǎn)換為好和差。單樣本 t 檢驗(yàn)可以用于檢驗(yàn)總體的均值是否與目標(biāo)一致。如果樣本數(shù)據(jù)的均值接近“目標(biāo)”,則該過(guò)程可能運(yùn)行良好。如果均值不接近目標(biāo),則可能生產(chǎn)出缺陷產(chǎn)品。
例如,假設(shè)該產(chǎn)品特征為特定目標(biāo)的孔直徑。分析人員可以測(cè)量每個(gè)產(chǎn)品上的孔直徑,并使用單樣本 t 檢驗(yàn)將均值與目標(biāo)值進(jìn)行比較,而不是檢查 236 個(gè)產(chǎn)品以確定孔是否符合規(guī)格。
為了找出需要多少數(shù)據(jù)點(diǎn)來(lái)檢測(cè)至少 80% 功效的過(guò)程均值中的 1 西格瑪偏移,分析人員在 Minitab 中對(duì)一個(gè)單樣本 t 檢驗(yàn)進(jìn)行功效和樣本數(shù)量分析。
計(jì)算的樣本數(shù)量?jī)H為 10。這意味著如果分析人員希望確定目標(biāo)的偏離均值是否超過(guò)了 1 西格瑪,則他們需要進(jìn)行 10 個(gè)單位的單樣本 t 檢驗(yàn),以獲得至少 80% 的功效。
為什么會(huì)有這么大的區(qū)別?
屬性數(shù)據(jù)的假設(shè)檢驗(yàn)需要大量樣本,因?yàn)樵谑占瘮?shù)據(jù)時(shí)沒(méi)有獲取詳細(xì)信息。另一方面,連續(xù)數(shù)據(jù)的假設(shè)檢驗(yàn)只需較少的樣本數(shù)量,因?yàn)槠浍@取并使用了產(chǎn)品的詳細(xì)信息。該理論不僅適用于功效。屬性數(shù)據(jù)需要大量樣本以用于置信區(qū)間、屬性一致性分析、控制圖和能力分析。
總之,重要的是進(jìn)行具有足夠功效的假設(shè)檢驗(yàn),以提供合理的機(jī)會(huì)來(lái)檢測(cè)差異。功效與樣本數(shù)量直接相關(guān)。Minitab 具有計(jì)算多種不同假設(shè)檢驗(yàn)(包括試驗(yàn)設(shè)計(jì))的功效的功能。
審核編輯 黃宇
-
Minitab
+關(guān)注
關(guān)注
0文章
178瀏覽量
11731 -
假設(shè)檢驗(yàn)
+關(guān)注
關(guān)注
0文章
4瀏覽量
4869
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論