在本文中,我們將仔細(xì)研究用于處理生理信號(hào)的算法的整體架構(gòu),并揭開(kāi)其操作的神秘面紗。
第一波FDA批準(zhǔn)的可穿戴數(shù)字健康監(jiān)測(cè)器與智能手表等消費(fèi)產(chǎn)品集成在一起,才剛剛問(wèn)世。醫(yī)療傳感器技術(shù)繼續(xù)快速發(fā)展,使緊湊、經(jīng)濟(jì)高效且越來(lái)越精確的生理傳感器能夠進(jìn)入現(xiàn)成的可穿戴設(shè)備。這種轉(zhuǎn)變的真正驅(qū)動(dòng)力之一是尖端機(jī)器學(xué)習(xí)和人工智能算法的可用性,這些算法可以從大量數(shù)據(jù)中提取和解釋有意義的信息。這包括嘈雜的數(shù)據(jù)和不太完美的信號(hào)(例如來(lái)自智能手表的ECG數(shù)據(jù)),這些信號(hào)被各種偽影破壞,這些偽影很難使用傳統(tǒng)算法進(jìn)行處理,這些算法往往是確定性和基于規(guī)則的。
直到最近,解開(kāi)來(lái)自這些傳感器的生理信號(hào)中的秘密以形成監(jiān)管提交可接受的合理準(zhǔn)確的決策是一項(xiàng)挑戰(zhàn),而且通常是不可能的。機(jī)器學(xué)習(xí)和人工智能算法的進(jìn)步現(xiàn)在使工程師和科學(xué)家能夠克服其中的許多挑戰(zhàn)。在本文中,我們將仔細(xì)研究用于處理生理信號(hào)的算法的整體架構(gòu),并揭開(kāi)其操作的神秘面紗,將其轉(zhuǎn)變?yōu)榛跀?shù)十年研究的更真實(shí)的工程。
為了說(shuō)明簡(jiǎn)單機(jī)器學(xué)習(xí)算法的強(qiáng)大功能,這里有一個(gè)在線視頻,描述了活動(dòng)跟蹤器中加速度計(jì)的數(shù)據(jù)如何預(yù)測(cè)佩戴者的各種運(yùn)動(dòng)狀態(tài)或休息狀態(tài)。我們可以將這種方法擴(kuò)展到更復(fù)雜的真實(shí)世界醫(yī)療信號(hào),如ECG,并開(kāi)發(fā)可以自動(dòng)將ECG信號(hào)分類為正?;虮憩F(xiàn)出心房顫動(dòng)的算法。
開(kāi)發(fā)機(jī)器學(xué)習(xí)算法包括兩個(gè)主要步驟。此工作流的第一步是特征工程,其中從感興趣的數(shù)據(jù)集中提取某些數(shù)字/數(shù)學(xué)特征并將其呈現(xiàn)給后續(xù)步驟。在第二步中,將提取的特征輸入到眾所周知的統(tǒng)計(jì)分類或回歸算法中,例如支持向量機(jī)或傳統(tǒng)神經(jīng)網(wǎng)絡(luò),這些算法經(jīng)過(guò)適當(dāng)配置,以提出經(jīng)過(guò)訓(xùn)練的模型,然后可用于新的數(shù)據(jù)集進(jìn)行預(yù)測(cè)。一旦使用表示良好的標(biāo)記數(shù)據(jù)集迭代訓(xùn)練此模型,直到達(dá)到令人滿意的精度,就可以在新數(shù)據(jù)集上將其用作生產(chǎn)環(huán)境中的預(yù)測(cè)引擎。
那么,該工作流程如何查找ECG信號(hào)分類問(wèn)題呢?對(duì)于本案例研究,我們轉(zhuǎn)向2017年P(guān)hysioNet Challenge數(shù)據(jù)集,該數(shù)據(jù)集使用真實(shí)世界的單導(dǎo)聯(lián)心電圖數(shù)據(jù)。目的是將患者的心電圖信號(hào)分為四類之一:正常、心房顫動(dòng)、其他節(jié)律和太嘈雜。
預(yù)處理和特征工程
特征工程步驟可能是開(kāi)發(fā)強(qiáng)大的機(jī)器學(xué)習(xí)算法中最困難的部分。這樣的問(wèn)題不能簡(jiǎn)單地被視為“數(shù)據(jù)科學(xué)”問(wèn)題,因?yàn)樵谔剿鹘鉀Q此問(wèn)題的各種方法時(shí),擁有生物醫(yī)學(xué)工程領(lǐng)域的知識(shí)以了解不同類型的生理信號(hào)和數(shù)據(jù)非常重要。MATLAB 等工具為領(lǐng)域?qū)<規(guī)?lái)了數(shù)據(jù)分析和高級(jí)機(jī)器學(xué)習(xí)功能,使他們能夠更輕松地將“數(shù)據(jù)科學(xué)”功能(如高級(jí)機(jī)器學(xué)習(xí)功能)應(yīng)用于他們正在解決的問(wèn)題,從而專注于特征工程。在此示例中,我們使用先進(jìn)的小波技術(shù)進(jìn)行信號(hào)處理,以消除數(shù)據(jù)集中的噪聲和緩慢移動(dòng)的趨勢(shì),例如呼吸偽影,并從信號(hào)中提取各種感興趣的特征。
開(kāi)發(fā)分類模型
統(tǒng)計(jì)和機(jī)器學(xué)習(xí)工具箱中的分類學(xué)習(xí)器應(yīng)用程序?qū)τ趧偨佑|機(jī)器學(xué)習(xí)的工程師和科學(xué)家來(lái)說(shuō)是一個(gè)特別有效的起點(diǎn)。在我們的示例中,一旦從信號(hào)中提取了足夠數(shù)量的有用和相關(guān)特征,我們使用此應(yīng)用程序快速探索各種分類器及其性能,并縮小進(jìn)一步優(yōu)化的選項(xiàng)范圍。這些分類器包括決策樹(shù)、隨機(jī)森林、支持向量機(jī)和 K 最近鄰 (KNN)。這些分類算法使您能夠嘗試各種策略,并選擇為特征集提供最佳分類性能的策略(通常使用混淆矩陣或 ROC 曲線下面積等指標(biāo)進(jìn)行評(píng)估)。在我們的案例中,我們很快就在所有課程中達(dá)到了~80%的總體準(zhǔn)確率,只需遵循這種方法(本次比賽的獲勝作品得分約為83%)。請(qǐng)注意,我們沒(méi)有花太多時(shí)間在特征工程或分類器調(diào)優(yōu)上,因?yàn)槲覀兊闹攸c(diǎn)是驗(yàn)證該方法。通常,花一些時(shí)間在特征工程和分類器調(diào)整上會(huì)導(dǎo)致分類準(zhǔn)確性的顯著進(jìn)一步提高。更高級(jí)的技術(shù)(如深度學(xué)習(xí))也可以應(yīng)用于此類問(wèn)題,其中特征工程和提取以及分類步驟組合在一個(gè)訓(xùn)練步驟中,盡管與傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作。
挑戰(zhàn)、法規(guī)和未來(lái)承諾
雖然許多常用的可穿戴設(shè)備還沒(méi)有準(zhǔn)備好取代FDA批準(zhǔn)和醫(yī)學(xué)驗(yàn)證的對(duì)應(yīng)設(shè)備,但所有技術(shù)和消費(fèi)趨勢(shì)都強(qiáng)烈指向這個(gè)方向。FDA開(kāi)始在簡(jiǎn)化法規(guī)和鼓勵(lì)監(jiān)管科學(xué)發(fā)展方面發(fā)揮積極作用,特別是通過(guò)數(shù)字健康軟件預(yù)認(rèn)證計(jì)劃以及設(shè)備開(kāi)發(fā)中的建模和仿真等舉措。
從日常使用可穿戴設(shè)備中收集的人類生理信號(hào)成為新的數(shù)字生物標(biāo)志物,可以提供我們健康狀況的全面圖景,現(xiàn)在比以往任何時(shí)候都更加真實(shí),這在很大程度上是由于信號(hào)處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的進(jìn)步。由 MATLAB 等工具支持的工作流使醫(yī)療設(shè)備的領(lǐng)域?qū)<夷軌驊?yīng)用和利用機(jī)器學(xué)習(xí)等數(shù)據(jù)科學(xué)技術(shù),而無(wú)需成為數(shù)據(jù)科學(xué)專家。
審核編輯:郭婷
-
AI
+關(guān)注
關(guān)注
87文章
31294瀏覽量
269651 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132845
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論