第一波FDA批準(zhǔn)的可穿戴數(shù)字健康監(jiān)測器與智能手表等消費(fèi)產(chǎn)品集成在一起,剛剛開始出現(xiàn)。醫(yī)療傳感器技術(shù)繼續(xù)快速發(fā)展,使緊湊、經(jīng)濟(jì)高效且越來越精確的生理傳感器能夠進(jìn)入現(xiàn)成的可穿戴設(shè)備。這種轉(zhuǎn)變的真正驅(qū)動因素之一是尖端機(jī)器學(xué)習(xí)和人工智能算法的可用性,這些算法可以從大量數(shù)據(jù)中提取和解釋有意義的信息。這包括噪聲數(shù)據(jù)和不太完美的信號(例如來自智能手表的ECG數(shù)據(jù)),這些信號被各種偽影損壞,這些偽影很難使用傳統(tǒng)算法進(jìn)行處理,這些算法往往是確定性和基于規(guī)則的。
直到最近,解開來自這些傳感器的生理信號中的秘密,以形成可接受的合理準(zhǔn)確的決策,對于監(jiān)管提交來說,這是具有挑戰(zhàn)性的,而且通常是不可能的。機(jī)器學(xué)習(xí)和人工智能算法的進(jìn)步現(xiàn)在使工程師和科學(xué)家能夠克服其中的許多挑戰(zhàn)。在本文中,我們將仔細(xì)研究處理生理信號的算法的整體架構(gòu),并揭開其操作的神秘面紗,將其轉(zhuǎn)變?yōu)榛跀?shù)十年研究的更真實(shí)的工程。
為了說明簡單機(jī)器學(xué)習(xí)算法的強(qiáng)大功能,這里有一個在線視頻,描述了來自活動跟蹤器中加速度計(jì)的數(shù)據(jù)如何預(yù)測佩戴者的各種運(yùn)動狀態(tài)或其余狀態(tài)。我們可以將這種方法擴(kuò)展到更復(fù)雜的現(xiàn)實(shí)世界醫(yī)療信號,如心電圖,并開發(fā)可以自動將ECG信號分類為正?;虮憩F(xiàn)出心房顫動的算法。
開發(fā)機(jī)器學(xué)習(xí)算法包括兩個主要步驟(圖 1)。此工作流的第一步是特征工程,其中從感興趣的數(shù)據(jù)集中提取某些數(shù)字/數(shù)學(xué)特征并呈現(xiàn)給后續(xù)步驟。在第二步中,將提取的特征輸入到眾所周知的統(tǒng)計(jì)分類或回歸算法中,例如適當(dāng)配置的支持向量機(jī)或傳統(tǒng)神經(jīng)網(wǎng)絡(luò),以提出經(jīng)過訓(xùn)練的模型,然后可用于新數(shù)據(jù)集進(jìn)行預(yù)測。使用表示良好的標(biāo)記數(shù)據(jù)集迭代訓(xùn)練此模型,直到達(dá)到令人滿意的準(zhǔn)確性,就可以在新數(shù)據(jù)集上將其用作生產(chǎn)環(huán)境中的預(yù)測引擎。
圖 1.包含訓(xùn)練和測試階段的典型機(jī)器學(xué)習(xí)工作流。
那么,這個工作流程如何尋找ECG信號分類問題呢?對于此案例研究,我們轉(zhuǎn)向2017年P(guān)hysioNet挑戰(zhàn)數(shù)據(jù)集,該數(shù)據(jù)集使用真實(shí)世界的單導(dǎo)聯(lián)ECG數(shù)據(jù)。目的是將患者的心電圖信號分為四類:正常,心房顫動,其他心律和太吵。在 MATLAB 中解決此問題的整個過程和各個步驟如圖 2 所示。
圖 2.用于開發(fā)機(jī)器學(xué)習(xí)算法以對心電圖信號進(jìn)行分類的 MATLAB 工作流程。
預(yù)處理和特征工程
特征工程步驟可能是開發(fā)強(qiáng)大的機(jī)器學(xué)習(xí)算法中最困難的部分。這樣的問題不能簡單地視為“數(shù)據(jù)科學(xué)”問題,因?yàn)樵谔剿鹘鉀Q這個問題的各種方法時,擁有生物醫(yī)學(xué)工程領(lǐng)域的知識來理解不同類型的生理信號和數(shù)據(jù)是很重要的。MATLAB等工具將數(shù)據(jù)分析和高級機(jī)器學(xué)習(xí)功能帶給領(lǐng)域?qū)<?,并使他們能夠更輕松地將高級機(jī)器學(xué)習(xí)功能等“數(shù)據(jù)科學(xué)”功能應(yīng)用于他們正在解決的問題,從而使他們能夠?qū)W⒂谔卣鞴こ?。在這個例子中,我們使用先進(jìn)的小波技術(shù)進(jìn)行信號處理,以消除噪聲和緩慢移動的趨勢,例如數(shù)據(jù)集中的呼吸偽影,并從信號中提取各種感興趣的特征。
開發(fā)分類模型
統(tǒng)計(jì)和機(jī)器學(xué)習(xí)工具箱中的分類學(xué)習(xí)器應(yīng)用程序?qū)τ趧偨佑|機(jī)器學(xué)習(xí)的工程師和科學(xué)家來說是一個特別有效的起點(diǎn)。在我們的示例中,一旦從信號中提取了足夠數(shù)量的有用和相關(guān)特征,我們就會使用此應(yīng)用程序快速探索各種分類器及其性能,并縮小我們的選項(xiàng)以進(jìn)行進(jìn)一步優(yōu)化。這些分類器包括決策樹、隨機(jī)森林、支持向量機(jī)和 K 最近鄰 (KNN)。這些分類算法使您能夠嘗試各種策略,并選擇為您的要素集提供最佳分類性能的策略(通常使用混淆矩陣或 ROC 曲線下的區(qū)域等指標(biāo)進(jìn)行評估)。在我們的案例中,我們很快就達(dá)到了所有班級約80%的整體準(zhǔn)確率,只需遵循這種方法(本次比賽的獲獎作品得分約為83%)。請注意,我們沒有花太多時間在特征工程或分類器調(diào)優(yōu)上,因?yàn)槲覀兊闹攸c(diǎn)是驗(yàn)證這種方法。通常,在特征工程和分類器調(diào)整上花費(fèi)一些時間可以顯著進(jìn)一步提高分類準(zhǔn)確性。更高級的技術(shù)(如深度學(xué)習(xí))也可以應(yīng)用于特征工程和提取以及分類步驟在單個訓(xùn)練步驟中組合在一起的問題,盡管與傳統(tǒng)機(jī)器學(xué)習(xí)技術(shù)相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能很好地工作。
挑戰(zhàn)、法規(guī)和未來承諾
雖然許多常用的可穿戴設(shè)備還沒有準(zhǔn)備好取代其FDA批準(zhǔn)和醫(yī)學(xué)驗(yàn)證的對應(yīng)設(shè)備,但所有技術(shù)和消費(fèi)者趨勢都強(qiáng)烈指向這個方向。FDA開始在簡化法規(guī)和鼓勵監(jiān)管科學(xué)的發(fā)展方面發(fā)揮積極作用,特別是通過數(shù)字健康軟件預(yù)認(rèn)證計(jì)劃以及設(shè)備開發(fā)中的建模和模擬等舉措。
從日常使用的可穿戴設(shè)備中收集的人類生理信號的愿景成為新的數(shù)字生物標(biāo)志物,可以提供我們健康的全面圖像,現(xiàn)在比以往任何時候都更加真實(shí),這在很大程度上要?dú)w功于信號處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的進(jìn)步。由 MATLAB 等工具支持的工作流使醫(yī)療設(shè)備的領(lǐng)域?qū)<夷軌驊?yīng)用和利用機(jī)器學(xué)習(xí)等數(shù)據(jù)科學(xué)技術(shù),而無需成為數(shù)據(jù)科學(xué)方面的專家。
審核編輯:郭婷
-
matlab
+關(guān)注
關(guān)注
185文章
2980瀏覽量
230801 -
人工智能
+關(guān)注
關(guān)注
1794文章
47631瀏覽量
239602 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132913
發(fā)布評論請先 登錄
相關(guān)推薦
評論