第一波 FDA 批準的可穿戴數(shù)字健康監(jiān)測器與智能手表等消費產(chǎn)品相結(jié)合,才剛剛面世。醫(yī)療傳感器技術(shù)繼續(xù)快速發(fā)展,使緊湊、經(jīng)濟且越來越精確的生理傳感器能夠進入現(xiàn)成的可穿戴設(shè)備。這種轉(zhuǎn)變的真正驅(qū)動因素之一是尖端機器學習和人工智能算法的可用性,這些算法可以從大量數(shù)據(jù)中提取和解釋有意義的信息。這包括噪聲數(shù)據(jù)和不太完美的信號(例如來自智能手表的 ECG 數(shù)據(jù)),這些信號被各種難以使用往往是確定性和基于規(guī)則的傳統(tǒng)算法處理的偽影破壞。
直到最近,解開來自這些傳感器的生理信號中的秘密以形成可接受的監(jiān)管提交的合理準確的決策是具有挑戰(zhàn)性的,而且通常是不可能的。機器學習和人工智能算法的進步現(xiàn)在使工程師和科學家能夠克服許多這些挑戰(zhàn)。在本文中,我們將仔細研究用于處理生理信號的算法的整體架構(gòu),并揭開其操作的神秘面紗,將其轉(zhuǎn)變?yōu)榻?jīng)過數(shù)十年研究建立的更真實的工程。
為了說明簡單的機器學習算法的強大功能,這里有一個在線視頻,描述了來自活動跟蹤器中的加速度計的數(shù)據(jù)如何預(yù)測佩戴者的各種運動或休息狀態(tài)。我們可以將這種方法擴展到更復(fù)雜的現(xiàn)實世界醫(yī)學信號,例如心電圖,并開發(fā)可以自動將心電圖信號分類為正常或表現(xiàn)出心房顫動的算法。
開發(fā)機器學習算法包括兩個主要步驟(圖 1)。此工作流程的第一步是特征工程,其中從感興趣的數(shù)據(jù)集中提取某些數(shù)值/數(shù)學特征并將其呈現(xiàn)給后續(xù)步驟。第二步,將提取的特征輸入眾所周知的統(tǒng)計分類或回歸算法,例如支持向量機或適當配置的傳統(tǒng)神經(jīng)網(wǎng)絡(luò),以提出可用于新數(shù)據(jù)的訓(xùn)練模型設(shè)置為預(yù)測。一旦使用具有良好代表性的標記數(shù)據(jù)集對該模型進行迭代訓(xùn)練,直到達到令人滿意的準確性,它就可以在新的數(shù)據(jù)集上用作生產(chǎn)環(huán)境中的預(yù)測引擎。
圖 1. 包含訓(xùn)練和測試階段的典型機器學習工作流程。
那么這個工作流程如何尋找心電圖信號分類問題呢?在本案例研究中,我們轉(zhuǎn)向2017 PhysioNet Challenge數(shù)據(jù)集,該數(shù)據(jù)集使用真實世界的單導(dǎo)聯(lián)心電圖數(shù)據(jù)。目的是將患者的 ECG 信號分類為以下四個類別之一:正常、心房顫動、其他節(jié)律和太嘈雜。在 MATLAB 中解決此問題的總體過程和各個步驟如圖 2 所示。
圖 2. 用于開發(fā)機器學習算法以對 ECG 信號進行分類的 MATLAB 工作流程。
預(yù)處理和特征工程
特征工程步驟可能是開發(fā)強大的機器學習算法中最難的部分。這樣的問題不能簡單地被視為“數(shù)據(jù)科學”問題,因為在探索解決這個問題的各種方法時,擁有生物醫(yī)學工程領(lǐng)域的知識來理解不同類型的生理信號和數(shù)據(jù)非常重要。MATLAB 等工具將數(shù)據(jù)分析和高級機器學習功能帶給領(lǐng)域?qū)<?,使他們能夠更輕松地將高級機器學習等“數(shù)據(jù)科學”功能應(yīng)用于他們正在解決的問題,從而專注于特征工程。在這個例子中,
開發(fā)分類模型
Statistics and Machine Learning Toolbox 中的分類學習器應(yīng)用程序?qū)τ趧偨佑|機器學習的工程師和科學家來說是一個特別有效的起點。在我們的示例中,一旦從信號中提取了足夠數(shù)量的有用且相關(guān)的特征,我們就會使用這個應(yīng)用程序來快速探索各種分類器及其性能,并縮小我們進一步優(yōu)化的選項。這些分類器包括決策樹、隨機森林、支持向量機和 K 近鄰 (KNN)。這些分類算法使您能夠嘗試各種策略并選擇為您的特征集提供最佳分類性能的策略(通常使用混淆矩陣或 ROC 曲線下面積等指標進行評估)。在我們的案例中,我們很快就在所有類別中達到了約 80% 的總體準確率,只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調(diào)整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調(diào)整上會導(dǎo)致分類準確性的顯著進一步提高。更高級的技術(shù)(如深度學習)也可以應(yīng)用于特征工程和提取以及分類步驟結(jié)合在一個訓(xùn)練步驟中的問題,盡管與傳統(tǒng)方法相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作機器學習技術(shù)。只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調(diào)整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調(diào)整上會導(dǎo)致分類準確性的顯著進一步提高。更高級的技術(shù)(如深度學習)也可以應(yīng)用于特征工程和提取以及分類步驟結(jié)合在一個訓(xùn)練步驟中的問題,盡管與傳統(tǒng)方法相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作機器學習技術(shù)。只需遵循這種方法(本次比賽的獲勝作品得分約為 83%)。請注意,我們沒有花太多時間在特征工程或分類器調(diào)整上,因為我們的重點是驗證方法。通常,花一些時間在特征工程和分類器調(diào)整上會導(dǎo)致分類準確性的顯著進一步提高。更高級的技術(shù)(如深度學習)也可以應(yīng)用于特征工程和提取以及分類步驟結(jié)合在一個訓(xùn)練步驟中的問題,盡管與傳統(tǒng)方法相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作機器學習技術(shù)。因為我們的重點是驗證該方法。通常,花一些時間在特征工程和分類器調(diào)整上會導(dǎo)致分類準確性的顯著進一步提高。更高級的技術(shù)(如深度學習)也可以應(yīng)用于特征工程和提取以及分類步驟結(jié)合在一個訓(xùn)練步驟中的問題,盡管與傳統(tǒng)方法相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作機器學習技術(shù)。因為我們的重點是驗證該方法。通常,花一些時間在特征工程和分類器調(diào)整上會導(dǎo)致分類準確性的顯著進一步提高。更高級的技術(shù)(如深度學習)也可以應(yīng)用于特征工程和提取以及分類步驟結(jié)合在一個訓(xùn)練步驟中的問題,盡管與傳統(tǒng)方法相比,這種方法通常需要更大的訓(xùn)練數(shù)據(jù)集才能正常工作機器學習技術(shù)。
挑戰(zhàn)、法規(guī)和未來承諾
雖然許多常見的可穿戴設(shè)備還沒有完全準備好取代 FDA 批準和醫(yī)學驗證的同類設(shè)備,但所有技術(shù)和消費趨勢都強烈指向這個方向。FDA 開始在簡化法規(guī)和鼓勵監(jiān)管科學的發(fā)展方面發(fā)揮積極作用,特別是通過數(shù)字健康軟件預(yù)認證計劃以及設(shè)備開發(fā)中的建模和模擬等舉措。
從日常使用的可穿戴設(shè)備收集的人體生理信號成為新的數(shù)字生物標志物,可以提供我們健康的全面圖片,這一愿景現(xiàn)在比以往任何時候都更加真實,這在很大程度上歸功于信號處理、機器學習和深度學習的進步算法。MATLAB 等工具支持的工作流程使醫(yī)療設(shè)備領(lǐng)域的專家能夠應(yīng)用和利用機器學習等數(shù)據(jù)科學技術(shù),而無需成為數(shù)據(jù)科學專家。
審核編輯:郭婷
-
機器學習
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132832 -
可穿戴設(shè)備
+關(guān)注
關(guān)注
55文章
3818瀏覽量
167151 -
深度學習
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121334
發(fā)布評論請先 登錄
相關(guān)推薦
評論