過去,醫(yī)療行業(yè)的研究人員需要手動(dòng)收集和分析大量數(shù)據(jù)來預(yù)測(cè)和治療疾病。面對(duì)復(fù)雜的數(shù)據(jù)信息,相關(guān)的數(shù)據(jù)分析工作極具挑戰(zhàn)性。隨著人工智能的發(fā)展,醫(yī)生在就診時(shí)根據(jù)實(shí)驗(yàn)室檢測(cè)結(jié)果、家族史、臨床試驗(yàn)數(shù)據(jù)和其他生命統(tǒng)計(jì)數(shù)據(jù)獲得實(shí)時(shí)分析報(bào)告將成為現(xiàn)實(shí)。本文以人工智能在重癥醫(yī)學(xué)中的應(yīng)用為例,描述了如何利用DarwinML來輔助醫(yī)療行業(yè)的數(shù)據(jù)科學(xué)家進(jìn)行自動(dòng)建模。數(shù)據(jù)融合數(shù)據(jù)提取平臺(tái)該平臺(tái)幫助醫(yī)學(xué)數(shù)據(jù)科學(xué)家將原始數(shù)據(jù)自動(dòng)轉(zhuǎn)換為模型可以使用的特征數(shù)據(jù)。該功能以數(shù)據(jù)流的形式實(shí)現(xiàn),研究人員可以通過修改參數(shù)和拖動(dòng)節(jié)點(diǎn)靈活改變特征提取過程。下圖是一個(gè)數(shù)據(jù)流圖。DarwinMLStudio自動(dòng)建模平臺(tái)從數(shù)據(jù)導(dǎo)入和清理開始。DarwinML可以自動(dòng)建模并給出模型的多向評(píng)價(jià)結(jié)果。數(shù)據(jù)科學(xué)家只需要關(guān)注模型的評(píng)估結(jié)果。根據(jù)研究目標(biāo),研究者將返回調(diào)整初始數(shù)據(jù)清理方案和模型設(shè)置,多次建立模型,并選擇滿足研究需要的最終模型。DarwinML自動(dòng)建模平臺(tái)的整個(gè)過程如下:1)數(shù)據(jù)清理:平衡樣本分布,填充缺失值,消除特征的異常值,數(shù)字化文本特征。2)模型設(shè)計(jì):根據(jù)研究人員的數(shù)據(jù)特征和參數(shù)設(shè)置,在搜索空間中自動(dòng)構(gòu)建最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)結(jié)構(gòu)將在平臺(tái)中顯示如下。3)超級(jí)參數(shù)調(diào)整:為最佳網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)特征提供匹配的最佳超級(jí)參數(shù)組合,如下圖所示“超級(jí)參數(shù)”欄中的XGBClassifiler的學(xué)習(xí)速率和嵌套參數(shù)。4)模型訓(xùn)練:使用最優(yōu)網(wǎng)絡(luò)和超級(jí)參數(shù)的組合來實(shí)際訓(xùn)練模型。5)模型評(píng)價(jià):給出了召回率、精度和AUC等基本指標(biāo)值,從模型角度給出了重要欄目的分析結(jié)果,從樣本角度給出了單個(gè)樣本的重要特征分析。同時(shí),DarwinML自動(dòng)建模平臺(tái)也支持只使用一些需要的功能。例如,我們可以導(dǎo)入一組新患者的檢查數(shù)據(jù),使用上次訓(xùn)練的模型,并且只評(píng)估模型,從而預(yù)測(cè)這組新患者的患病概率。病例:中嚴(yán)重感染綜合征(也稱為敗血癥)的預(yù)后研究根據(jù)其早期檢查指標(biāo),我們使用DarwinML對(duì)重癥監(jiān)護(hù)病房(ICU)中的患者進(jìn)行嚴(yán)重感染綜合征(也稱為敗血癥)的警告
電商動(dòng)態(tài)
面向醫(yī)療行業(yè)數(shù)據(jù)科學(xué)家的人工智能解決方案:自動(dòng)建模平臺(tái)
瀏覽:172 時(shí)間:2023-9-12