1. AIWIN 心電圖智能診斷Baseline【線上0.719】

        共 1836字,需瀏覽 4分鐘

         ·

        2021-11-19 18:12

        今天老肥和大家分享的是AIWIN的秋季賽-心電圖智能診斷競賽的任務(wù)一Baseline方案,線上與線下驗證得分均為0.719,采用的是單模樹模型。

        賽題背景

        心電圖是臨床最基礎(chǔ)的一個檢查項目,因為安全、便捷成為心臟病診斷的利器。每天都有大量的心電圖診斷需求,但是全國范圍內(nèi)診斷心電圖的專業(yè)醫(yī)生數(shù)量不足,導(dǎo)致很多醫(yī)院都面臨專業(yè)心電圖醫(yī)生短缺的情況。

        人工智能技術(shù)的出現(xiàn),為改善醫(yī)生人力資源不足的問題帶來了全新的可能。由于心電圖數(shù)據(jù)與診斷的標(biāo)準(zhǔn)化程度較高,相對較易于運用人工智能技術(shù)進(jìn)行智能診斷算法的開發(fā)。

        賽題任務(wù)與數(shù)據(jù)

        本賽題任務(wù)一為要求針對心電圖輸出二元(正常 v.s 異常)分類標(biāo)簽,評價指標(biāo)為F1,心電數(shù)據(jù)的單位為mV,采樣率為 500HZ,記錄時長為 10 秒,存儲格式為 MAT;文件中存儲了 12 導(dǎo)聯(lián)的電壓信號(包含了I,II,III,aVR,aVL,aVF,V1,V2,V3,V4,V5 和 V6)。

        Baseline方案

        每個樣本心電圖的數(shù)據(jù)的形狀為(12,5000), 一個非常直觀的思路便是將其進(jìn)行分導(dǎo)聯(lián)采樣再將所有導(dǎo)聯(lián)展平作為訓(xùn)練的原始數(shù)據(jù)避免特征維度過大。

        def?get_data(sep_length):
        ????"""
        ????讀取數(shù)據(jù),提取部分?jǐn)?shù)據(jù)用于訓(xùn)練預(yù)測
        ????"
        ""

        ????train_path?=?glob.glob('data/train/*.mat')
        ????test_path?=?glob.glob('data/val/*.mat')

        ????matrix?=?np.zeros((2000,?5000?*?12?//?sep_length))

        ????i?=?0
        ????for?p?in?tqdm(train_path):
        ????????ecgdata?=?sio.loadmat(p)['ecgdata']
        ????????sep?=?ecgdata[:,?::sep_length]
        ????????sep?=?sep.reshape(-1,)
        ????????matrix[i,?:]?=?sep
        ????????i?+=?1
        ????for?p?in?tqdm(test_path):
        ????????ecgdata?=?sio.loadmat(p)['ecgdata']
        ????????sep?=?ecgdata[:,?::sep_length]
        ????????sep?=?sep.reshape(-1,)
        ????????matrix[i,?:]?=?sep
        ????????i?+=?1??

        ????data?=?pd.DataFrame(matrix)
        ????data.columns?=?[f'{i}'?for?i?in?range(len(data.columns))]
        ????return?data

        對于該數(shù)據(jù)進(jìn)行特征提取,主要包括不同導(dǎo)聯(lián)內(nèi)數(shù)據(jù)的均值、方差等統(tǒng)計,所有導(dǎo)聯(lián)數(shù)據(jù)的均值、方差等統(tǒng)計,因為該數(shù)據(jù)為時序,考慮對數(shù)據(jù)做差分再求統(tǒng)計。

        def?feature_eng(data,?f,?feat):
        ????"""
        ????統(tǒng)計特征
        ????"
        ""
        ????data[f'{f}_min']?=?data[feat].min(1)
        ????data[f'{f}_max']?=?data[feat].max(1)
        ????data[f'{f}_mean']?=?data[feat].mean(1)
        ????data[f'{f}_std']?=?data[feat].std(1)
        ????data[f'{f}_median']?=?data[feat].median(1)
        ????data[f'{f}_skew']?=?data[feat].skew(1)????
        ????return?data

        特征提取完后我們直接使用競賽利器LightGBM進(jìn)行五折交叉驗證訓(xùn)練預(yù)測并生成提交文件即可。

        除了上述內(nèi)容,我們可以進(jìn)一步對數(shù)據(jù)的時序特性進(jìn)行挖掘,也可以嘗試使用深度學(xué)習(xí)模型對本賽題任務(wù)進(jìn)行建模。最后,按照慣例我已上傳了完整Baseline代碼,在后臺回復(fù)「ECG」即可,祝大家比賽順利,獎金多多!


        END



        瀏覽 68
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
          
          

            1. 在线看国产精品 | 亚洲无码高清片在线 | 久久久一区二区三区电影 | 日韩AV在线免费观看 | 国产精品午夜一区二区三区视频 |