MedMNIST:上海交大發(fā)布醫(yī)學影像領(lǐng)域的MNIST(附下載)
點擊上方“AI算法與圖像處理”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
來源:我愛計算機視覺
今天上海交大的研究學者發(fā)文?MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis ,公布了其收集整理的10個醫(yī)學領(lǐng)域的圖像數(shù)據(jù)集MedMNIST,旨在促進AutoML(自動機器學習)在醫(yī)學領(lǐng)域的技術(shù)研究。
作者信息:

這10個數(shù)據(jù)集示例:

該數(shù)據(jù)集特點:
利于研究教學:數(shù)據(jù)來自具有知識共享(CC)許可的多個開放式醫(yī)學圖像數(shù)據(jù)集,易于用于教育目的。
標準化:將數(shù)據(jù)預處理為相同格式,無需用戶了解任何背景知識
多樣性:涵蓋了各種數(shù)據(jù)規(guī)模(從100到100,000)和任務(二分類/多類分類,有序回歸和多標簽學習)。
輕量級:28×28的圖像大小適合快速原型設(shè)計和試驗多模態(tài)機器學習和AutoML算法。
該數(shù)據(jù)集相關(guān)統(tǒng)計:
可見覆蓋了常見的醫(yī)學影像數(shù)據(jù)源:病理圖片、胸部X光、皮膚鏡、超聲、眼底攝影、OCT、CT等。
另外,作者提供了代碼,在此10個數(shù)據(jù)集上進行了人工設(shè)計網(wǎng)絡(luò)和常見AutoML工具設(shè)計的模型的評測,結(jié)果如下:

可見:
Google AutoML Vision 在大多數(shù)情況下都表現(xiàn)不錯,但相比手工設(shè)計的 ResNet-18/50也有遜色的時候;
auto-sklearn 的表現(xiàn)一直很穩(wěn)定的差 /sad;
AutoKeras?在數(shù)據(jù)量較大的數(shù)據(jù)集上表現(xiàn)很好,在數(shù)據(jù)量小時往往不佳。
總之,以上AutoML工具在MedMNIST面前沒有完美勝出者,這也說明MedMNIST對于研究者來說是個好數(shù)據(jù)集。
最后附上項目主頁:
https://medmnist.github.io/
論文地址:
https://arxiv.org/abs/2010.14925
Demo代碼地址:
https://github.com/MedMNIST/MedMNIST
下載:
原數(shù)據(jù)地址國內(nèi)無法下載,不過不用擔心,公眾號后臺回復“MedMNIST”,即可收到論文、代碼、數(shù)據(jù)打包下載鏈接。
END
下載1:速查表
在「AI算法與圖像處理」公眾號后臺回復:速查表,即可下載21張 AI相關(guān)的查找表,包括 python基礎(chǔ),線性代數(shù),scipy科學計算,numpy,kears,tensorflow等等
下載2 CVPR2020 在「AI算法與圖像處理」公眾號后臺回復:CVPR2020,即可下載1467篇CVPR?2020論文 個人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學校/企業(yè)+研究方向+昵稱
覺得有趣就點亮在看吧



