機器學習模型調優(yōu)的三大改進策略!
轉自 | 機器之心
無論是 Kaggle 競賽還是工業(yè)部署,機器學習模型在搭建起來之后都面臨著無盡的調優(yōu)需求。在這個過程中我們要遵循怎樣的思路呢?
https://www.mage.ai/blog/definitive-guide-to-accuracy-precision-recall-for-product-developers
https://www.mage.ai/blog/product-developers-guide-to-ml-regression-model-metrics



創(chuàng)建一個功能來計算文本中的字母數(shù)。
創(chuàng)建一個功能來計算文本中的單詞數(shù)。
創(chuàng)建一個理解文本含義的特征(例如詞嵌入)。
過去 7 天、30 天或 90 天的聚合用戶事件計數(shù)。
從日期或時間戳特征中提取「日」、「月」、「年」和「假期后的天數(shù)」等特征。



嘗試所有改進模型的策略。
將模型性能與你必須驗證的其他一些指標進行比較,以驗證模型是否有意義。
在進行了幾輪模型調整后,評估一下繼續(xù)修改和性能提升百分點之間的性價比。
如果模型表現(xiàn)良好,并且在嘗試了一些想法后幾乎沒有繼續(xù)改進,請將模型部署到生產過程中并測量實際性能。
如果真實條件下的性能和測試環(huán)境中類似,那你的模型就算可以用了。如果生產性能比訓練中的性能差,則說明訓練中存在一些問題,這可能是因為過擬合或者數(shù)據(jù)泄露。這意味著還需要重新調整模型。
往期精彩:
評論
圖片
表情
