3行代碼完成時序建模,最新開源的時序算法發(fā)布!
?Datawhale開源?
方向:時間序列開源項目
時序是什么?時序預測可以為業(yè)務帶來哪些價值? 產品銷量預測、電池剩余壽命預測……這些高價值場景如何提高預測準確率? 深度學習模型在時序預測有什么優(yōu)勢? 如何尋得一款集前沿高尖時序技術的產品,為業(yè)務所用? 近日,百度飛槳重磅發(fā)布了一款 開源時序建模算法庫——PaddleTS ,可以幫助開發(fā)者實現(xiàn)時序數(shù)據(jù)處理、分析、建模、預測全流程,具有更優(yōu)的使用體驗:- 超易用 :3行代碼即可完成時序建模
- 速度快 :模型訓練效率比同類產品快2倍
- 效果好 :時序專屬的自動建模與集成預測效果突出
-
零售企業(yè) :準確的預測產品銷量,可以為企業(yè)備貨、配送、運營策略的制定提供有效依據(jù),顯著降本增效;
- 電網(wǎng)公司 :準確的預測發(fā)電量與用電量,可以使電網(wǎng)的調度更加合理化,發(fā)揮最大效能;
- 制造企業(yè) :提前預測生產設備可能發(fā)生的故障,可以提前預警、維修,降低停工造成的損失;
- 新能源車企 :實時預測電池剩余電量、預測剩余壽命,可以更經濟、更合理的使用車輛;
- 金融領域 :利率、股票、現(xiàn)金流、外匯等走勢預測都對經濟產生重大影響。
?
工業(yè)設備異常檢測
經典的機器學習算法應用到時間序列預測中,其優(yōu)勢在于模型使用靈活、訓練簡單,但也存在明顯的缺點,需要大量的人工工作在特征工程上。近年來,深度學習逐步在語音、視覺、自然語言理解等領域得到廣泛應用,其算法的優(yōu)勢明顯。首先,它可以自動捕捉關鍵特征,不需要依賴統(tǒng)計學知識,不需要復雜的特征工程;其次,它在建模流程與準確率上有著機器學習不可比擬的優(yōu)勢;此外,它還具備很多功能優(yōu)勢,如使用靈活、表達力強、兼容多樣性等。
既然深度學習這么優(yōu)秀,怎么為時序場景業(yè)務所用呢?
PaddleTS提供了一系列先進的基于深度學習技術的時序建模算法及相關組件
,它功能豐富、簡單易用、效果領先,包括能源、交通、制造等多個行業(yè)客戶早已應用起來,還不快來試試~~

- GitHub傳送門
https://github.com/PaddlePaddle/PaddleTS
PaddleTS相關技術交流群
1. 微信掃描下方二維碼,關注公眾號,填寫問卷后進入微信群
2. 查看 群公告 領取福利

功能全面豐富
PaddleTS覆蓋 時序預測 和 時序異常檢測 兩大核心應用場景,針對建模全流程,提供了豐富的功能。既支持單變量也支持多變量的時序分析,同時還具備模型融合、自動建模及豐富的建模工具組件。PaddleTS無論是在功能豐富度上,還是在集成的時序算法數(shù)量上,都超過了市面上典型的開源時序產品。除了基礎能力以外,產品還有以下特色功能:
-
全面的數(shù)據(jù)類型支持 :PaddleTS提供的 協(xié)變量支持 功能,支持歷史觀測協(xié)變量、未來可知協(xié)變量、靜態(tài)協(xié)變量和分類變量等各種協(xié)變量數(shù)據(jù)類型,幫助開發(fā)者有效利用各種數(shù)據(jù)充分發(fā)揮數(shù)據(jù)的價值。
- 主流新穎的深度模型 :PaddleTS集成了 Transformer、TCN、 VAE、TS2Vec 、 N-beats 等豐富的深度學習模型,可以很好的捕捉復雜時序場景中的多變量動態(tài)依賴關系,解決長周期、多變量、小樣本等問題,取得更好的模型效果。
- 豐富的分析建模工具集 :PaddleTS內置了 時序特征處理、數(shù)據(jù)分析、回測、滾動預測、自動建模、模型融合 等分析建模過程中非常實用的功能,可以幫助開發(fā)者減少編碼數(shù)量,提升開發(fā)效率。

簡單易用、快速上手
不需要深刻的專業(yè)背景和復雜的特征工程
3行代碼實現(xiàn)時序建模
PaddleTS覆蓋了大部分主流深度學習模型,開發(fā)者只需將數(shù)據(jù)按照格式要求灌入數(shù)據(jù)集,再通過簡單的歸一化處理即可進行模型訓練預測。相較于傳統(tǒng)統(tǒng)計模型對開發(fā)者統(tǒng)計知識的要求,機器學習模型在訓練前復雜的特征工程,開發(fā)者使用PaddleTS構建深度學習模型更加快速、簡單。- 時序建模代碼示例
dataset?=?TSDataset.load_from_dataframe(df,?**kwargs)
mlp?=?MLPRegressor(in_chunk_len?=?7?*?24,?out_chunk_len?=?24)
mlp.fit(dataset)
兼容第三方庫,機器學習模型也能高效利用
P addleTS默認集成了sklearn、pyod等第三方庫,解決了傳統(tǒng)機器學習方法不能直接用于時序數(shù)據(jù),且建模過程復雜等問題。 開發(fā)者通過幾行代碼即可實現(xiàn)傳統(tǒng)機器學習的調用,搭配PaddleTS中豐富的建模全流程工具,充分滿足個性化需求。-
時序預測代碼示例
ts_forecasting_model?=?make_ml_model(sklearn.linear_model.LinearRegression,?in_chunk_len=16,?out_chunk_len=1)
ts_forecasting_model.fit(tsdataset)
res?=?ts_forecasting_model.predict(tsdataset)
- 時序異常檢測代碼示例
ts_anomaly_model?=?make_ml_model(pyod.models.knn.KNN,?in_chunk_len=16)
ts_anomaly_model.fit(tsdataset)
res?=?ts_anomaly_model.predict(tsdataset)
時序專屬的自動建模與集成預測器
策略更優(yōu)、操作更簡單
PaddleTS將傳統(tǒng)的自動建模和集成學習工具進行改良優(yōu)化,針對時序場景重新設計了更加便捷的建模工具。 自動建模AutoTS :在該模塊中內置了默認搜索空間、超參優(yōu)化算法、重采樣策略與參數(shù)評估策略,開發(fā)者僅需 2行代碼 即可完成自動建模的主體訓練流程定義。-
AutoTS功能代碼示例
autots_model?=?AutoTS(MLPRegressor,?96,?24)
autots_model.fit(tsdataset)
集成預測器Ensemble
:該模塊采用集成學習的思想,提供兩種集成預測器,開發(fā)者通過簡單的操作即可把多個PaddleTS預測器集合成一個,滿足多數(shù)場景下的集成需求。
-
Ensemble功能代碼示例
ensemble_model?=?StackingEnsembleForecaster(96,24,estimators=[(NHiTSModel,?nhits_params),(RNNBlockRegressor,?rnn_params),?(MLPRegressor,?mlp_params)])
ensemble_model.fit(ts_train,?ts_val)
速度快、效果優(yōu) ?
PaddleTS基于飛槳框架,對數(shù)據(jù)加載、模型訓練、模型預測等核心環(huán)節(jié)精心打磨優(yōu)化,效率相比同類開源產品有非常大的優(yōu)勢。
訓練環(huán)境:GPU CUDA 11.2,設備 NVIDIA A30
指標說明:MAE,即絕對平均誤差,它表示預測值和觀測值之間絕對誤差的平均值,越小則預測效果越好
此外,相較于同類產品,使用PaddleTS中的AutoTS自動建模工具可以取得更優(yōu)的建模效果,在大多數(shù)情況下優(yōu)于專家經驗調參。
? WTH數(shù)據(jù)集:包含2010年至2013年4年間近1600個美國地區(qū)的當?shù)貧夂驍?shù)據(jù)
*利用默認的TPE算法,運行50次參數(shù)試驗PaddleTS直播課預告
11月8日(周二)19:00 ,百度資深工程師將為大家深度解析 時序建模算法庫PaddleTS ,歡迎大家 掃描海報二維碼 報名直播課,與各位開發(fā)者進行技術和業(yè)務深度交流!

更多精彩直播推薦

