【深度學(xué)習(xí)】在PyTorch中使用 LSTM 自動編碼器進(jìn)行時間序列異常檢測

共 12521字，需瀏覽 26分鐘

2022-01-23 18:54

寫在前面

環(huán)境準(zhǔn)備

本次數(shù)據(jù)集的格式.arff，需要用到arff2pandas模塊讀取。

#?!nvidia-smi
#?!pip?install?-qq?arff2pandas
#?!pip?install?-q?-U?watermark

另外本次運(yùn)行環(huán)境可通過如下方法查看。

%reload_ext?watermark
%watermark?-v?-p?numpy,pandas,torch,arff2pandas

Python implementation: CPython
Python version       : 3.8.8
IPython version      : 7.22.0

numpy      : 1.19.5
pandas     : 1.2.4
torch      : 1.9.1
arff2pandas: 1.0.1

導(dǎo)入相關(guān)模塊

import?torch

import?copy
import?numpy?as?np
import?pandas?as?pd
import?seaborn?as?sns
from?pylab?import?rcParams
import?matplotlib.pyplot?as?plt
from?matplotlib?import?rc
from?sklearn.model_selection?import?train_test_split
from?torch?import?nn,?optim
import?torch.nn.functional?as?F
from?arff2pandas?import?a2p

%matplotlib?inline
%config?InlineBackend.figure_format='retina'
sns.set(style='whitegrid',?palette='muted',?font_scale=1.2)
HAPPY_COLORS_PALETTE?=?["#01BEFE",?"#FFDD00",?"#FF7D00",?"#FF006D",?"#ADFF02",?"#8F00FF"]
sns.set_palette(sns.color_palette(HAPPY_COLORS_PALETTE))
rcParams['figure.figsize']?=?15,?8
RANDOM_SEED?=?42
np.random.seed(RANDOM_SEED)
torch.manual_seed(RANDOM_SEED)

本文核心內(nèi)容

本案例使用真實(shí)的心電圖 (ECG) 數(shù)據(jù)來檢測患者心跳的異常情況。我們將一起構(gòu)建一個 LSTM 自動編碼器，使用來自單個心臟病患者的真實(shí)心電圖數(shù)據(jù)對其進(jìn)行訓(xùn)練，并將在新的樣本中，使用訓(xùn)練好的模型對其進(jìn)行預(yù)測分類為正?；虍惓韥頇z測異常心跳。

本案例主要圍繞以下幾大核心展開。

從時間序列數(shù)據(jù)中準(zhǔn)備用于異常檢測的數(shù)據(jù)集
使用 PyTorch 構(gòu)建 LSTM 自動編碼器
訓(xùn)練和評估模型
設(shè)定異常檢測的閾值
將新的樣本分類為正常或異常

數(shù)據(jù)集

該數(shù)據(jù)集包含 5,000 個通過 ECG 獲得的時間序列樣本，樣本一共具有 140 個時間步長。每個序列對應(yīng)于一個患有充血性心力衰竭的患者的一次心跳。

心電圖（ECG 或 EKG）是一種通過測量心臟的電活動來檢查心臟功能的測試。每一次心跳，都會有一個電脈沖（或電波）穿過您的心臟。這種波會導(dǎo)致肌肉擠壓并從心臟泵出血液。?來源^[1]

我們有 5 種類型的心跳類別，他們分別是：

正常 (N)
室性早搏 (R-on-T PVC)
室性早搏 (PVC)
室上性早搏或異位搏動（SP 或 EB）
未分類的搏動 (UB)。

假設(shè)心臟健康，典型心率為每分鐘 70 到 75 次，每個心動周期或心跳大約需要 0.8 秒才能完成該周期。頻率：每分鐘 60–100 次（人類）持續(xù)時間：0.6–1 秒（人類）?來源^[2]

如果你的設(shè)備安裝有 GPU，這將是非常好的，因?yàn)樗倪\(yùn)行速度更快，可以節(jié)約你寶貴的時間。

device?=?torch.device("cuda"?if?torch.cuda.is_available()?else?"cpu")

如下圖所示，數(shù)據(jù)有多種格式，我們將加載.arff格式的文件到pandas數(shù)據(jù)幀中。

數(shù)據(jù)獲取方法：?在公眾號『機(jī)器學(xué)習(xí)研習(xí)院』中后臺消息框回復(fù)【heart】免費(fèi)獲??！

with?open('./data/ECG5000/ECG5000_TRAIN.arff')?as?f:
????train?=?a2p.load(f)
with?open('./data/ECG5000/ECG5000_TEST.arff')?as?f:
????test?=?a2p.load(f)

把訓(xùn)練和測試數(shù)據(jù)組合成一個單一的數(shù)據(jù)框。兩者的加成，將為我們提供更多數(shù)據(jù)來訓(xùn)練我們的自動編碼器。

df?=?train.append(test)
df?=?df.sample(frac=1.0)
df.shape

(5000, 141)

看下數(shù)據(jù)集樣貌。

df.head()

我們有5000個例子。每一行代表一個心跳記錄。我們重新命名所有的類。并將最后一列重命名為target，這樣在后面引用它將更為方便。

CLASS_NORMAL?=?1
class_names?=?['Normal','R?on?T','PVC','SP','UB']

new_columns?=?list(df.columns)
new_columns[-1]?=?'target'
df.columns?=?new_columns

探索性數(shù)據(jù)分析

通過函數(shù)value_counts()可以看看每個不同的心跳類分別有多少個樣本。

df.target.value_counts()

1    2919
2    1767
4     194
3      96
5      24
Name: target, dtype: int64

當(dāng)然，為了更加直觀，我們通過可視化方法將心跳類別通過sns.countplot()清晰展示出。

ax?=?sns.countplot(x="target",?data=df,
???????????????????order?=?df['target'].value_counts().index)
ax.set_xticklabels(class_names);

通過統(tǒng)計(jì)分析，我們發(fā)現(xiàn)普通類的樣本最多。這個結(jié)果是非常理想的，也是意料之中的（異常檢測中的異常往往是最少的），又因?yàn)槲覀冃枰褂眠@些正常類的數(shù)據(jù)來訓(xùn)練模型。

接下來，我們看一下每個類的平均時間序列（前面和后面做一個標(biāo)準(zhǔn)差平滑）。

首先定義一個輔助繪圖函數(shù)。

def?plot_time_series_class(data,?class_name,?ax,?n_steps=10):
????"""
????param?data:數(shù)據(jù)
????param?class_name:?不同心跳類名
????param?ax:畫布
????"""
????time_series_df?=?pd.DataFrame(data)
????#?平滑時間窗口
????smooth_path?=?time_series_df.rolling(n_steps).mean()
????#?路徑偏差
????path_deviation?=?2?*?time_series_df.rolling(n_steps).std()
????#?以正負(fù)偏差上下定義界限
????under_line?=?(smooth_path?-?path_deviation)[0]
????over_line?=?(smooth_path?+?path_deviation)[0]
????#?繪制平滑曲線
????ax.plot(smooth_path,?linewidth=2)
????ax.fill_between(
??????path_deviation.index,
??????under_line,
??????over_line,
??????alpha=.125)
????ax.set_title(class_name)

根據(jù)上面的定義的輔助函數(shù)，循環(huán)繪制每個心跳類的平滑曲線。

#?獲取所有不同心跳類別
classes?=?df.target.unique()
#?定義畫布
fig,?axs?=?plt.subplots(
??????nrows=len(classes)?//?3?+?1,
??????ncols=3,
??????sharey=True,
??????figsize=(14,?8))
#?循環(huán)繪制曲線
for?i,?cls?in?enumerate(classes):
????ax?=?axs.flat[i]
????data?=?df[df.target?==?cls]?\
??????.drop(labels='target',?axis=1)?\
??????.mean(axis=0)?\
??????.to_numpy()
????plot_time_series_class(data,?class_names[i],?ax)

fig.delaxes(axs.flat[-1])
fig.tight_layout();

根據(jù)上面五種心跳類的可視化結(jié)果看出，正常類具有與所有其他類明顯不同的特征，這也許就是我們構(gòu)建的模型能夠檢測出異常的關(guān)鍵所在。

LSTM 自動編碼器

自動編碼器是個啥

自編碼器模型架構(gòu)圖解

自動編碼器模型是一種神經(jīng)網(wǎng)絡(luò)，旨在以無監(jiān)督的方式學(xué)習(xí)恒等函數(shù)以重建原始輸入，同時在此過程中壓縮數(shù)據(jù)，從而發(fā)現(xiàn)更有效和壓縮的表示。

該網(wǎng)絡(luò)可以看作由兩部分組成：一個編碼器函數(shù)??和一個生成重構(gòu)的解碼器?

編碼器網(wǎng)絡(luò)：將原始的高維輸入轉(zhuǎn)換為潛在的低維代碼。輸入尺寸大于輸出尺寸。
解碼器網(wǎng)絡(luò)：解碼器網(wǎng)絡(luò)從代碼中恢復(fù)數(shù)據(jù)，輸出層可能越來越大。

編碼器網(wǎng)絡(luò)本質(zhì)上完成了降維，就像我們?nèi)绾问褂弥鞒煞址治觯≒CA）或矩陣分解（MF）一樣。此外，自動編碼器針對代碼中的數(shù)據(jù)重構(gòu)進(jìn)行了顯式優(yōu)化。一個好的中間表示不僅可以捕獲潛在變量，而且有利于完整的解壓過程。

該模型包含由??參數(shù)化的編碼器函數(shù)??和由??參數(shù)化的解碼器函數(shù)?。在瓶頸層為輸入x學(xué)習(xí)的低維代碼為?，重構(gòu)輸入為?。

參數(shù) (θ,?) 一起學(xué)習(xí)以輸出與原始輸入相同的重構(gòu)數(shù)據(jù)樣本，，或者換句話說，學(xué)習(xí)恒等函數(shù)。有多種指標(biāo)可以量化兩個向量之間的差異，例如激活函數(shù)為 sigmoid 時的交叉熵，或者像 MSE 損失一樣簡單：

心電數(shù)據(jù)異常檢測

我們將使用正常的心跳作為模型的訓(xùn)練數(shù)據(jù)，并記錄重構(gòu)損失。但首先需要準(zhǔn)備數(shù)據(jù)。

數(shù)據(jù)預(yù)處理

獲取所有正常的心跳并刪除目標(biāo)類的列。

normal_df?=?df[df.target?==?str(CLASS_NORMAL)
??????????????].drop(labels='target',?axis=1)
normal_df.shape

(2919, 140)

合并所有其他類并將它們標(biāo)記為異常。

anomaly_df?=?df[df.target?!=?str(CLASS_NORMAL)].drop(labels='target',?axis=1)
anomaly_df.shape

(2081, 140)

將正常類樣本分為訓(xùn)練集、驗(yàn)證集和測試集。

train_df,?val_df?=?train_test_split(
??normal_df,
??test_size=0.15,
??random_state=RANDOM_SEED)

val_df,?test_df?=?train_test_split(
??val_df,
??test_size=0.33,?
??random_state=RANDOM_SEED)

需要將樣本轉(zhuǎn)換為張量，使用它們來訓(xùn)練自動編碼器。為此編寫一個輔助函數(shù)來實(shí)現(xiàn)樣本數(shù)據(jù)類型的轉(zhuǎn)換，以便后續(xù)復(fù)用。

def?create_dataset(df):

????sequences?=?df.astype(np.float32).to_numpy().tolist()
????dataset?=?[torch.tensor(s).unsqueeze(1).float()?for?s?in?sequences]
????n_seq,?seq_len,?n_features?=?torch.stack(dataset).shape

????return?dataset,?seq_len,?n_features

關(guān)于torch.unsqueeze()?和?torch.stack()?詳解可參見文末。

轉(zhuǎn)換示例：

每個時間序列將被轉(zhuǎn)換為形狀?序列長度?x *特征數(shù)量 *的二維張量。在我們的例子中為140x1的二維張量。

接下來將所有需要用到的數(shù)據(jù)集進(jìn)行如上轉(zhuǎn)換。

#?_?表示不需要該項(xiàng)
train_dataset,?seq_len,?n_features?=?create_dataset(train_df)
val_dataset,?_,?_?=?create_dataset(val_df)
test_normal_dataset,?_,?_?=?create_dataset(test_df)
test_anomaly_dataset,?_,?_?=?create_dataset(anomaly_df)

構(gòu)建 LSTM 自動編碼器

自動編碼器的工作是獲取一些輸入數(shù)據(jù)，將其通過模型傳遞，并獲得輸入的重構(gòu)，重構(gòu)應(yīng)該盡可能匹配輸入。

從某種意義上說，自動編碼器試圖只學(xué)習(xí)數(shù)據(jù)中最重要的特征，這里使用幾個 LSTM 層(即LSTM Autoencoder)來捕獲數(shù)據(jù)的時間依賴性。接下來我們一起看看如何將時間序列數(shù)據(jù)提供給自動編碼器。

為了將序列分類為正常或異常，需要設(shè)定一個閾值，并規(guī)定高于該閾值時，心跳是異常的。

重構(gòu)損失

當(dāng)訓(xùn)練一個自動編碼器時，模型目標(biāo)是盡可能地重構(gòu)輸入。這里的目標(biāo)是通過最小化損失函數(shù)來實(shí)現(xiàn)的（就像在監(jiān)督學(xué)習(xí)中一樣）。這里所使用的損失函數(shù)被稱為重構(gòu)損失。常用的重構(gòu)損失是交叉熵?fù)p失和均方誤差。

接下來將以GitHub^[3]中的 LSTM Autoencoder為基礎(chǔ)，并進(jìn)行一些小調(diào)整。因?yàn)槟Ｐ偷墓ぷ魇侵亟〞r間序列數(shù)據(jù)，因此該模型需要從編碼器開始定義。

class?Encoder(nn.Module):
??"""
??定義一個編碼器的子類，繼承父類?nn.Modul
??"""
????def?__init__(self,?seq_len,?n_features,?embedding_dim=64):
????????super(Encoder,?self).__init__()

????????self.seq_len,?self.n_features?=?seq_len,?n_features
????????self.embedding_dim,?self.hidden_dim?=?embedding_dim,?2?*?embedding_dim
????#?使用雙層LSTM
????????self.rnn1?=?nn.LSTM(
??????????input_size=n_features,
??????????hidden_size=self.hidden_dim,
??????????num_layers=1,
??????????batch_first=True)
????
????????self.rnn2?=?nn.LSTM(
??????????input_size=self.hidden_dim,
??????????hidden_size=embedding_dim,
??????????num_layers=1,
??????????batch_first=True)

????def?forward(self,?x):
????????x?=?x.reshape((1,?self.seq_len,?self.n_features))
????????x,?(_,?_)?=?self.rnn1(x)
????????x,?(hidden_n,?_)?=?self.rnn2(x)
????????return?hidden_n.reshape((self.n_features,?self.embedding_dim))

編碼器使用兩個LSTM層壓縮時間序列數(shù)據(jù)輸入。

接下來，我們將使用Decoder對壓縮表示進(jìn)行解碼。

class?Decoder(nn.Module):
??"""
??定義一個解碼器的子類，繼承父類?nn.Modul
??"""
????def?__init__(self,?seq_len,?input_dim=64,?n_features=1):
????????super(Decoder,?self).__init__()

????????self.seq_len,?self.input_dim?=?seq_len,?input_dim
????????self.hidden_dim,?self.n_features?=?2?*?input_dim,?n_features

????????self.rnn1?=?nn.LSTM(
??????????input_size=input_dim,
??????????hidden_size=input_dim,
??????????num_layers=1,
??????????batch_first=True)

????????self.rnn2?=?nn.LSTM(
??????????input_size=input_dim,
??????????hidden_size=self.hidden_dim,
??????????num_layers=1,
??????????batch_first=True)
????????self.output_layer?=?nn.Linear(self.hidden_dim,?n_features)

????def?forward(self,?x):
????????x?=?x.repeat(self.seq_len,?self.n_features)
????????x?=?x.reshape((self.n_features,?self.seq_len,?self.input_dim))
????????x,?(hidden_n,?cell_n)?=?self.rnn1(x)
????????x,?(hidden_n,?cell_n)?=?self.rnn2(x)
????????x?=?x.reshape((self.seq_len,?self.hidden_dim))

????????return?self.output_layer(x)

編碼器和解碼器均包含兩個 LSTM 層和一個提供最終重建的輸出層。

這里將所有內(nèi)容包裝成一個易于使用的模塊了。

class?RecurrentAutoencoder(nn.Module):
????"""
????定義一個自動編碼器的子類，繼承父類?nn.Module
????并且自動編碼器通過編碼器和解碼器傳遞輸入
????"""
????def?__init__(self,?seq_len,?n_features,?embedding_dim=64):
????????super(RecurrentAutoencoder,?self).__init__()
????????self.encoder?=?Encoder(seq_len,?n_features,?embedding_dim).to(device)
????????self.decoder?=?Decoder(seq_len,?embedding_dim,?n_features).to(device)

????def?forward(self,?x):
????????x?=?self.encoder(x)
????????x?=?self.decoder(x)
????????return?x

自動編碼器類已經(jīng)定義好，接下來創(chuàng)建一個它的實(shí)例。

model?=?RecurrentAutoencoder(seq_len,?n_features,?128)
model?=?model.to(device)

訓(xùn)練模型

自動編碼器模型已經(jīng)定義好。接下來需要訓(xùn)練模型。下面為訓(xùn)練過程編寫一個輔助函數(shù)train_model。

def?train_model(model,?train_dataset,?val_dataset,?n_epochs):
????optimizer?=?torch.optim.Adam(model.parameters(),?lr=1e-3)
????criterion?=?nn.L1Loss(reduction='sum').to(device)
????history?=?dict(train=[],?val=[])
????best_model_wts?=?copy.deepcopy(model.state_dict())
????best_loss?=?10000.0
??
????for?epoch?in?range(1,?n_epochs?+?1):
????????model?=?model.train()
????????train_losses?=?[]
????????for?seq_true?in?train_dataset:
????????????optimizer.zero_grad()

????????????seq_true?=?seq_true.to(device)
????????????seq_pred?=?model(seq_true)

????????????loss?=?criterion(seq_pred,?seq_true)
????????????loss.backward()
????????????optimizer.step()

????????????train_losses.append(loss.item())

????????val_losses?=?[]
????????model?=?model.eval()
????????with?torch.no_grad():
????????????for?seq_true?in?val_dataset:
????????????????seq_true?=?seq_true.to(device)
????????????????seq_pred?=?model(seq_true)

????????????????loss?=?criterion(seq_pred,?seq_true)
????????????????val_losses.append(loss.item())

????????train_loss?=?np.mean(train_losses)
????????val_loss?=?np.mean(val_losses)

????????history['train'].append(train_loss)
????????history['val'].append(val_loss)

????????if?val_loss?????????????best_loss?=?val_loss
????????????best_model_wts?=?copy.deepcopy(model.state_dict())
????????print(f'Epoch?{epoch}:?train?loss?{train_loss}?val?loss?{val_loss}')

????model.load_state_dict(best_model_wts)
????return?model.eval(),?history

在每個epoch中，訓(xùn)練過程為模型提供所有訓(xùn)練樣本，并評估驗(yàn)證集上的模型效果。注意，這里使用的批處理大小為1 ，即模型一次只能得到一個序列。另外還記錄了過程中的訓(xùn)練和驗(yàn)證集損失。

值得注意的是，重構(gòu)時做的是最小化L1損失，它測量的是 MAE（平均絕對誤差），似乎比 MSE（均方誤差）更好。

最后，我們將獲得具有最小驗(yàn)證誤差的模型，并使用該模型進(jìn)行接下來的異常檢測預(yù)?，F(xiàn)在開始做一些訓(xùn)練。

#?這一步耗時較長
model,?history?=?train_model(
??model,?
??train_dataset,?
??val_dataset,?
??n_epochs=150
)

繪制模型損失

繪制模型在訓(xùn)練和測試數(shù)據(jù)集上面的損失曲線。

ax?=?plt.figure().gca()
ax.plot(history['train'])
ax.plot(history['val'])
plt.ylabel('Loss')
plt.xlabel('Epoch')
plt.legend(['train',?'test'])
plt.title('Loss?over?training?epochs')
plt.show();

從可視化結(jié)果看出，我們所訓(xùn)練的模型收斂得很好?？雌饋砦覀兛赡苄枰粋€更大的驗(yàn)證集來優(yōu)化模型，但本文就不做展開了，現(xiàn)在就這樣了。

保存模型

存儲模型以備后用。模型保存是必須要做的，他是保存和避免我們寶貴工作不被浪費(fèi)的重要步驟。

MODEL_PATH?=?'model.pth'
torch.save(model,?MODEL_PATH)

如果要下載和加載預(yù)訓(xùn)練模型，請取消注釋下一行。

#?model?=?torch.load('model.pth')
#?model?=?model.to(device)

設(shè)定閾值

有了訓(xùn)練好了的模型，可以看看訓(xùn)練集上的重構(gòu)誤差。同樣編寫一個輔助函數(shù)來使用模型預(yù)測結(jié)果。

def?predict(model,?dataset):
????predictions,?losses?=?[],?[]
????criterion?=?nn.L1Loss(reduction='sum').to(device)
????with?torch.no_grad():
????????model?=?model.eval()
????????for?seq_true?in?dataset:
????????????seq_true?=?seq_true.to(device)
????????????seq_pred?=?model(seq_true)

????????????loss?=?criterion(seq_pred,?seq_true)

????????????predictions.append(seq_pred.cpu().numpy().flatten())
????????????losses.append(loss.item())
????return?predictions,?losses

該預(yù)測函數(shù)遍歷數(shù)據(jù)集中的每個樣本并記錄預(yù)測結(jié)果和損失。

_,?losses?=?predict(model,?train_dataset)
sns.distplot(losses,?bins=50,?kde=True);

從圖結(jié)果看，該閾值設(shè)定為26較為合適。

THRESHOLD?=?26

評估

利用上面設(shè)定的閾值，我們可以將問題轉(zhuǎn)化為一個簡單的二分類任務(wù)：

如果一個例子的重構(gòu)損失低于閾值，我們將其歸類為"正常"心跳
或者，如果損失高于閾值，我們會將其歸類為**"異常"**

正常心跳

我們檢查一下模型在正常心跳上的表現(xiàn)如何。這里使用新的測試集中的正常心跳。

predictions,?pred_losses?=?predict(model,?test_normal_dataset)
sns.distplot(pred_losses,?bins=50,?kde=True);

計(jì)算下模型預(yù)測正確的樣本有多少。

correct?=?sum(l?<=?THRESHOLD?for?l?in?pred_losses)
print(f'Correct?normal?predictions:?{correct}/{len(test_normal_dataset)}')

Correct normal predictions: 142/145

異常心跳

我們對異常樣本執(zhí)行相同的操作，由于異常心跳和正常心跳的樣本數(shù)量不一致，因此需要獲得一個與正常心跳大小相同的子集，并對異常子集進(jìn)行模型的預(yù)測。

anomaly_dataset?=?test_anomaly_dataset[:len(test_normal_dataset)]
predictions,?pred_losses?=?predict(model,?anomaly_dataset)
sns.distplot(pred_losses,?bins=50,?kde=True);

最后計(jì)算高于閾值的樣本數(shù)量，而這些樣本將被視為異常心跳數(shù)據(jù)。

correct?=?sum(l?>?THRESHOLD?for?l?in?pred_losses)
print(f'Correct?anomaly?predictions:?{correct}/{len(anomaly_dataset)}')

Correct anomaly predictions: 142/145

由此可見，我們得到了很好的結(jié)果。在現(xiàn)實(shí)項(xiàng)目中，可以根據(jù)要容忍的錯誤類型來調(diào)整閾值。在這種情況下，可能希望誤報（正常心跳被視為異常）多于漏報（異常被視為正常）。

樣本對比觀察

可以疊加真實(shí)的和重構(gòu)的時間序列值，看看它們有多接近。得到相比的結(jié)果，可以針對一些正常和異常情況進(jìn)行處理。

#?定義輔助函數(shù)
def?plot_prediction(data,?model,?title,?ax):
????predictions,?pred_losses?=?predict(model,?[data])
????
????ax.plot(data,?label='true')
????ax.plot(predictions[0],?label='reconstructed')
????ax.set_title(f'{title}?(loss:?{np.around(pred_losses[0],?2)})')
????ax.legend()
#?繪圖
fig,?axs?=?plt.subplots(
??????????????nrows=2,
??????????????ncols=6,
??????????????sharey=True,
??????????????sharex=True,
??????????????figsize=(22,?8)
????????????)

for?i,?data?in?enumerate(test_normal_dataset[:6]):
????plot_prediction(data,?model,?title='Normal',?ax=axs[0,?i])

for?i,?data?in?enumerate(test_anomaly_dataset[:6]):
????plot_prediction(data,?model,?title='Anomaly',?ax=axs[1,?i])

fig.tight_layout();

到目前為止，該實(shí)戰(zhàn)案例已經(jīng)告一段落了。在本案例中，我們一起學(xué)習(xí)了如何使用 PyTorch 創(chuàng)建 LSTM 自動編碼器并使用它來檢測 ECG 數(shù)據(jù)中的心跳異常。

附

torch.unsqueeze 詳解

torch.unsqueeze(input,?dim,?out=None)

返回一個新的張量，對輸入的既定位置插入維度 1

作用：擴(kuò)展維度
注意：?返回張量與輸入張量共享內(nèi)存，所以改變其中一個的內(nèi)容會改變另一個。
參數(shù):

tensor?(Tensor) – 輸入張量
dim?(int) – 插入維度的索引，如果dim為負(fù)，則將會被轉(zhuǎn)化dim+input.dim()+1
out?(Tensor, optional) – 結(jié)果張量

例子:

x?=?torch.Tensor([1,?2,?3,?4])
torch.unsqueeze(x,?0)??
>>>?tensor([[1.,?2.,?3.,?4.]])
torch.unsqueeze(x,?1)
>>>?tensor([[1.],
????????????[2.],
????????????[3.],?
????????????[4.]])

torch.stack() 詳解

沿著一個新維度對輸入張量序列進(jìn)行連接。序列中所有的張量都應(yīng)該為相同形狀。

簡而言之：把多個二維的張量湊成一個三維的張量；多個三維的湊成一個四維的張量…以此類推，也就是在增加新的維度進(jìn)行堆疊。

outputs?=?torch.stack(inputs,?dim=0)?→?Tensor

參數(shù):

inputs?(sequence of Tensors) - 待連接的張量序列。
注：python的序列數(shù)據(jù)只有l(wèi)ist和tuple。函數(shù)中的輸入inputs只允許是序列；且序列內(nèi)部的張量元素，必須shape相等。
dim?(int) 新的維度，必須在0到len(outputs)之間。注：len(outputs)是生成數(shù)據(jù)的維度大小，也就是outputs的維度值。dim是選擇生成的維度，必須滿足0<=dim；len(outputs)是輸出后的tensor的維度大小。

例子:

#?假設(shè)是時間步T1的輸出
T1?=?torch.tensor([[1,?2,?3],
???????????????????[4,?5,?6],
???????????????????[7,?8,?9]])
#?假設(shè)是時間步T2的輸出
T2?=?torch.tensor([[10,?20,?30],
??????????????????[40,?50,?60],
??????????????????[70,?80,?90]])
torch.stack((T1,T2),dim=1)
>>>?tensor([[[?1,??2,??3],
...????????[10,?20,?30]],
...
...???????[[?4,??5,??6],
...????????[40,?50,?60]],
...
...???????[[?7,??8,??9],
...????????[70,?80,?90]]])
torch.stack((T1,T2),dim=0)
>>>?tensor([[[?1,??2,??3],
...?????????[?4,??5,??6],
...?????????[?7,??8,??9]],
...
...????????[[10,?20,?30],
...?????????[40,?50,?60],
...?????????[70,?80,?90]]])

`參考資料`

[1]?來源:?https://www.heartandstroke.ca/heart/tests/electrocardiogram[2]?來源:?https://en.wikipedia.org/wiki/Cardiac_cycle[3]?GitHub:?https://github.com/shobrook/sequitur[4]?參考原文:?https://curiousily.com/posts/time-series-anomaly-detection-using-lstm-autoencoder-with-pytorch-in-python/[5]?Sequitur - Recurrent Autoencoder (RAE):?https://github.com/shobrook/sequitur[6]?Towards Never-Ending Learning from Time Series Streams:?https://www.cs.ucr.edu/~eamonn/neverending.pdf[7]?LSTM Autoencoder for Anomaly Detection:?https://towardsdatascience.com/lstm-autoencoder-for-anomaly-detection-e1f4f2ee7ccf


往期精彩回顧




適合初學(xué)者入門人工智能的路線及資料下載
中國大學(xué)慕課《機(jī)器學(xué)習(xí)》（黃海廣主講）
機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印
機(jī)器學(xué)習(xí)在線手冊
深度學(xué)習(xí)筆記專輯
《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯
AI基礎(chǔ)下載
本站qq群955171419，加入微信群請掃碼：

瀏覽
                    86點(diǎn)贊
    
評論
    收藏
    
分享
        手機(jī)掃一掃分享
分享
    
        舉報

評論

圖片

表情

視頻

深度學(xué)習(xí)時間序列異常檢測方法
本文約10000字，建議閱讀15+分鐘本文全面概述了深度學(xué)習(xí)用于時間序列異常檢測的最新架構(gòu)。本文全面概述了深度學(xué)習(xí)用于時間序列異常檢測的最新架構(gòu)，提供了基于策略和模型的方法，并討論了各種技術(shù)的優(yōu)點(diǎn)和局限性。此外，還舉例說明了近年來深度學(xué)習(xí)在時間序列異常檢測中各領(lǐng)域的應(yīng)用。1  背景時間序列

深度學(xué)習(xí)時間序列異常檢測方法
本文全面概述了深度學(xué)習(xí)用于時間序列異常檢測的最新架構(gòu)，提供了基于策略和模型的方法，并討論了各種技術(shù)的優(yōu)點(diǎn)和局限性。此外，還舉例說明了近年來深度學(xué)習(xí)在時間序列異常檢測中各領(lǐng)域的應(yīng)用。1  背景時間序列是一系列按照時間順序依次索引的數(shù)據(jù)點(diǎn)。最常見的時間序列形式是按時間記錄的觀察序列。時間序列通

使用深度學(xué)習(xí)進(jìn)行瘧疾檢測 | PyTorch版
小白學(xué)視覺
0

使用深度學(xué)習(xí)進(jìn)行自動車牌檢測和識別
小白學(xué)視覺
0

在PyTorch中使用深度自編碼器實(shí)現(xiàn)圖像重建
小白學(xué)視覺
0

如何使用深度學(xué)習(xí)進(jìn)行缺陷檢測
機(jī)器學(xué)習(xí)自動檢測異常已成為一個有著高度直接影響的有趣且具有潛力的研究領(lǐng)域，特別是在視覺檢測領(lǐng)域。深度學(xué)習(xí)技術(shù)已成為此任務(wù)的最佳方法。深度學(xué)習(xí)技術(shù)可以通過訓(xùn)練圖像數(shù)據(jù)集來提供一個可以檢測表面異常的模型。DAGM數(shù)據(jù)集中不同背景紋理上的表面缺陷介紹在一些工業(yè)中，通過SEM/EDX檢查表面或檢查材料中的雜

基于對比學(xué)習(xí)的時間序列異常檢測方法
算法進(jìn)階
0

基于對比學(xué)習(xí)的時間序列異常檢測方法
數(shù)據(jù)派THU
0

保姆級教程：使用 LSTM 進(jìn)行多變量時間序列預(yù)測
Python學(xué)習(xí)與數(shù)據(jù)挖掘
0

LazyProphet：使用 LightGBM 進(jìn)行時間序列預(yù)測
數(shù)據(jù)派THU
0

點(diǎn)贊

評論
    收藏
    
分享
        手機(jī)掃一掃分享
分享
    
        舉報

国产秋霞理论久久久电影-婷婷色九月综合激情丁香-欧美在线观看乱妇视频-精品国avA久久久久久久-国产乱码精品一区二区三区亚洲人-欧美熟妇一区二区三区蜜桃视频