赞
踩
通过训练具有小型中心层的多层神经网络重构高维输入向量,可以将高维数据转换为低维代码。这种神经网络被命名为自编码器_Autoencoder_。
自编码器是_非线性_降_维_ 技术用于特征的无监督学习,它们可以学习比主成分分析效果更好的低维代码,作为降低数据维数的工具。
如果提供了足够的类似于某种底层模式的训练数据,我们可以训练网络来学习数据中的模式。异常测试点是与典型数据模式不匹配的点。自编码器在重建这些数据时可能会有很高的错误率,这表明存在异常。
该框架用于使用深度自编码器开发异常检测演示。该数据集是心电图ECG 时间序列(查看文末了解数据获取方式),目标是确定哪些心跳是异常值。训练数据(20 个“好”心跳)和测试数据(为简单起见附加了 3 个“坏”心跳的训练数据),如下所示。每行代表一个心跳。
init()
PATH = os.path.expanduser("~/")
- import_file(PATH + "train.csv")
- import_file(PATH + "test.csv")
探索数据集。
tra.shape
- # 将框架转置,将时间序列作为一个单独的列来绘制。
- plot(legend=False); # 不显示图例
在训练数据中,我们有 20 个时间序列,每个序列有 210 个数据点。请注意,所有线条都很紧凑并且形状相似。重要的是要记住,在使用自编码器进行训练时,您只想使用 VALID 数据。应删除所有异常。
点击标题查阅往期内容
左右滑动查看更多
01
02
03
04
现在让我们训练我们的神经网络
- Estimator(
- activation="Tanh",
- hidden=\[50\],
-
- )
-
- model.train
model
我们的神经网络现在能够对 时间序列进行 _编码_。
现在我们尝试使用异常检测功能计算重建误差。这是输出层和输入层之间的均方误差。低误差意味着神经网络能够很好地对输入进行编码,这意味着是“已知”情况。高误差意味着神经网络以前没有见过该示例,因此是异常情况。
anomaly(test )
现在的问题是:哪个 test 时间序列最有可能是异常?
我们可以选择错误率最高的前 N 个
df\['Rank'\] = df\['MSE'\].rank
sorted
dfsorted\[MSE'\] > 1.0
datT.plot
daT\[anindex\].plot(color='red');
有时,未标记的数据比标记的数据多得多。在这种情况下,在未标记数据上训练自编码器模型,然后使用可用标签微调学习模型是有意义的。
在本教程中,您学习了如何使用自编码器快速检测时间序列异常。
数据获取
在下面公众号后台回复“心电图数据”,可获取完整数据。
本文摘选《python深度学习实现自编码器Autoencoder神经网络异常检测心电图ECG时间序列》,点击“阅读原文”获取全文完整资料。
点击标题查阅往期内容
R语言指数平滑法holt-winters分析谷歌Google Analytics博客用户访问时间序列数据
PYTHON中用PROPHET模型对天气时间序列进行预测与异常检测
R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测
Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择
Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化
RNN循环神经网络 、LSTM长短期记忆网络实现时间序列长期利率预测
结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析
深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据
PYTHON用LSTM长短期记忆神经网络的参数优化方法预测时间序列洗发水销售数据
Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化
R语言深度学习卷积神经网络 (CNN)对 CIFAR 图像进行分类:训练与结果评估可视化
深度学习:Keras使用神经网络进行简单文本分类分析新闻组数据
Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析
R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列
R语言KERAS用RNN、双向RNNS递归神经网络、LSTM分析预测温度时间序列、 IMDB电影评分情感
Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化
Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析
R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
R语言深度学习:用keras神经网络回归模型预测时间序列数据
Matlab用深度学习长短期记忆(LSTM)神经网络对文本数据进行分类
R语言KERAS深度学习CNN卷积神经网络分类识别手写数字图像数据(MNIST)
Python中用PyTorch机器学习神经网络分类预测银行客户流失模型
SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型
【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析
R语言用神经网络改进Nelson-Siegel模型拟合收益率曲线分析
matlab使用长短期记忆(LSTM)神经网络对序列数据进行分类
使用PYTHON中KERAS的LSTM递归神经网络进行时间序列预测
python用于NLP的seq2seq模型实例:用Keras实现神经网络机器翻译
用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类
欲获取全文文件,请点击左下角“阅读原文”。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。