微信号:ZXL_LHTZ_JQXX

介绍:介绍关于量化投资和机器学习方面的知识.通过文摘,报告,论坛,博文,代码,还有博主自己研究的领域,给大家提供无偿的知识干粮.

来,我们告诉你:为什么不该使用LSTM预测股市

2019-01-17 15:30 量化投资与机器学习

标星★公众号第一时间获取最新资讯


本期作者:Andrea Leccese

本期翻译:1+1=6 | 公众号翻译部成员


近期原创文章:

♥ 2018中国量化投资年度盘点【独家】

 利用深度学习最新前沿预测股价走势

 一位数据科学PhD眼中的算法交易

 深度学习是信号处理和时序分析的最后选择?

 人工智能『AI』应用算法交易,7个必踩的坑!

 神经网络在算法交易上的应用系列(一)

 预测股市 | 如何避免p-Hacking,为什么你要看涨?

 如何鉴别那些用深度学习预测股价的花哨模型?


正文


近年来,机器学习得到了很大的发展和兴趣,在语音和图像识别方面取得了可喜的成果。本文分析了一种深度学习方法——LSTM在以标普500指数为代表的美国股市中的应用效果。结果表明:LSTM在语音识别等其他领域取得了良好的效果,但在金融数据应用中效果不佳。事实上,它的特点是高噪声信号比,这使得机器学习模型很难找到模式来预测未来价格


什么是LSTM?


LSTM神经网络是一种特殊的深度学习模型。特别地它是一种可以学习数据长期依赖关系的递归神经网络,因此通常用于时间序列预测。


下图显示了LSTM层的体系结构:

如图所示,它由一个重复的核心模块组成。这种结构使得LSTM能够学习长期依赖关系。第一个LSTM块获取序列X(1)的网络初始状态和第一个时间步长,计算第一个输出h(1)和更新后的cell状态c(1)。在时间步t,屏蔽网络的当前状态 (c(t−1), h(t−1)) 和序列的下一个时间步X(t)和计算输出ht和更新后的细胞状态ct。


图2显示了LSTM的架构,它由4个主要组件组成:


  • Input gate:控制单元状态更新

  • Forget gate:控制单元状态重置

  • Cell candidate:向单元格状态添加信息

  • Output gate:控制添加到隐藏门的单元格状态


为了了解建模任务的特性并进行预测,需要对LSTM进行训练。这个过程包括通过最小化一个目标函数(通常是RMSE),通过一些优化算法来计算LSTM的权重和偏差。一旦模型在初始训练数据集上训练并在验证集上验证,它就会在真实的样本外测试上进行测试。这确保了模型实际上学习了有用的特性,并且没有在训练集上过度拟合,对新数据的预测能力很差。下面我们将分析用标普500指数测试LSTM的性能。


 LSTM在股市中的验证


使用的数据集由1950年1月3日至2019年1月4日以标准普尔500指数为代表的美国股市收盘价组成。60%用于训练,20%用于验证,20%用于测试。


下图显示了在日级别上用于分析的数据。



在我们的分析中,我们训练了一个由1个隐含层,20个神经元,20个值的时间序列长度组成的LSTM神经网络。我们尝试了不同组合的神经网络参数和架构,发现了相似的结果。


下图展示了实际价格与经过训练的LSTM预测的第二天价格的比较。



从图中可以看出,预测值与实际价格非常接近,无法很好地看到实际的基础价格。因此,LSTM似乎在预测所考虑的时间序列的下一个值方面做得很好。


表1告诉了LSTM在预测第二天价格时的性能统计数据。



这些数据证实了我们从上图中所看到的。RMSE中较低的值和R2中较高的值表明LSTM可以很好地预测考虑的时间序列的下一个值。


下图显示了从2018年8月13日到2019年1月4日,与预测价格相比的100个实际价格样本。



这个数字使我们得出一个不同的结论。总的来说,LSTM似乎可以有效地预测第二天的值,但实际上,对第二天的预测与前一天的实际值非常接近。如下图所示,实际价格与预测价格相比滞后了1天。



如图所示,这两个级数几乎相同,验证了我们之前的结论。


这些结果表明,LSTM不能预测第二天股市的价值。实际上,该模型所能做出的最佳猜测是一个几乎与当前价格相同的值。


结论


诚然,新的机器学习算法,尤其是深度学习算法,在不同领域取得了相当成功,但它们无法很好的预测股市。正如前面的分析所证明的,LSTM只是使用一个非常接近前一天收盘价的值来预测第二天的价值。这是一个没有预测能力的模型所期望的


这也突显出尽管一些机器学习技术可能在金融领域有用,但针对对冲基金必须走另一条路,拿出能够为客户提供Alpha的策略


推荐阅读


01、经过多年交易之后你应该学到的东西(深度分享)

02、监督学习标签在股市中的应用(代码+书籍)

03、全球投行顶尖机器学习团队全面分析

04、使用Tensorflow预测股票市场变动

05、使用LSTM预测股票市场基于Tensorflow

06、美丽的回测——教你定量计算过拟合概率

07、利用动态深度学习预测金融时间序列基于Python

08、Facebook开源神器Prophet预测时间序列基于Python

09、Facebook开源神器Prophet预测股市行情基于Python

10、2018第三季度最受欢迎的券商金工研报前50(附下载)

11、实战交易策略的精髓(公众号深度呈现)

12、Markowitz有效边界和投资组合优化基于Python

13、使用LSTM模型预测股价基于Keras

14、量化金融导论1:资产收益的程式化介绍基于Python

15、预测股市崩盘基于统计机器学习与神经网络(Python+文档)

16、实现最优投资组合有效前沿基于Python(附代码)

17、精心为大家整理了一些超级棒的机器学习资料(附链接)

18、海量Wind数据,与全网用户零距离邂逅!

19、机器学习、深度学习、量化金融、Python等最新书籍汇总下载

20、各大卖方2019年A股策略报告,都是有故事的人!


公众号官方QQ群


量化、技术人士深度交流群

扫码关注我们

 
量化投资与机器学习 更多文章 高频交易已经竞争到纳秒级!!!(赠送HFT的18篇论文+15本书籍+9篇研报) TensorFlow 2.0 版本都发布了,你却还不会用? 【跳槽必备】全球最知名的十五大高频交易公司大揭秘! 【干货】教你如何鉴别那些用深度学习预测股价的花哨模型? 一位数据科学PhD眼中的算法交易
猜您喜欢 作为产品经理,我是如何理解产品的功能边界? 十五天精通WCF——第六天 你必须要了解的3种通信模式 后端的轮子(三)--- 缓存 两步搞定Hyperledger主打区块链解决方案Fabric 简化你的Java代码,让工作更高效