第3章 预测股票市场收益
本书的第二个案例是对数据挖掘技术更深一层的使用。我们将分析把数据挖掘工具和技术应用到具体商业问题中所面临的困难。这里以建立自动股票交易系统这一具体问题为例。基于股票的每日交易数据,首先建立预测模型,然后据此分析如何建立股票交易系统。我们的目标是预测S&P 500(标准普尔500)股票指数的未来收益,为此首先建立了几个预测模型,然后这些模型结合给定的交易策略产生市场上的交易决策(即买卖信号)。本章主要讲解几个新的数据挖掘问题,它们是:1)如何使用R来分析存储在数据库中的数据;2)如何对具有时间顺序的观测值(即时间序列)进行预测;3)把模型预测结果转化为现实应用中的决策和行动。
3.1 问题描述与目标
对数据挖掘而言股票市场交易是个具有巨大潜力的应用领域。事实上,由于大量历史数据的存在,人工对这些数据进行检测是很困难的,而数据挖掘技术对大数据有先天的优势。另一方面,有学者声称,市场在价格调整上适应之快,以至于根本没有空间可以得到稳定的收益。这就是有名的有效市场假设。这个理论先后被一些更宽松的版本所取代,即由于短暂的市场无效,市场还是有一些交易机会空间的。