“某股票胜率78%,交易79笔,大神们都在买”“免费会员预计收益3%,白银会员预计收益5%,黄金会员预计收益10%”……或许在不少有经验的股民眼中,以上描述是“明眼人”都能轻松识破的骗局。但如果这些东西被冠以“人工智能(AI)”之名,不少人会为之心动。
自从“阿尔法狗”打败了世界围棋冠军、自动驾驶成功抢占未来出行的制高点,不少打着“AI炒股”旗号的软件出现在投资者的视野。有了AI的加持,这些公司扬言自己的AI炒股软件不仅可以准确诊断股票情况、抓到涨停的股票甚至全面跑赢大盘。
AI炒股真能成为投资者们的“救命稻草”吗?
股市数据有限无法“喂饱”AI
最近,有媒体报道,4月18日,一家名为的人工智能技术公司正式对外宣布,目前已成功将技术应用于金融投资领域,从底层对人工智能神经网络结构进行设计开发。宣传资料显示,自2017年11月始,以自有资金进行A股实盘测试,对经过历史数据回测训练后的A股人工智能投资机器人做实盘检验,截至2018年12月,录得交易累计业绩为收益6.19%。同期上证指数-30.10%,深证指数-41.18%,创业板38.58%。全面跑赢大盘。投资收益率远超市场95%股票型基金。
通过官网和客服,《IT时报》记者都未能联系上这家公司,因此无法对其说法进行进一步了解,但在上海财经大学交叉科学研究院副教授、金融科技实验室主任高建军看来,AI跑赢大盘的说法,还有待长期检验。
“目前AI在量化投资,特别是股票、期货等二级市场的应用仍然处于初级阶段。近几年的AI热潮,主要是由计算机硬件技术的提升以及深度学习算法在图像、语音、自然语言处理等领域的成功所推动的。在量化投资领域,金融数据与之前这些领域的数据有着显著的区别。我通过测试对各种机器学习算法进行了评估,发现简单的机器学习算法以及深度学习算法对股市的预测能力相比传统模型而言提高的程度有限。”高建军表示,很大的原因是金融数据本身是非平稳的时间序列,特别在中国,超过8年的交易数据用处并不太大。也就是说,中国股市数据的统计特性是不稳定的,随着时间或者其他随机因素发生变化。
另一个原因是数据量,一般训练深度网路需要海量数据,而交易数据特别是天级别的数据很难满足数据量的要求。一年有250个交易日,单只股票近5-8年的天级别数据量太少。如果引入更高频率的数据,又会引入更多的噪声数据。这一定程度上也成为训练机器学习模型的掣肘。把更高频的数据融入并结合到相对低频的数据中,从而帮助模型提高预测能力也是目前学术研究的热点。
对此,一位金融科技公司的内部人士马强(化名)也表示认同。“无论是下围棋或是图像识别,这二者可以无限生产大量的样本,使用AI模型可以学习出较稳定的模型。但股票市场则不同,由于人类投资历史的时间有限,样本有限,再加上投资复杂程度较高,所以从本质来讲,投资模型很难用AI完成。不仅如此,即便AI从统计中找到了规律,也很快会因为一个未知变量的变化而失效。”
一位不愿具名的券商向《IT时报》记者表示,“目前大部分客户还是以主动策略和量化管理为主,AI炒股学习需要大量的操作数据,需要券商过往的数据配合,就目前来看,还没有能够提供深度合作的券商。即便是引入AI,券商也要看客户的意愿。”
无法破局的“黑天鹅事件”
目前国内的AI炒股软件一般分为3类:一类是对K线图等技术曲线进行分析进而预测走势的软件;一类是针对资金流、龙虎榜、财报等非行情数据进行分析的软件;第三类则是对实时新闻产生的标签进行分析然后预测个股走势的软件。
“这三类软件的本质都是希望基于数据对未来的股票走势进行预测。但是证券市场受信息驱动变化较大,本质上对实时新闻产生的标签进行分析预测股市的软件在逻辑上是成立的。但由于信息的不对等,没有人能够掌握世界上所有的信息。”一位金融科技界资深内部人士陈鹏(化名)道。通常情况下,致力于AI炒股的创业公司规模不大,处理海量新闻数据的能力有限,很多所谓AI炒股软件,依然是根据K线图计算技术曲线或者DK点吸引散户付费从而变现。
实际上,变幻莫测股市上偶尔出现的“黑天鹅事件”,是AI炒股能否顺利实现的决定性因素。
几乎每年,股市都会遇到“黑天鹅事件”。比如2018年被曝出狂犬疫苗造假的主角*ST长生,便是A股历史上首例因“重大违法行为”而遭遇强制退市的上市公司。
虎博科技创始人兼CEO陈烨认为,AI可以帮助人类更有效率地获取准确信息,从而辅助决策。金融市场变幻莫测,每一次都是随机的环境。落于股票市场中,更多可能影响股票涨跌的信息是尚未公开的,并不是有了技术就可以达到。从本质来讲,所有代码都是人类写出来的,这在一定程度上决定了机器的聪明程度,但没有任何算法、任何机器可以左右金融市场的走向。
AI炒股价值几何?
大多数股民在股市和汇市里都有一本血泪账。除了归咎于信息不对称等客观条件之外,技术上经验不足以及心理因素也是重要原因之一。一位股民坦言,“对我来讲,AI炒股就是一个参数指标,我可以根据AI指令来进行买卖交易,从而避免人性贪婪和恐惧的弱点。”
“传统的股票软件只是简单对股市中产生的数据进行搬运,主动为公开用户提供投资建议属于违法行为。”陈鹏表示,真正的AI炒股难点在于如何让机器理解信息,“现在很多市面上的AI炒股,只是股票推荐服务+推送服务。现阶段标榜自己AI炒股的,并且是帮别人炒股的肯定都是假的。”
在陈烨看来,目前AI在一些高频量化基金领域有一定帮助,但并不是取代人做决策,更重要的是为人类提供更为全面的信息,解决金融市场信息不对称的问题,利用相关技术,可以建立大规模海量数据的模型,将大量的行情、宏观、行业、公告、研报、新闻等数据信息,总结成用户需要的信息。技术可以挖掘更深度的价值信息,做出最正确的推荐,从而辅助人们进行判断,但并不能取代用户进行决策。
另有资深金融专业人士表示,AI炒股只是一个噱头的概念,业内实际使用很少。在金融市场的交易中,用AI手段进行的占比不足千分之一。此前,全球第一只应用AI进行投资的ETF基金AI ETF(代码:AIEQ)于2017年10月18日在纽交所上市。与人类炒股相比,它做到65天×24小时不停工作、同时对6000多只美国挂牌股票进行分析、能每天分析上百万条相关的公告文件、财报、新闻以及社群文章,利用量化择时、量化炒股、因子分析、事件驱动等多种量化模型炒股。如今,一年过去,这只基金并没有跑赢指数。截至2018年10月18日,AIEQ上涨9.63%。同期,美股纳斯达克指数涨13.01%,道琼斯工业指数涨10.36%,标普500指数涨8.18%。就目前来看,AIEQ的成绩并未比人类基金好,有时甚至表现得略差。
“AIEQ的收益表现基本决定了AI炒股能够做到的上限。”高建军说道,“股票市场存在的重要意义是实现资源的有效分配。量化投资(包括使用AI技术投资)本身是非常有意义的,正是由于量化投资等主动投资方式的存在,可以帮助市场纠正错误的定价,抹平各种套利的机会,从而实现正确的定价。股市中因为投资者的非理性,时时刻刻都会产生各种错误的定价。例如有些股票被低估或高估,倘若定价不准则会使有效分配失去意义。”
高建军认为,利用机器学算法建立合理的定价模型、选择合适的定价因子是未来AI技术在二级市场可行的应用领域,机器学习在不同领域有不同的理解和不同方法:包括高维的、非线性统计和预测方法;各种对抗“过拟合”的方法;可以有效地根据数据,自适应地搜索模型中参数,“这些方法可以帮助市场发现以往难以发现的错误定价或者说是套利机会,从而帮助市场更有效。目前,不少机构开始尝试使用机器学习的算法进行投资,由于回测的时间比较短,其长期表现还有待考察。”