请输入关键字
沣沅资本

徐力群

2016.09.29


《人工智能与大数据开拓金融新前沿》




      各位领导、各位同事、各位来宾,下午好!今天我跟大家介绍一下我们做的一些工作。我的报告是人工智能与大数据开拓金融新前沿。我分三个部分来讲。


      第一、我简单回顾一下人工智能大数据的历史。


      第二、我介绍一下人工智能和大数据结合会产生什么样的作用,以及对传统金融的冲击。


      第三、我们在人工智能和大数据方面做了许多工作,我今天跟大家分享9个案例。


      什么是人工智能?人工智能是一门研究模拟扩展人的智能的理论与应用科学,它有许多应用形式,包括听说读写,这个是最基本的功能,然后是看,看就是视觉。视觉有文字识别,图像识别。然后做,做就是控制,比如说智能机器人、无人驾驶汽车、无人机等等。然后是学,有机器学习、知识获取分类。最高级的就是怎么想,想就是推理,像游戏、医疗诊断、机器推理、策略判断。


      以前人工智能还不是很热,现在来说人工智能的热潮已经上升到国家战略的层面,而且可能成为金融、工业、军事的核心竞争力。


      实际上很早之前就有人工智能的说法,英国的计算机天才图灵私下里都提出过人工智能的概念。学者把1956年的达特茅斯会议作为人工智能概念诞生的日子,其中明斯基、香农和麦卡锡一起提出了人工智能的概念。这是1956年提出的,但由于明斯基有一篇很有影响力的论文,人工智能沉寂了30年,一直到1986年Rumelhart提出了BP算法,这时候又打开了人工智能发展的方向。差不多过了11年,IBM深蓝取得了一个里程碑的成果,在1997年战胜了国际象棋冠军卡斯帕罗夫。如果你喜欢下国际象棋,你知道卡斯帕罗夫非常牛,几乎每一届都是冠军,比李世石地位高好多。


      2005年斯坦福的自动驾驶机器人又赢得了DAPRA大奖,DAPRA是美国国防部先进项目研究局,人工智能在实际领域的应用首先是在国防领域展开的,实际上我接触人工智能也是在军工单位开始的。


      到了2006年.Hinton提出了深度学习架构,并且取得了成功,十年之后Alpha Go战胜了李世石,这个事件就是今年发生的,Alpha Go动用的计算能力是远远超过IBM深蓝,它是IBM深蓝接近于3万倍,它要战胜李世石比战胜卡斯帕罗夫要难很多。


      人工智能有一个未来的发展方向非常确定,未来人工智能将进入高速发展期,可能成为下一轮技术变革的领头羊。但是会不会产生革命性的影响呢?这个引发正反的争议。像比尔盖茨、霍金都对人工智能的发展提出警告,认为人工智能如果无限发展,危害会很大。这个担忧从哲学上不是很必要的,因为人工智能都是人搞的,但是人类是上帝创造的。


      未来的发展方向主要有四个:

      一个是理论突破,目前对上帝创造大脑的理解是非常少的,实际上这个理论突破没有进行到。


      第二,算法发展。新的人工智能算法、深度学习算法,目前在美国、中国大学里面最聪明的人正在干这个事情,就是算法发展。


      第三,数据增长,包括大数据、专业大数据,然后是计算能力,超级计算机、量子计算机和云计算。


      很早之前,1990年的时候像国内军工单位已经关注到人工智能,我们已经在跟踪了,但是计算能力跟不上,就没有超级计算机,没有其他强的,因为受到巴黎统筹限制,我们能买的美国计算机是性能比较有限的。


      什么是大数据呢?根据Gartner的定义,是海量、高增量率、多样化的信息资产。IBM的定义前三项和它一样,但增加了价值和真实,这两个很重要,有价值的数据和真实的数据,才是构成大数据的重要元素。


      人工智能和大数据的应用领域非常广泛,比如说理解客户、业务流程优化、改善人们的生活、提高医疗和研发、提高体育成绩、优化机器设备、改善安全执法,最后是金融领域的运用。


       金融领域的运用,它是竞争最激烈的,这个是两个制高点,人工智能的运用有两个制高点。一个就是国防上面,一个就是在金融上面,目前来讲FinTech已经成为热点。我们来看一个新闻,这是前几天的新闻,硅谷和华尔街上演金融版的权力游戏,金融科技正在席卷全球,整个华尔街都担心了。根据大家的问卷调查,大家普遍认为会改变资产管理业、银行业、证券业、保险业,未来十年以后,可能很难区分金融科技公司和传统金融公司,根据调查发现美国专业人士认为,最具破坏力的是机器人投顾,其次是区块链技术。


      P2P和众筹是在后面,国内的情况有点相反,国内P2P很热,智能投顾还没有发展起来。为什么华尔街会这么担心人工智能大数据的发展,包括FinTech的挑战,这是有道理的。因为华尔街今年开始招收Tech方面的毕业生大幅超越传统金融行业的毕业生,这是有原因的。主要是人工智能、大数据FinTech的技术涵盖了金融领域,从前台到后台所有方面都有它的影子,包括分析研究、投资对冲、产品设计、预测预警、资产配置、风险计量、风险管理、电子商务、客服服务,你找不出一个方面是人工智能和大数据在传统金融行业没有作用的。


      为什么要把人工智能和大数据结合呢?这是有道理的。很早之前即使你有很强的计算能力,当然也不会发挥出应有的作用。主要是因为现在人类已经进入数据纪元,每天都有PB数据产生,这个数据量非常大。以前我们念书的时候用几个U盘就装下了,现在肯定不行,要两个T、三个T的移动硬盘来装数据。


      巨大数据量为近年来发展人工智能提供了巨大的发展空间,早期的支持向量机、决策树,近期的就是人工智能神经网络,这个方面对于数据来说是数据喜好的,数据越多越能发挥它的作用。因为人工智能神经网络对数据不做先验假设,我们念金融的知道,你要假设资产价格,要正态分布,它没有这个,它对金融工具或者衍生品不做先验假设,纯粹从数据当中挖掘金融产品、价格变化的特性或者规律。


      这样的话,人工智能发现它不是一般的规律,它会发现复杂规律,或者是隐含规律,从而制定有效的对应策略。很好的一个例子就是Alpha Go对阵李世石的时候,好多开局是围棋专业人士想不到的,也没有人敢去这样下,为什么呢?就是因为Alpha Go它发现了许多开局的下法,它是隐含规律重新被挖掘出来了。大数据它本身也挑战了传统的统计分析,大数据它需要更新的处理模式来处理它,才能发现隐含的规律,才能具有更强的洞察力,所以人工智能大数据一结合,这就是目前首选的利器。我们讲FinTech,智能投顾,实际上离不开人工智能和大数据结合。


      我们量化管理部在人工智能和大数据方面做了很多的工作,今天我跟大家分享9个应用案例。


      前天就是杨总介绍过君富嘉年华这个电商平台,这个电商平台虽然是前两天推出的,但是它在我们公司内部上线已经有好几个月了,针对这个电商平台我们做了大数据分析应用,可以进行访客的地域分析、流量来源分析、网站效率分析、页面效率分析、单品热门度分析、客户忠诚度分析、用户价值分析,形成一个可视化的报告提供给电商业务团队,他们根据这个去挖掘有价值的信息,改善他们的业务流程,提高他们的运营效率,这是我们其中的一个应用。


      第二,我们建立了基于大数据的股票市场舆情分析模型,我们根据互联网原始信息,运用这个应用去抓取,进行程序分析,创建和训练语料库,基于Bayes进行分析,主要有两个方面作用,一个是对市场整体,我们对未来市场走势很短期的,一天到两天,因为市场情绪很短期,一天两天就恢复平静了,是短期的预测。


      另外对于单个公司层面,可以作为上市公司重大的正面或者负面的消息的即时提取工具,其中进一步分析的参考依据。网上Rumor(流言)出来传播很快,不管是真的还是假的,马上可以提取到,提供进一步的分析。


      这个分析的后台实际上是运用了自然语言处理的工具进行金融相关的文本分析,我不多介绍了,应用这个手段同样可以对券商研究报告进行判断,对研究报告的标题类建立词汇的语料库,对这个重要性进行筛选,每天很快就把研报读一遍,进行筛选,检出重要的信息,提供进一步的研究。像这种应用,现有的金融FinTech公司、互联网金融公司他们都可以做,这不是我们很独特的。


      下面我介绍一下我们独有的东西。比如海外市场主要风险来源,汇率风险,我们沣沅弘子公司建立了人工智能大数据的模型,这个汇率是包括黄金和白银等贵金属,黄金、白银具有非常重要的货币属性。我们用KNN的原理和微观结构的模型统一合成部署,建立了这样一个主要汇率贵金属的人工智能模型,从右边这个图来看,我们对美元指数的预测和真实值比较是相当符合的,准确度相当高的。


      这个模型我们每个月都可以对主要货币和黄金白银进行一个月、两个月和季度的月测,提供集团投资决策委员会进行参考,这个应用是我们独有的。


      另外一个我们也是独有的,我们运用专业大数据的工具开发了一个海外主要市场股票的估值模型,综合了各种量化和非量化的因素,这个好处我们就只有一个大数据模型,对主要海外市场的所有股票可以进行估值筛选,提交集团执委会参考。你像左边这个图是美国股票的估值结果,它从低到高,右边这个图是英国股票的估值结果,如果你发现一个英国股票很有价值,你可以看一下美国类似的这个股票它的估值是高还是低了,这样的话就不要投相对估值偏低的,你在全市场寻找相对估值偏低的,在全市场寻找相对估值偏高的都可以,这个好处就是一个大数据模型,把所有的像美国几千家股票全部覆盖了,这个我们将覆盖美国、英国、德国、法国、日本、瑞士、加拿大、澳大利亚,许多主要工业化国家的股票市场。


      另外一个我们独有的是人工智能对全球LIBOR利率,美国国债市场利率,通过人工智能神经网络的算法,从海量的历史数据当中提取有效的信息进行建模,形成了一个全球利率场模型,根据这个利率场模型,不仅可以计算当前的真实利率情况,也可以对未来的LIBOR利率,美国国债利率进行预测,我们跟踪的一段时间效果还是不错的。


      这个模型的好处它不是一个片面的收益率曲线,它是对整个利率场进行一个分析建模,然后进行一个预测。它可以覆盖所有你关心的主要货币,比如说瑞郎、欧元、美元、日元包括人民币,它的主要市场交易产生的利率,从一天、一个月、一周、两个月一直到十二个月,对于美国国债可以到10年、20年。根据这个利率曲面,我们可以判断市场的利率水平,这样的话对当前市场,对于未来市场的把握是非常精准的。


      如果你看一个人,你只看他的眉毛动了,或者嘴巴动了,你很难判断他是哭还是笑。同样对于一个货币某一个曲线的利率上了下了,你对全球市场利率水平是没法判断,我们用这个利率场曲面实际上可以分析出这个人到底是真笑还是假笑,是真哭还是假哭。比如说美联储这次维持利率不变,整个国际市场利率曲面就一下子展现出来了,它就是苦笑。


      另外,我们运用人工智能、大数据、数据挖掘技术也可以进行大类资产配置,把宏观指标和资产配置进行一个映射,形成很长周期的一个大类资产配置,左图是对美元资产的配置,是在次贷危机之前。右边这个是样本外的一个结果,是次贷危机之后,你可以看到这个策略实际上它的回报很高,但在次贷危机发生的时候,它的回报非常小,所以这个策略是非常有效的。


      同样我们可以利用大数据建立极端市场,比如1987股债、2008次贷危机,2015年A股股灾,2016年英国脱欧,这种情况下,各种金融资产的波动率和相关性模型。金融资产波动率相关性与常态市场和黑天鹅事件发生的时候是不一样的规律,传统的金融模型是没法覆盖的,把它作为异常情况忽略,运用大数据模型可以建立风险控制中的压力测试模型,更好地应对黑天鹅事件。


      我们对金融产品也有一个风险评估模型,这个是前天杨总他们也介绍过,君富嘉年华平台,就是根据他们的需要我们开发的。这是目前市场上最全面的风险评估模型,我们涵盖了6大维度,51个次维度,今后我们会把这51个次维度提高到九十几个次维度,这样对金融产品的体检,风险评估就像体检一样,B超也做了,CT也做了,X光也做了,你放出来的都是比较健康的人。


      由于时间关系,专业大数据权益风险因子模型不介绍了,这是计算的结果。这些就是我们量化管理部自主开发的模型和应用系统,许多是运用人工智能和大数据技术,一共有二十多个模型。运用这些模型我们不仅可以支持集团的智能投顾、君富嘉年华平台,FinTech的业务,也可以全面支持集团公司与金融相关的投资业务,我们也有PC、VC的量化分析和评估模型。今天由于时间的关系,我就介绍到这里,谢谢大家!