其实这个项目在一年之前就有了想做的年头,兴冲冲准备了好多资料,还学习了一阵子自然语言处理。可是由于没有沉下心来专研,再加上其他事情很多,最后就搁置了下来。在16年年末的时候,终于决定重新把这个项目拾起来。加上老婆大人又赞助了一台笔记本,于是更加有动力要把这个项目做完了!
这个项目开发的初衷是做一个黄金交易的辅助工具。就是搜集金融市场的财经分析文章,黄金价格的波动,然后经过自己的分析,判断出未来的趋势,从而帮助自己判断交易的点位。在当时的想法里,这个项目需要掌握爬虫,数据挖掘,文本分析等等相关知识,于是搜罗了很多书在学习。学习文本分析是下了一本经典的python的nltk的书,可是看完了以后还是一头雾水。再加上向一位朋友请教了关于进行文本分析的一般流程,发现这个东西和当初的想象有着很大的区别,于是热情又慢慢得变淡了。最后变成了一个深深的坑,埋藏在记忆深处。。。
还是介绍一下新的项目的大致框架吧:
整个项目将以微服务的形式呈现出来,主要划分为4个子项目:1)网络爬虫;2)报价接口;3)文本情感分析;4)GoldMap公众号。1、3,4依然是当初的设想。2则是新增加的,从当初的网络爬虫里面划分出来的。这也是根据自己的交易风格的改变而做出的一些变化。
首先介绍网络爬虫部分。该部分将定时抓取相关财经网站的财经分析文章,然后存储进数据库。在原来的设想中,还有实时抓取黄金价格的部分,但是后来发现这样需要随时访问相关网站,担心会被相应网站禁封爬虫程序;此外再加上个人的交易风格慢慢转向做长线交易,对于价格波动的实时性要求已经大为降低,于是就从这里划分至第二个子项目中。
至于报价接口则是非常简单的小程序。直接购买相应的外部接口。然后自己做一点简单的封装即可。只不过接收下来以后,我会自己做一定的计算,计算出相关的指标,比如KDJ、DMI。并将相关的数据保存进数据库。
文本情感分析可能是整个项目中,技术要求最高的部分。在当初的设想中,这一部分也是参考了一些心理学的知识,试图从这些财经分析文章中分析出市场的情绪波动,然后经过自己的计算,计算出所谓的情绪波动指数,有点点类似芝加哥交易所的恐慌指数的意思。这部分需要掌握的知识很多,文本分析,机器学习,数据挖掘等等。只好一点点做,慢慢学习吧。不过毕竟是网络时代,可以找到的学习资源非常多,只是需要自己沉下心来去学习。
而微信公众号的目的就是将自己搜罗来的文章,获得的数据,以及运算出来的数据,做一个分享,希望可以帮助到一些同样在这个交易市场里面奋斗的朋友。
最近又在听《荣耀》这首歌,越来越觉得这首歌像是在描写交易员的心境和愿景。