1.1 量化技术篇—技术框架选择

------从零开始学量化------
简书量化目录传送门
知乎量化目录传送门


1. 技术框架选择

python + mongodb(HDF5备选) + tensorflow

2. 为什么选择这一套技术框架

2.1 为什么是python

在其他领域,语言的选择可能不是一个重要的问题,但在量化方向,我相信语言的选择是一个很重要的问题,语言将直接决定你的生产率。why???

  1. python在数据分析、量化建模、量化回测方向,有许多优秀的开源框架,你不用自己去造这些轮子!!!
  2. python在数据分析、量化建模、量化回测方向,有许多优秀的开源框架,你不用自己去造这些轮子!!!
  3. python在数据分析、量化建模、量化回测方向,有许多优秀的开源框架,你不用自己去造这些轮子!!!
    重要的事情说3遍!!!

下面我们看一下github上star数排在前列的量化开源框架,清一色的python,这最具有说服力,(列表中的统计时间为2018-06-27)。

排名 开源项目 Star数量 开发语言 项目用途
1 zipline 7.2k python 量化回测框架
2 tushare 5.9k python 财经数据接口包
3 vn.py 5.9k python 交易平台开发框架
4 rqalpha 2.7k python 量化交易框架
5 abu 5.3k python 量化交易框架
6 easytrader 2.2k python 交易平台开发框架

我曾经尝试用java去写量化,但java的量化开源框架实在太少,金融指标都要自己实现,在做量化的时候,慢慢地发现,我根本不是在做量化,而是在写框架代码。90%的时间去造轮子,只有10%时间去做量化,根本没有一点生产力。最终完全放弃java,对我3年java职业生涯说再见,一切从新开始。

2.2 为什么选择mongodb

金融数据主要有两个特点:

  • 金融数据是典型的时间序列数据。数据存入数据库后就很少再需要修改了,最主要的操作是查询。
  • 数据量级大,tick级的数据很容易上tb级别。

因此存储金融数据,可以选择:

  • 关系型数据库(mysql, sqlserver等)
  • 非关系型数据库(mongodb, redis等)

关系型数据库,我在工作中用的比较多,也很熟悉,用的最多的是mycat + mysql的组合。实际操作中,如果选用mysql,数据库engin选择myisam,存储数据采用行转列,当数据量达到亿级别,数据库性能会出现明显下降。如果采用分片分表,对于个人来说,会增加硬件成本和维护成本,得不偿失。不过关系型数据库用来记录交易流水等业务,是个不错的选择,可以很方便的使用事务。

非关系型数据库,待更新。。。。

数据库的选择,知乎上有一个问答,推荐使用hdf5,具体详情,可以查看传送门

一次线下和雪山讨论的时候,他向我推荐了mongodb,因为mongdb在3.0版本已经支持数据压缩,所以存储tick级别的数据已经不是什么问题。他也提到可以选择hdf5,但是hdf5在并行写的时候,可能会存在性能的瓶颈。所以此处,我听从老司机的建议,优先选择mongodb。

2.3 为什么选择tensorflow

机器学习选择google的tensorflow,主要是因为:

  • google的研发实力。
  • 商业化的产品必然优于学院派,这是资本驱动的力量。

而框架中加入tensorflow,是因为我一直坚信,机器学习是未来的方向,现在的机器学习就像萌芽中的互联网,当他走向成熟之后,他迸发出的能量将横扫众多传统领域。

金融与机器学习的结合将是未来的趋势,而这两个领域的结合,也堪称完美。一边是金融,不会使得自己囊中羞涩。一边是机器学习,紧跟时代的步伐,走在趋势的前沿。(至于金融是如何帮助我们实现财务自由,我安利一本周金涛的涛动周期论,当我在阅读这本书的时候,我被作者的金融大局观深深折服。书中提到2019年将是85后人生中的第一次机会,2019年将是资产的低点,让我们拭目以待。)

对于计算机专业,想转量化的同学,我觉得机器学习是我们的一个突破口。因为从计算机跨领域到金融,意味着一切从零开始,在起跑线上暂时输给了职业量化者。但是机器学习的学习壁垒高,我们可以扬长避短,用机器学习作为突破口,从程序员转型成一个宽客。

3. 量化中使用的Python开源框架

  • tushare
  • pandas
  • ta-lib
  • seaborn
  • zipline
  • vnpy

其中:
tushare用于获取股票历史数据,在量化系统中,作为量化数据的来源。
pandas提供了大量金融数据分析的工具,在量化系统中,作为量化数据的存储结构。
ta-lib提供了金融指标的实现方法,在量化系统中,作为金融技术指标的计算库。
seaborn提供了数据可视化的接口,在量化系统中,作为量化结果的可视化展示库。
zipline提供了量化交易回测的框架,在量化系统中,作为量化回测引擎。
vnpy提供了交易和数据的接口,基本覆盖了国内外常规交易品种(证券、期货、期权、外汇、CFD),在量化系统中,作为实盘自动化交易的框架。

后面的章节,将一步一步使用以上框架,开始量化之旅。


如果你对我的文章有兴趣,可以关注一下我的简书和知乎,后期会在简书和知乎上定期更新,传送门在下方:
简书潇潇夜雨归何处
知乎潇潇夜雨
我相信,有趣的灵魂总会相遇!!!
你的关注,是我前进的动力!!!

参考资料

  1. 量化投资—为什么选择Python?
  2. Python金融行业必备工具
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,894评论 2 89
  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明先生_x阅读 15,967评论 3 119
  • Python资源大全中文版,包括:Web框架、网络爬虫、模板引擎、数据库、数据可视化、图片处理等,由伯乐在线持续更...
    dxl1236阅读 4,621评论 2 33
  • 所谓的“通货膨胀”,意思就是钱印多了,当货币的发行量大于市场所需的量,我们就说发生了通货膨胀。可是这个定义并没有什...
    haolujun阅读 320评论 0 1
  • “你在看月全食, 我在月亮里看你…… 你装饰了相机和望远镜, 让我来装饰你的梦。”
    Cecilia_Lau阅读 155评论 0 0