目标:通过处理源生K线数据,得到对后市上涨及可交割有意义的K线衍生数据
一、原始数据
1. 历史数据
[历史时间段,最高价,开盘价,最低价,收盘价,成交量] :
从当前时间向过去寻找n组K线数据作为模型训练的输入,即,i = 1,2,3, ... ,n;
2. 当前状态
[当前时间,当前价格] :
找到距离当前时间最近的一根已完成K线,找到此K线对应的时间与收盘价信息,作为当前时间与当前价格;
二、太初数据
目标:统一处理所有原始数据,转化为太初数据,使新的数据格式更贴合于整体目标;
1. 数值数据
将(1.1)(1.2)数据转化为 [距今时长,方向,实体高度,上影线高度,下影线高度]
;
;
;
;
;
2. 变量分析
所有K线均由三部分组成,包括实体,上影线,下影线;这三部分各自以及彼此之间的数量关系对后市的走势有指导意义,指导意义分三种,包括延续,反转,以及震荡概率(Continuity, Inversion, Equilibrium);
2.1 实体分析(上下影线长度随意且维持不变)
无论阴阳线,实体高度增加(降低),延续概率增加(降低),反转概率降低(增加),震荡概率降低(增加);
2.2 实体与上下影线组合分析
无论阴阳线,设C=(实体/实体+上影线+下影线)越接近1,延续概率越高;C越接近0,震荡概率越高;阳线,设=(上影线/实体+上影线+下影线)越接近1,反转概率越高;阴线,设=(下影线/实体+上影线+下影线)越接近1,反转概率越高;
2.3 涨跌盘概率预测
设一根独立K线对后市的走势贡献值与震荡贡献值,为runContribution, equContribution;
无论阴阳线,若runContribution为正,则对后市上涨有贡献;若为负,则对后市下跌有贡献;
且equContribution越接近1,对后市震荡的贡献越高;
2.4 时间权重因子
(2.1)中的tDistant参数反应历史K线的距今时间长度,设定距今时间越长的K线对后市的走势与震荡预测贡献值越低;
时间权重函数:
太初数据总结,将所有历史数据的涨跌贡献值乘以对应的时间权重因子,即得到每个投资标的的涨跌盘概率;
三、天地数据
目标:结合分析多组K线的时间与空间属性,组合分析归属于同一趋势的多组K线数据。
趋势分类:震荡熊市,稳定熊市,震荡盘整市场,稳定盘整市场,震荡牛市,稳定牛市;
首先需要找到牛熊盘三类市场的起始与终止点,而后再通过期间的波动率判断震荡或稳定;
1. 涨跌盘归类算法
从(1.1)可知,每根K线均有[high,low]两个参数;给每根K线额外添加2组(4个参数),分别为 [[higherFromLeft, higherFromRight], [lowerFromLeft, lowerFromRight]],意思是从每根K线的左右寻找比此K线的最高点更高的点位与比此K线的最低点更低的点位,这四个参数的输出对应寻找了多少根K线才找到这四个参数;
举个例子(3.1),某品种,2018.9.14号的日K线对应的参数为[[120, 64], [1,1]],那么说明这根K线左侧直到第120个交易日才出现更高点,右侧遍历64个交易日才有更高点;左侧1个交易日出现更低点,右侧1个交易日出现更低点;
那么例3.1对应的这根K线的最高点,即为符合要求的最高点;下面总结一下什么是符合要求以及符合要求的高低点的重要性如何表示;
1.1 符合要求判定
[[a1,a2],[b1,b2]] = [[higherFromLeft, higherFromRight], [lowerFromLeft, lowerFromRight]];
A. 若a1或a2任意一个参数数值小于10,则此K线的最高价不满足需要的最高点标准;(3.1.1.A)
B. 若b1或b2任意一个参数数值小于10,则此K线的最低价不满足需要的最低点标准;(3.1.1.B)
C. 对于邻近当前时间较近的K线会有右侧K线数量较少的情况,在向右侧寻找更高更低价时,会有无更多K线遍历的困境,若某K线的右侧K线数量低于20,则不参与高低点判定;(3.1.1.C)
经历了(3.1.1.A/B/C)的判定后,符合要求的高点与低点就都找到了;
1.2 重要性表示
将每个符合要求的高点的参数a1,a2相加得到参数a,将符合要求的低点的参数b1,b2相加得到参数b;参数a与b为自然数;
a = a1+a2;b=b1+b2;(3.1.2)
1.3 高低点表达方式
; (3.1.3)
2. 趋势数据群处理
2.1 趋势数据群基本参数
每组趋势数据群对应的两类数据结构,第一类是其中每根K线的性质,可从(1.1)(2.1)(2.2.1)(2.2.2)(2.2.3)(2.3.1)(2.3.2)(2.3.3)中获取;第二类是趋势数据组自身的性质 [起始时间,结束时间,K线总数,阳线数(涨幅为正即为阳,包括涨停),阴线数(涨幅为负即为阴,包括跌停),VWAP,成交总量,区间涨跌幅,区间振幅]:
[tStart, tEnd, kCount, kPosCount, kNegCount, VWAP, volume, changeRate, swingRate] (3.2.1)
2.2 趋势数据群衍生参数
[]
四、末世数据