随想
- 新建一个git项目,关于股票预测的。包含爬虫、nlp、以及机器学习算法,每日定时运行,自动优化模型。
爬虫
- 爬取每日价格,交易量信息(同花顺或者新浪)。
- 公告信息,上证所/深证所官方网站;或者同花顺;或者雪球
- 雪球的热门公告
- 人民日报的报纸信息(这个再看看)
nlp
- 主要是对公告信息进行处理,明确利好利空。(这个其实要结合题材热点再想一想)
机器学习算法
变量
- 价格交易量信息。可以做日,周,月都可以试试
- 公告利好利空,结合上面的
- 题材热点
- 板块价量信息。可以做日,周,月都可以试试
- 目前价格位置相对周,月,年最高最低位置,相对日线位置,周线位置,年线位置。macd指标的位置走向。
- 不同周期资金流入流出情况
- 题材热度,统计淘股吧某题材帖子数或者某股票讨论数等
- 价格绝对值以及相对昨天价格
- 流通股金额
- 股价绝对值