IP属地:河北
Q-learning 决策: 根据Q表,选择reward较大的action. Q-learning 更新: 代码如下
强化学习方法汇总 (Reinforcement Learning): (1)Model-free 和 Model-based: model-free是指agent对环境不了解...
一. 大致流程如下 股票历史数据 股票技术指标 股吧文本数据 1.特征选择 2.股吧文本情感分析 2.1文本数据预处理 2.2 基于LSTM的情感分析模型 2.3 处理结果 ...