针对本次任务中遇到的问题,进行一些资料的补充。 针对xgb等模型的理解 lightgbm,xgboost,gbdt的区别与联系 LR和树模型基础...
数据探索在机器学习中我们一般称为EDA(Exploratory Data Analysis): 是指对已有的数据(特别是调查或观察得来的原始数据...
文本分类 使用双向循环神经网络 使用卷积神经网络->TextCNN TextCNN 模型主要使用了一维卷积层和时序最大池化层。假设输入的文本序列...
优化算法进阶 ill-conditioned problem Condition Number of Hessian Matrix: cond_...
批量归一化和残差网络 为什么要做标准化处理 深层神经网络中,中间某一层的输入是其之前的神经层的输出。因此,其之前的神经层的参数变化会导致其输入的...
卷积神经网络基础 二维互相关运算 二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,...
机器翻译及相关技术 特征 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。 encoder-decoder 针对...
过拟合、欠拟合及其解决方案 训练集和测试集 测试数据集不可以用来调整模型参数,如果使用测试数据集调整模型参数,可能在测试数据集上发生一定程度的过...
文本预处理 建立字典 记一个文本预处理需要用到的字典,学习一下python 语言模型 n元语法和马尔可夫假设 马尔可夫假设:一个词的出现只与前面...