1. 背景介绍 文本检测分为基于回归和基于分割两种方法,DBNet 的原理是基于分割算法。对于一般分割算法流程:先通过网络输出文本分割的概率图,...
一、序言 对于 OCR 任务来说,目的是为了将图像中的文字识别出来,近几年的研究主要包含以下几个步骤: 文字检测:首先对图像进行文字检测,将图中...
项目相关 为什么选取 XGBOOST? xgboost 相对于 svm、LR 有更好的效果。 xgboost 相对于其他树模型的优点,支持特征粒...
阿里 新零售(NLP 岗位) 一面 自我介绍 项目相关内容,xgboost 与 GBDT的区别,为什么选择 xgboost,以及 xgboost...
一、引言 由于深度学习的广泛应用,出现了一个新问题:训练一个更好的网络是否和堆叠更多的层一样简单呢?解决这一问题的障碍便是困扰人们很久的梯度消失...
一、常用激活函数 Sigmoid 函数 每个激活函数(或非线性函数)的输入都是一个数字,然后对其进行某种固定的数学操作。Sigmoid 函数的曲...
一、简介 1. Dropout 出现的原因 在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训...
一、引言 机器学习领域有个很重要的假设:IID 独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试...
一、数组题目(简单) 26. 删除排序数组中的重复项 给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的...