AutoML 的优点可归纳为三大要点: 通过自动执行的重复性任务来 提高工作效率。这使得数据科学家能够更多地关注问题而不是模型。 自动化 ML ...
所谓分子对接就是两个或多个分子之间通过几何匹配和能量匹配而相互识别的过程。在药物分子产生药效反应的过程中,药物分子与靶酶相互结合,首先就需要两个...
药物研究及计算机辅助药物分子设计 药物研发和开发的历史与现状 现代药物研究可以归纳为如下几个阶段:20世纪40~60年代,主要药物研究是从大量合...
利用计算机集群,使机器学习算法更好地从大数据中训练出性能优良的大模型是分布式机器学习的目标。为了实现这个目标,一般需要根据硬件资源与数据/模型规...
数据挖掘流程 (一)数据读取 读取数据,并进行展示 统计数据各项指标 明确数据规模与要完成的任务 (二)特征理解分析 单特征分析,逐个变量分析其...
特征选择主要的两个功能: 减少特征数量,降维,使模型泛化能力更强,减少过拟合。 增强对特征和特征值之间的理解 去掉取值变化小的特征(Removi...
极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值。 极大似然估计提供了一种给定...
前言 Boosted Tree是数据挖掘和机器学习中国最常用的算法那之一。 对于输入数据不敏感 -->是统计学家到数据科学家必备工具之一 计算复...
资产证券化与区块链有一个很好的结合点,区块链被人们认识主要起源于比特币,比特币的本质是数字货币,区块链的本质在于它是一个分布式账本,而货币系统本...