第一课 了解SQL 1.1 数据库基础 ① 数据库:保存有组织的数据的容器② 表:某种特定类型数据的结构化清单③ 列 :表中的一个字段④ 数据类型:所允许的数据类型⑤ 行:...
第一课 了解SQL 1.1 数据库基础 ① 数据库:保存有组织的数据的容器② 表:某种特定类型数据的结构化清单③ 列 :表中的一个字段④ 数据类型:所允许的数据类型⑤ 行:...
@caffeine_aa75 Yes
模型调参——随机森林在乳腺癌数据集上的调参应用一、数据集 Sklearn自带数据集——乳腺癌数据集 二、模型选择 乳腺癌数据集是二分类模型,选择随机森林模型进行调参 三、调参流程 1)简单建模,观察模型在数据集上具体的表...
那....一页一页复制数据粘贴下来Excel,然后再进去后面的分析吧,应该半个小时能下载好数据源。
Excel数据分析——药智网全国医院数据相关分析一、药智网介绍 药智网是全国最大的生物医药、化工在线交易平台,其中的药智数据是中国主流医药数据库之一,拥有药品研发、生产检验、合理用药、市场信息、中药材、医疗器械、食品安全、...
原始数据在文章开头的链接里啦,或者百度搜索一下也有~
Excel数据分析——Olist Store巴西电商数据分析一、背景介绍 Olist Store是巴西最大的一家在线百货公司,各个商家可以通过 Olist Store 来售卖他们的产品,并通过 Olist Store 的合作物流伙伴来...
小伙伴们大家好~o( ̄▽ ̄)ブ我是菜菜,这里是我的sklearn课堂第5期:sklearn中的逻辑回归~ 我的开发环境是Jupyter lab,所用的库和版本大家参考:Pyt...
R与RStudio的安装1.什么是R R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。简单来说,R是一门统计计...
一、数据来源 手写数字数据集 digit recognizor.csv 二、模型选择 降维算法选择decomposition模块下的PCA随机森林算法RandomForest...
一、数据来源 Sklearn自带数据集fetch_lfw_people 二、模型选择 降维使用Sklearn的decomposition模块下的PCA 三、分析过程 1)导入...
一、数据集 Kaggle泰坦尼克数据集train.csv 二、模型选择 泰坦尼克数据集是二分类模型,本文选择使用随机森林模型进行调参。 三、数据预处理 泰坦尼克数据集需要进行...
一、数据集 Sklearn自带数据集——乳腺癌数据集 二、模型选择 乳腺癌数据集是二分类模型,选择随机森林模型进行调参 三、调参流程 1)简单建模,观察模型在数据集上具体的表...
Sklearn 有专门处理缺失值的模块 sklearn.impute.SimpleImputer,本文将探究如何用 Sklearn 中的预处理模块中的 Impute.Simp...
当我们拿到一份原始数据,首先会查看数据的基础信息,例如每一列数量统计,内存消耗、哪些列有缺失值等。完整的数据对于我们的数据分析工作来说意义重大,但对于实际收集数据的人却不是,...
R与RStudio的安装1.什么是R R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。简单来说,R是一门统计计...
1. 项目背景 泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,于1909年3月31日动工建造,,912年4月2日完工试航。于1912年4月10日,在南安普敦港的...
从Excel到Python:最常用的36个Pandas函数 本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入、数据清洗、预处理,以及最常见的数据...
有什么问题...我的没问题...
Python TextRank4ZH 应用TextRank算法提取中文文本关键词、关键词组、关键句关键词提取有很多种方法,目前比较常用的两种方法,一种是TFIDF算法,一种是TextRank算法。 本文此次采用的是TextRank算法。TextRank算法是一种文本排序算...
一、背景介绍 Olist Store是巴西最大的一家在线百货公司,各个商家可以通过 Olist Store 来售卖他们的产品,并通过 Olist Store 的合作物流伙伴来...
楼主介绍的够详细全面了。总之,需要先安装R,然后再安装Rstudio。
一、药智网介绍 药智网是全国最大的生物医药、化工在线交易平台,其中的药智数据是中国主流医药数据库之一,拥有药品研发、生产检验、合理用药、市场信息、中药材、医疗器械、食品安全、...