翻译:黄小伟,资深数据从业者。目前就职杭州有赞数据分析团队,欢迎加入!
欢迎关注公众号:《R语言中文社区》
2019年11月份,144个R新包收录于CRAN(10月份收录223个),累计收录15,515个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。此次整理了8个类别,分别为计算方法、数据获取、基因组学、机器学习、统计学、时间序列、效率工具和可视化工具。以下是本期(总第36期)R新包的核心功能介绍:
一.计算方法
- calculus: 针对数值和符号演算提供了C++优化函数,包括符号算术、张量演算、泰勒级数展开、多元埃尔米特多项式等.2. Jaya: 实现无超参数的无梯度算法,用于解决有约束和无约束的优化问题.3. treenomial: 提供创建和比较多项式的函数,这些多项式独特地描述了Liu(2019)中引入的树.
二.数据获取
eudract: 支持对欧洲临床试验数据库(EudraCT)的访问,该数据库汇总了所有已注册的临床试验结果.
ozmaps: 提供澳大利亚海岸线和行政区域的地图,以及澳大利亚国家或州地图的简单功能、澳大利亚统计局提供的行政区域的内置数据集.
presentes: 提供军事政变期间阿根廷国家恐怖主义受害者的官方登记簿的汇编.
VancouvR : 提供温哥华市开放数据API的封装.
wiesbaden: 提供一个API接口,支持从德国联邦统计局(DESTATIS)的不同数据库检索和导入数据.
三.基因组学
biocompute: 如King等人所述(2019),提供创建、验证和导出BioCompute对象的工具.
diem: 实现一种新型的半监督机器学习分类器DIEM,“使用期望最大化的碎片识别”,从基于液滴的单细胞/核RNA-seq中识别出包含碎片的液滴.
四.机器学习
azuremlsdk: 实现与Azure机器学习软件开发工具包的接口,使数据科学家可以在Azure机器学习服务上训练,部署,自动化和管理机器学习模型.
hereR: 实现HERE REST API的接口,该接口提供有关地理编码、路由方向、交通流量和天气预报的信息.
- hilbertSimilarity: 使用希尔伯特曲线发展希尔伯特相似度的概念,以量化高维数据中样本之间的相似度.
- orf: 实现Lechner和Okasa(2019)中开发的有序森林估计量,以估计具有有序分类结果的模型(有序选择模型)的条件概率.
- RPEClust: 实现了Anderlucci等人(2019)和Raftery and Dean(2006)中描述的随机投影集成聚类算法.
五.统计学
- DiffXTables: 通过两个或多个列联表中基础分布的差异,为模式异质性的统计假设检验提供功能,包括比较卡方检验、Sharma-Song检验和异质性检验.
effectsize: 提供与各种模型的效应大小指数和标准化参数一起使用的功能.
exPrior: 为地质、水文等统计领域的从业人员提供工具,以导出贝叶斯推断的先验分布.
- fitHeavyTail: 针对多元高尾分布(例如角度高斯,柯西和学生的t)下的数据(可能包含NA),对均值向量和协方差矩阵实施鲁棒的估计方法.
mixl: 提供用于多项式logit模型、混合模型、随机系数和混合选择模型的模拟最大似然估计的功能.
MKdescr: 提供功能来计算标准化的四分位数范围(IQR)、Hampel(1985)中描述的Huber型跳过均值、Arachchige等人中描述的鲁棒变异系数(2019)、信噪比(SNR)等.
MNLpred: 提供函数以返回模拟的预测概率和多项式logit模型的一阶差.
pdqr: 提供创建、转换和汇总自定义离散和连续随机变量的函数.
tensorregression: 在Xu,Hu和Wang(2019)中实现广义张量回归,以交替更新算法在给定多种模式下的协变量的情况下解决张量响应回归.
tidydice: 提供基本统计实验的功能,可用于教学入门统计.
11. tvgeom: 实现时变右截断的几何分布的概率质量、分布、分位数和随机数生成函数.
六.时间序列
- gravitas: 通过可视化概率分布,提供了用于跨不同时间粒度(时间解构)系统探索大量时间数据的工具.
2. smoots: 提供等距时间序列中具有短期内存固定误差的趋势及其导数的非参数估计.
- tsfgrnn: 实现一般的回归神经网络(GRNN),这是径向基函数网络的变体,用于预测时间序列.
七.效率工具
1. dipsaus: 提供四类增强功能:shiny输入小部件、使用RcppParallel和future的高性能计算、修改R调用和转换数字、字符串和其他对象的函数以及获取系统信息(如CPU芯片组、内存限制等)的实用函数.
extraoperators: 为常见任务提供操作员功能,例如逻辑或关系比较,查找索引和子集.
gluedown: 提供在R向量和降价文本之间转换的功能, 用户可以在R中创建矢量,将字符串与markdown语法粘合在一起,并将带格式的矢量直接打印到文档中.
googlesheets4: 提供用于通过表格API v4与Google表格进行交互的功能.
hdd: 提供用于导入和处理内存不足数据集的数据类.
RVerbalExpressions: 提供使用受VerbalExpressions启发的语法和功能来构建正则表达式的工具.
7. shinyMobile: 提供用于为iOS、Android和台式计算机以及shiny小工具构建shiny应用程序的工具。ShinyMobile建立在最新的“ Framework7”模板之上.
- tidycwl: 实现用于描述数据分析工作流的通用工作流语言.
八.可视化工具
- barplot3d: 提供用于创建3D图的功能,包括用于DNA测序分析的序列上下文图.
2. fplot: 提供使用公式绘制正态/加权/条件分布的函数.
- robvis: 提供功能使偏差评估的风险可视化,作为系统回顾的一部分,为随机对照试验、非随机干预研究和诊断准确性研究提供工具.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~