这次是GBD数据库的第15篇推文,
这一期,我们将介绍GBD数据库的第2个预测包——BAPC.
关于数据准备,大家可以参考第14篇推文,包括年龄结构数据以及人口数据都可以下载。
下面,我们直接进入到R语言分析过程。
首先,我们设置路径,读取R包
我们读取相应的数据,包括设定3个年龄向量用来提取
读取标准年龄结构数据
由于BAPC需要的数据结构和nordpred不同,BAPC行为年份,列为年龄,此外数据需要为整数,因此我们这里整理成0-4到95 plus的数据。考虑到不同性别发病率不同,所以这里我们分开预测男女的发病率。因此我们需要分开提取并整理男女数据,
我们首先整理男性数据
接着整理女性数据
同样的,我们读取GBD的1990-2019人口学数据
接着我们读取预测的2020-2030人口学数据
接着我们将<1以及1-4岁整合成0-4岁
接着我们整理人口学数据,变成BAPC能够识别的数据形式
由于BAPC需要将预测的行也要添加至发病数据中,因为我们预测2020-2030的情况,所以我们对其进行补充
数据准备好后,我们可以进行食管癌的发病情况预测
这里简单讲下参数设置(个人理解,不一定准确):gf值代表年龄分层与year的比值,比如我们这里年龄是5岁为一组,而year是1年为一组,所以gf=5
Npredict个人不是很理解,这里暂时给不了很好的解释,stdweight需要输入标准人口年龄结构用来计算ASR
接下来计算每个年龄层的发病数
计算每个年龄层的发病率
计算标准发病率
计算总发病人数
计算总的标准发病率
计算总发病人数
最后大家可以用R包最带的画图功能看下做的图形
我们一起来看下图形
这个是男性的标准发病率预测
这个是女性的标准发病率预测
最后大家可以将拿到的预测数据进行进一步的分析。