01
引言
你还在为数据挖掘发愁吗?这里我们给大家推荐一个非常好用的数据库—NHANES。要做研究,就需要数据;NHANES数据库,官网直接免费下载!NHANES数据库初次使用者可以在官网导航栏中获取网站简介,受调者筛选,调查手册,数据获取,数据使用及分析方法等。下面是NHANES的功能简介和数据提取的基本流程,小伙伴们按需选取。
02
NHANES数据库简介
首先我们先来了解下NHANES这个数据库,NHANES是比较知名的公共数据库,国家健康和营养检查调查 (NHANES,National Health and Nutrition Examination Survey) 是一项基于人群的横断面调查,旨在收集美国成人和儿童的健康和营养状况的信息,该调查的独特之处在于它结合了访谈和体检。该数据库包括Demog Data(人口统计学数据)、Dietary Data(饮食数据)、 Examination Data(检查数据)、Laboratory Data(实验室数据)、Questionnaire Data(问卷数据)、Limited Access Data(有限访问数据)。调查结果将用于确定主要疾病的患病率和疾病的风险因素,也是衡量身高、体重和血压等国家标准的基础。
NHANES 数据库拥有庞大的数据资源,并且完全开放免费下载,而且这个数据库每两年更新一次,会加入大把新数据,完全不担心样本量不够。当然介绍的再多都不如自己去网站逛一逛。
03
NHANES 数据库如何挖?
1、登入网站:打开网页首页https://www.cdc.gov/nchs/nhanes/index.htm
2、选择数据集:点击左侧导航栏中的Questionnaires,Datasets,and Related
Documentation(问卷数据)。
3、选择数据年份:在这里我们以2017-2018年的数据为例,虽然2019-2020年份已经存在,但是2019-2020的数据还未整理完成。
4、选择需要的数据:在“Data,Documentation, Codebooks”一项中,有6项不同的数据,分别是“Demographics Data”(人口数据)、 “Dietary Data”(饮食数据)、“Examination Data”(检查数据)、“Laboratory Data”(实验室数据)、“Questionnaire Data”(问卷数据)、 “Limited Access Data”(限制访问数据)。这里 我们以“Demographics Data”为例,明确如何应用。
5、理解数据变量:点击“DEMO_I Doc”查看各个变量代表的是什么,如:种族。
6.下载数据:返回上一页,点击“DEMO_I Data [XPT - 3.3 MB]”下载数据,该数据为XPT格式,XPT格式的文件用Excel是查看不了的,我们可以导入到R语言中,使用R Studio查看,我们一般是转换成CSV格式进行查看并将其导出。
04
小结
目前用NHANES里的数据发表的文章有五万多篇,只要我们肯去挖掘,发SCI就不是什么大问题。如果大家感兴趣,可以去多读一些由NHANES数据库发表的文章获得灵感。当然,NHANES里的数据是美国人的,不能外推到其他国家的人。希望这些分享能对做科研的小伙伴有所帮助,至少不再为数据资源和样本发愁。
参考文献:
[1]郭晓娟,田国祥,潘振宇,杨津,柳青青,吕军.NHANES项目介绍及数据提取流程[J].中国循证心血管医学杂志,2019,11(06):654-657.
END
文 | Angel