前言
监测,流行病学和最终结果(SEER)数据库是由联邦政府资助的可公开获得的癌症报告系统,代表了美国疾病控制与预防中心,美国国家癌症研究所以及地区和州癌症登记机构之间的合作。SEER数据是全国性的,来自代表该国所有地区的18个州的信息。与其他常用数据集(例如,美国国家癌症数据库)相比,SEER是基于人群的,因为当地注册机构报告了特定区域和/或定义的种族/族裔人群中所有癌症病例的信息。鉴于SEER数据既是癌症报告系统又是研究工具,因此我们旨在介绍这些数据的显着方面,分析的优势和局限性以及重要的统计考虑因素。
Data Considerations
数据来源
SEER数据是在本地收集的。受过训练的登记人员从所有诊断或治疗癌症的临床环境中收集数据,并包括所有年龄段的患者,无论其保险状况如何。死亡的日期和原因来自死亡证明,并且使用美国人口普查局的数据(表)计算死亡率统计数据。 SEER数据涵盖了美国28%的人口;由于采用了针对性的抽样策略,它包括了很大比例的种族/族裔少数民族,外国出生的人以及收入低于联邦贫困线的人。
时间趋势数据
SEER项目起源于1974年,因此可以用来研究美国随着时间推移的癌症发病率,患病率和存活率的趋势。自1974年以来增加了SEER注册管理机构,从而产生了许多队列(例如1974年的SEER-9、1992年的SEER-13和2000年的SEER-18)。在分析的所有年份中,都应将趋势研究限制在一个一致的SEER队列中,以避免产生错误发现的基本人群的转移。