4. 数据集的标注
4.1 变量标签
R处理变量标签的能力有限,一种解决方法是将变量标签作为变量名,然后通过位置下标来访问这个变量。考虑之前病例数据框的例子。名为age的第二列包含着个体首次入院时的年龄:使用patientdata[2]来引用这个变量,而在本应输出age的地方输出字符串"Age at hospitalization (in years)"。
4.2 值标签
函数factor( )可为类别型变量创建值标签。假设你有一个名为gender的变量,其中1表示男性,2表示女性:这里levels代表变量的实际值,而labels表示包含了理想值标签的字符型向量。
5. 处理数据对象的实用函数
函数head( )和tail( )对于快速浏览大数据集的结构非常有用。例如,head(patientdata)将列出数据框的前六行,而tail(patientdata)将列出最后六行。