质性研究中扎根理论的三阶段编码方法,它不仅能实现一般文本分析方法的关键词词频分析,聚类分析等
更加厉害的是可以:
(1)了解主题词与主题词之间同阶段或与次阶段可能存在某种相互链接的“关系”
(2)其提取过程是一种可供检验的可视化路径对于科研工作者来说,这种方法还可以生成出新理论、新模型(感觉非常厉害的样子)!!!
因为它来源扎根理论,而扎根理论本身就是预期在资料、文献以及个人经验和专业经验的基础上形成理论。
那么首先我们得先了解这方法是什么东西?
一、什么是编码(coding)?
指将所搜集或转译的文字资料加以分解、指认现象、将现象概念化,再以适当方式将概念重新抽象、提升和综合为类属(也有叫范畴)以及核心类属的操作化过程。而对概念命名的目的, 则是为了让研究者能够将类似的事件、事例、事物等加以群组, 并归类在一个共同的标题或分类之下。
二、什么是三阶段编码?
三阶段编码主要通过开放、主轴、选择等三阶段的编码, 提取事例或事件所共同的特征或相关的意义, 使得它们能够被群组起来。看着还是有点懵,没关系,下面慢慢分别进行解释。
1、开放性编码(open coding)(一级编码)
开放编码是通过对现象的仔细研究, 以便进行命名和分类的分析工作, 亦即分析、检视数据并对其进行概念化的归纳、比较的过程。它的目的是从资料中发现概念类属, 对类属加以命名确定类属的属性和维度, 然后对研究的现象加以命名及类属化。类属(categories) 包含了概念的特性(properties)和维度(dimension)。特性比较好理解,维度是指特性的范围。
这样说可能有点抽象,说明白了就是“打标签”,把原始资料打散,贴上概念化的标签,然后按照它的特点和程度进行归类,相似的就归到一个组里(类属)。开放编码的过程类似于一个漏斗, 由一个较为宽广的范围逐渐缩小和集中。(如果最终要生成理论,那么需要原始资料尽量详实,直到译码呈现饱和。)
在开放编码的过程中, 会产生十几个甚至上百个概念, 因此编码者必须将相似的概念分类,而此阶段中的类属概念是暂时性的, 随时可能会因为新发现而出现必须修改的情况。那么如何恰当地编码?
在开放性编码的阶段,对概念的命名一般采用三种方式:
(1)自行创建:编码者不断进行资料对比, 借由事物所唤起的意义或意象, 创造能反映该意义或意象的名字;
(2)沿用已存在名字:这样的命名, 因为在权威文献中概念本身已包含了极为丰富的分析意义, 且都是已经发展得近乎完整的概念, 故而非常严谨, 但缺点则是缺乏弹性, 未必能与自己想表达的概念一致;
(3)见实编码 (Code in vivo):编码者从受访者本身所使用的话语中提取字词作为编码。
2、主轴性编码(axical coding)(二级编码)
主轴编码是借由演绎与归纳, 通过不断比较的方法将近似编码链接在一起的复杂过程。其主要任务是选择和构建主要类属的内容, 并将主要概念类属与次要概念类属连接起来, 以重新组织数据。那么这样的操作会使得两级编码之间形成一个关系网。在合并前面已经形成的概念类属中,发现和建立概念类属之间的相互关系,如因果关系、情景关系、功能关系、过程关系、时间先后关系等。
主轴性编码进行的步骤分别是:
(1)检查各次要概念类属与各现象彼此的关系, 在这个基础上思考类属与概念之间可能存在的假设性关系;(2)检证实际资料是否支持上述这种假设性的关系;(3)持续不断地寻找主要概念类属与次概念类属的性质, 并不断确认它们在当中的定位 (dimensional locations) ;(4)检证实际应用数据中的证据、事故、事件, 并予以解释、说明。通过反复推导和归纳整理, 编码者将开发出一些针对研究现象的概念类属。
3、选择性编码(selective coding)(三级编码,也叫核心性编码)
数据分析的最后阶段称之为选择性编码, 这一阶段的主要工作是通过整合与凝练, 在所有命名的概念类属中, 提炼一个“核心类属” (core category) 。核心类属是浓缩所有分析结果后得到的关键词, 这几个关键词足以说明整个研究的内涵, 即使条件改变导致所呈现出的现象有所不同, 但仍具备解释效力。在选择性编码之后,可以发展出一条“故事线”,指的是,用前两级编码发展出的类属、关系等提炼一个可扼要说明全部现象的核心,并且可以用资料去验证。
选择性编码主要通过5个步骤:
(1)创建一条清楚明确的故事线 (story line) ;
(2)通过译码范式模型连接主要概念类属之次概念类属;
(3)在面向的层级 (dimensional level) 发展派系类型;
(4)通过数据检证各派系中概念类属间的关系;
(5)填满可能需要补充或发展的类属。通过这些步骤, 编码者得以发展派系类型, 并在此基础上构建理论(如需要)。
三、实例案例分析:研究生培养质量影响因素研究
上面的纯理论大家可能听着有点抽象,这里找一篇论文,本案例来源于:费菲,戴慎.基于扎根理论的研究生培养质量影响因素研究——以对四所中医高校的访谈为例[J].高教探索,2013(03):115-118.
在此不对案例结果作评论,仅以此案例客观地阐述三阶段编码的使用过程。
1、访谈对象
在访谈对象的选择方面,既兼顾硕士研究生和博士研究生的不同层次群体,也兼顾学校所处地域,不同学科属性、学位类型、年级、性别等样本分布特征。因此,本研究采取了以大学为单位的整群抽样方式,访谈对象为全国四所中医药大学的20 名中医研究生,即每个中医药大学各选取五名中医研究生参加小组访谈。
2、访谈资料的收集
对20名中医研究生进行访谈,询问他们关于研究生培养质量影响因素的话题。通过录音设备记录访谈资料,之后转录形成文字资料约3.8万余字,隐去了个人信息,获得了被访者的同意。
3、开放式编码
(觉得太长可以直接跳到研究结果那)
这篇论文没有公布原始的访谈整理稿,所以这里无法将原始访谈稿与开放编码的结果进行对应。不过从编码结果可以大致判断,作者采用的是见实编码的方式。作者提到,在对访谈资料进行一级编码的过程中,主张让原始文字资料自己“说话”,从收集到的文字资料里寻找概念类属,提取关键词并命名,进行概念化处理,最终提炼得到34个开放式编码,分别是:临床实践活动。。。。。。考研复试。
4、主轴性编码
访谈资料的二级编码旨在找到并确立各个概念类属之间的联系,将开放式编码有机地整合、联接在一起,以对现象的形成进行更全面和清晰的解释。这样,作者又从34个开放式编码中合并出新的编码,形成9个关联式编码,分别为临床实践、。。。、招生考核,即中医研究生培养质量的9个影响因素。
5、选择性编码
访谈资料的三级编码是通过分析诸多概念类属及其内在联系,确定具有较强关联能力和关键性作用的核心概念类属。最后集中抽象出来的核心编码,就像是一条“渔网的拉线”。它可以起到提纲挈领的作用,较为密切地联系其他的概念类属,把它们串成一个整体直接拎起来,更有效地表达关系之间的内部逻辑,并最终完成整个理论的解释构建。作者分析了9个关联式编码,发现导师指导、临床实践、科研课题、传统文化这4个核心编码是中医研究生培养质量的直接影响因素,它们各自关联着其它若干因素,共同对培养质量发挥作用。
6、研究结果
(1)中医研究生培养质量的9个影响因素和3个重要影响因素
通过进一步对临床实践、。。。、招生考核9个因素进行频数统计,结果显示:临床实践、导师指导、科研课题这三个因素被关注的频率相对较高,分别为75%、65% 和50%。
可见,它们对中医研究生培养质量影响非常显著,是中医研究生培养质量的3个重要影响因素。被访者普遍认为: 临床实践活动是中医研究生培养的重要内容,同时也是保证培养质量的关键; 导师的亲自指导和言传身教,在医德、做人、治学方面都潜移默化地影响着学生,对中医研究生培养质量的提高起着相当重要的作用; 研究生培养区别于本科生的一个重要方面就在于强调培养学生的科研精神与科研素养,这也是保证培养质量的重要环节。
(2)中医研究生培养质量的4个直接影响因素
对中医研究生培养质量9个影响因素的相互关系进行深入分析,发现导师指导、临床实践、科研课题、传统文化这4个核心编码,分别各自作用于其它若干因素,通过不同的作用路径,对培养质量起着直接影响作用。导师指导这个直接因素(被提及的频繁程度为70%) 作用于学生临床具体实践、科研课题开展以及学位论文写作的全过程,共同对中医研究生培养质量起着重要的影响作用。临床实践(被提及的频繁程度为65%) 与理论课程和科研课题之间的关系也是非常密切,互相支撑,彼此促进。科研课题(被提及的频繁程度为60%)对学术氛围的营造和学位论文的写作进程也有直接影响,可以合力培养研究生的科研综合能力。传统文化( 被提及的频繁程度为50%) 与理论课程和学术氛围也有着紧密的联系,通过提高学生的传统文化素养,可深化其对中医的学习和理解,直接影响中医研究生的中医学术水平和专业水平。
(3)中医研究生培养质量影响因素的理论模型
(不建构理论的这部分就可以不看了)在对原始文字资料进行了三级编码的基础上,以导师指导、临床实践、科研课题、传统文化这4 个直接影响因素作为主线,与学术氛围、理论课程、学位论文等因素联系,就形成了如下图所示的中医研究生培养质量影响因素的理论模型。它不仅包涵了9个影响因素,同时也揭示了各因素影响中医研究生培养质量的复杂作用关系和内在联系路径。
四、三阶段编码还可以用来做什么?
根据我找到文献资料,我认为可以有以下的应用方式:
(1)分析访谈结果,不再只是简单地依赖设计师、用户研究者等人的主观分析,让分析结果更有说服力。因为它所构建出的概念, 以及概念与概念间的关系, 是扎根于数据, 通过反复验证后而自然萌生。据此, 研究者认为在这方面补充了主题词提取时的两大空白——解释 (而非仅仅描述) 主题词的如何产生, 以及呈现了不同主题词彼此之间可能存在的内部联系。
(2)对文本进行主题词的提取,做到主题标引,可以用在图书馆资源管理与检索领域。因为“主题标引” 意指对文献内容进行分析,然后对文献所表达的中心思想、所讨论的基本问题以及研究的对象等进行提取,以形成主题概念,然后在此基础上把可检索的主题词表示出来,再将这些主题词按一定顺序(如字顺)排列,对论述相同主题内容的文献加以集中,从而提高文献的查全率与查准率。
(3)如果对某一学科的大量文献都进行主题标引,那么对构建学科知识图谱,界定学科边界等问题有所帮助。
(4)建构新理论与模型,想必科研工作者对这一点喜闻乐见。对于一些探究XXX作用机制,XXX影响等等问题,这个方法就很适合,从大量丰富的现实资料中提炼出概念, 再把相似概念归纳出来,可以生成新理论。等等等等,还有很多方面的应用,大家可以自己思考下。也欢迎大家批评指正!
最后再提一下,这个方法使用起来跟使用者的能力挂钩,不同研究者针对同一份文本会有不同的结果。同时,因为会涉及到众多数据,靠手打标签肯定是不现实的,有atlas.ti、nvivo、maxqda几个常用软件就可以实现了, 其中Nvivo 软件可以参考公众:猫布袋 回复关键词 nvivo即可得到。