质性内容分析:分步指南与示例

质性内容分析简介
质性内容分析帮助研究者系统地探索大量文本——发现模式、映射意义并生成见解,而无需将所有内容简化为数字。这是一种灵活的方法,既为质性数据带来结构,又不会将研究者束缚在僵化的框架中。
在本指南中,我们将拆解什么是质性内容分析,它与主题分析有何不同,以及每个步骤在实践中是如何操作的——从准备数据到呈现结果。我们还将介绍归纳和演绎编码的作用,展示 NVivo 和 ATLAS.ti 等质性数据分析软件如何简化工作流程,并通过示例展示质性内容分析在现实应用中的样子。
*如果您是该方法的新手,建议在继续之前先阅读 Lumivero 关于质性数据分析的概述。*
什么是质性内容分析?
质性研究的内容分析是一种组织和解释文本或视觉数据的系统方法。与计算单词或编码的定量内容分析不同,质性形式关注意义和语境。
研究者处理访谈转录稿、调查评论、政策文件或媒体帖子,分离与研究问题相关的片段。这些片段被分组为数据驱动或理论指导的类别,以描述这种现象。该方法在结构上保持灵活,使研究能够扎根于原始材料。这项技术源于早期的大众传播研究,现在支持健康、教育和社会学领域的研究。
质性内容分析文献中出现了几种风格。Hsieh 和 Shannon 描述了传统、定向和总结性方法,每种方法都匹配不同的分析目标。
传统分析让类别从数据中成长,定向分析从先前理论开始,总结性分析检查所选术语的频率或强度,同时解释潜在意义。这三种都需要透明的文档记录,以便读者可以看到如何得出发现。
质性内容分析的可信度取决于清晰的编码规则、反思性备忘录写作,以及在有用时有多个编码者讨论差异。特别是在多个研究者分析数据集时,建立可靠性是呈现可信分析的重要任务。Krippendorff's α 等可靠性统计指标可以与可信度和可转移性等质性标准并列(关于可信度的指导)。指导强调即使出现计数,解释——而非预测——仍然是目标。
同行审查、参与者检查和反思性日志提供了额外的证据,证明解释与源语境相符。这些实践向期刊审稿人表明了分析诚信。
NVivo 和 ATLAS.ti 等质性数据分析软件可以通过分段、编码和备忘录管理加快质性内容分析,而不会改变方法的逻辑。相同的工作流程适用于焦点小组、实地笔记或社交媒体截图。为研究选择合适的平台取决于团队规模、文件类型和报告需求,本指南将在后面讨论。接下来,我们考虑内容分析在质性-定量谱系中的位置。
内容分析是质性还是定量的?
内容分析有时被标记为混合方法,因为它借鉴了质性和定量传统的工具。区别取决于研究者如何处理材料。
质性取向。当目标是解释意义如何形成时,研究者关注语境。文本片段被编码为潜在或显性意义,类别保持开放以进行完善。解释性注释、备忘录和迭代比较指导决策。可能会注意频率,但仅用于强调重点,而非检验假设。可信度检查——同行审查、成员反馈、反思性日志——支持质性工作中常见的可信度标准。当目标是解释意义如何形成时,研究者关注语境,这就是为什么质性研究侧重于探索对特定现象的深入见解。
定量取向。定量研究对于通过测量和分类内容来建立研究中的可靠性和有效性至关重要,使研究者能够基于统计证据得出结论。当在数据审查之前固定编码,并且计数驱动分析时,研究转向定量方面。例如,在媒体研究中,团队可能会统计政策框架在报纸中出现的次数,以做出可概括的主张。Cohen's Kappa Coefficient 等可靠性统计指标成为判断严谨性的核心。这种方法适用于数据量过大、使得深度解释工作不切实际的大型数据集。
混合实践。许多研究结合了两种逻辑。类别可能源自理论(演绎),但分析人员仍然会阅读细节。计数可以突出重要性,而叙述摘要则说明模式重要以及为什么重要。NVivo 和 ATLAS.ti 等软件支持以计数和意义为重点的编码,让团队能够在谱系上来回移动。选择一种平衡而非另一种取决于研究问题:目标是映射频率、解释意义,还是两者兼而有之?认识到这种连续性阐明了为什么内容分析可以出现在期刊方法指南的质性或定量研究部分。
质性内容分析的类型
研究者根据理论在多大程度上塑造研究问题,在演绎和归纳内容分析之间进行选择。两种方法都遵循相同的广泛工作流程——准备数据、编码、分类和解释——但它们在定义类别的时间和分析期间编码的灵活性方面有所不同。
演绎质性内容分析
演绎分析从现有框架开始——通常是从先前文献或政策文件中提取的一组概念。分析人员在编码开始之前将这些概念转换为类别矩阵。评估每个文本片段在该预定结构中的适用性;不适用的片段被单独记录或标记为"其他"以供后续审查。
由于编码框架在早期固定,因此可以在早期阶段计算编码者一致性统计指标。任何分歧都会促使对类别定义进行有针对性的修订,而不是全面重构。当目标是确认模型、监控政策采纳或在新情境中映射理论时,此策略效果很好。例如,患者安全报告的研究可能会根据预定义的错误类型对报告进行编码,以评估医院单位的频率和严重程度。演绎路线将重点放在测试或扩展既定解释上,而不是生成新结构。
归纳质性内容分析
归纳分析通过让类别在仔细阅读材料的过程中发展来颠倒这一顺序。分析人员从开放编码开始——标记任何有意义的片段,而不强迫其进入预设方案。捕获相似含义的代码随后合并为更高阶别的类别,可以通过持续比较进行完善,直到没有新类别出现。
备忘录写作跟踪分析问题和类别之间的 tentative 链接。这种灵活性允许意想不到的主题浮现,使归纳分析适合探索性研究或先前研究有限的情境。例如,检查第一代大学生社交媒体帖子的项目可能会揭示早期文献中未注意到的应对策略或支持网络。
有关此工作流程的实用指南,请阅读"质性研究中导航归纳内容分析",其中概述了增强透明度的代码合并、抽象和审计追踪技术。
质性研究中的内容分析与主题分析
内容分析和主题分析都将原始语言数据转化为有组织的发现,但它们服务于不同的分析目标。两者都从熟悉的步骤开始——数据熟悉、编码、分类和模式搜索——因此从一种方法转向另一种方法的研究者将认识到工作流程的大部分内容。两种方法也接受演绎或归纳逻辑;研究可以从理论驱动的代码开始,或者允许类别在阅读过程中浮现。反思性备忘录写作、同行检查以及 NVivo 或 ATLAS.ti 等研究软件工具都支持两种方法的严谨性。
在内容分析的背景下,区分概念分析和关系分析很重要。概念分析关注数据中特定概念的存在和频率,而关系分析旨在理解这些概念之间的关系。通过概述两种分析类型涉及的过程和考虑因素,研究者可以确保方法论的严谨性并了解对研究结果的影响。
关键分歧在于每种方法如何处理意义单元以及它寻求的结果。内容分析强调清晰边界单元(单词、句子或图像)的频率和分布,以回答"存在什么以及频率如何"。类别相对接近文本,计数引入了准定量视角,而不会改变工作的解释性质。
主题分析关注跨越数据集的更广泛模式,询问"这种模式告诉我们关于潜在现象的什么信息"。主题可以整合语境、潜在意义和参与者自己的框架,即使特定的单词发生变化。因此,主题分析通常产生将几个代码联系成一个整体故事的叙述性描述,而内容分析通常产生具有说明性摘录的结构化类别和子类别列表。
这两种质性研究方法在输出粒度上也不同。调查评论数据的管理者可能更喜欢内容分析,因为它提供了简洁的类别计数,可以直接输入仪表板,而民族志学者可能依赖主题分析来制作社会过程的丰富描述。在它们之间选择取决于研究问题、数据集大小和期望的抽象级别。
有关能够适应任一方法的软件功能的实用考虑,请参阅 Lumivero 的 QDA 软件选项比较。
| 方面 |
内容分析 |
主题分析 |
| 主要焦点 |
意义单元的频率和分布 |
数据集中的模式化意义 |
| 典型分析单元 |
单词、短语、句子、图像 |
片段、情节或完整叙述 |
| 结果 |
具有计数(可选)的层次结构类别 |
解释现象的主题 |
| 计数的作用 |
常见,支持比较 |
可选,通常次要 |
| 抽象级别 |
更接近表面意义 |
从表面到潜在意义 |
| 理想用例 |
大型评论集、媒体研究、政策跟踪 |
基于体验的研究、身份工作、过程追踪 |
| 常见软件任务 |
编码和计数、矩阵查询 |
代码比较、主题映射 |
| 报告风格 |
类别频率的表格或图表加示例 |
具有说明性引文的叙述性综合 |
质性内容分析步骤——从数据收集到分析过程
质性内容分析通过一个可重复的工作流程进行,保持原始材料与最终发现之间的联系。以下八个步骤概述了从数据收集到编写的典型路径。团队随着见解的发展经常回到早期步骤,因此将序列视为组织框架而非僵化的清单。
准备并熟悉数据
在一个单一项目空间中收集所有相关来源——访谈转录稿、焦点小组录音、政策文件或社交媒体捕获。逐字转录录音,纠正明显错误,匿名化识别细节以保护参与者。将清理后的文件导出为文本可搜索格式,如 .docx 或 .txt,然后在不编码的情况下至少通读每个文件一次。使用边注或备忘录记录第一印象、有趣的措辞和可能的分析角度。早期熟悉度通过阐明参与者如何表达想法、他们自然使用的术语以及语境提示出现的位置来加强后续编码。
定义分析单元
分析单元是将接收编码的最小数据块。根据研究问题,它的范围可以从单个单词到整个段落。对于关于污名语言的研究,单词或短语可能就足够了;对于关于工作场所文化的工作,句子或短段落提供更多语境。有意选择单元,在方法部分说明选择,并在整个数据集中保持稳定,以便计数和比较保持有意义。当多个单元都合理时,在一个小子集上试点每个选项,看看哪个以最少的歧义捕获预期概念。
开发或完善编码框架
创建一个编码框架,列出类别名称、简短定义和包含-排除示例。在演绎项目中,类别源自理论或政策指南;在归纳项目中,它们从开放编码中成长。无论哪种方式,都在最低级别旨在互斥,除非有合理的重叠,否则单个单元适合一个类别。在层次关系重要的地方,将类别排列为父子分支以反映不断增加的特异性。定义良好的框架减少编码漂移,支持透明度,并加快后续检索任务。将框架存储在软件注释或共享文档中,当修订发生时自动更新。
试点测试编码框架
将草稿框架应用于数据集的 5% 到 10%。如果在团队中工作,独立编码相同文件,然后比较片段与编码的匹配。注意分歧、模糊定义或缺失类别。修订措辞,合并重叠代码,或分割模糊重要区别的大代码。重新测试,直到编码者达到可接受的一致性水平,或者在单编码者研究中,直到框架感觉稳定。试点防止以后的大规模重新编码,并生成显示分析决策如何演变的审计追踪。
编码整个数据集
系统地处理每个文件,将编码分配给每个合格单元。保持反思性备忘录以记录不确定性、新兴想法或影响意义的语境因素。片段边界应与选定的分析单元保持一致;避免扩展或缩小单元以强制适配。在软件中,使用颜色编码或标签标记需要第二次查看的单元。如果为可靠性进行双重编码,设置检查点(例如,每五个文件)以讨论差异并根据需要调整框架。当处理所有数据并且没有未解决的片段时,编码完成。
总结类别并识别模式
导出编码报告或运行矩阵查询以查看链接到每个类别的所有片段。编写简洁的摘要,用普通语言捕获每个类别的要点。注意相对普遍性、典型语境和任何值得注意的例外。查找类别之间的共现、时间序列或跨参与者组的对比。基本计数可以突出重要性,而质性比较阐明意义如何不同。在可视化有帮助的地方,在软件中生成条形图或聚类图;这些输出有助于解释,而不会取代叙述性见解。
检查可信度和可靠性
通过将每个主张追溯到支持片段和备忘录来建立可信度。邀请同行审查编码框架和编码文本样本,询问解释是否合理。如果适用,与参与者分享初步发现以供评论。当使用固定框架时,计算编码者间可靠性统计指标,如 Krippendorff's α,或者在框架归纳发展时依赖协商一致性。维护记录编码决策、备忘录条目和框架修订的审计追踪,以便外部读者可以遵循分析逻辑。
报告发现
在方法部分描述数据集、分析单元、编码框架构建和可靠性检查。用简洁的定义和一个或两个说明性引语呈现每个主要类别(或主题,如果类别后来聚合)。当计数提供信息时,包括一个简单的表格,列出类别频率或按组的交叉表。讨论模式如何回答研究问题,与先前研究相关,或指向实际含义。提供足够的摘录数据供读者判断证据与解释之间的拟合,但不要用长文本块压倒他们。
质性内容分析的益处和挑战
质性内容分析提供了一系列益处,使其成为探索复杂研究问题的强大方法。其主要优势之一是能够从文本和视觉数据中揭示深入、细致的见解。与定量方法不同,质性分析允许研究者探索语境、意义和主观体验——使其在社会和文化研究中特别有价值。
另一个主要优势是灵活性。质性内容分析可以应用于各种数据源,如访谈、焦点小组、开放式调查回复、政策文件和社交媒体内容。这种适应性允许研究者根据其研究的具体目标和设计量身定制他们的分析。
然而,该方法确实带来挑战。编码和分类数据可能高度主观,增加不一致或偏见的风险。NVivo 和 ATLAS.ti 等工具通过提供结构化编码环境、可视化和审计追踪来解决此问题,这些工具有助于在整个研究过程中保持一致性和透明度。两个平台都支持基于团队的编码,允许多个研究人员协作工作,同时跟踪编码者间一致性。
研究者偏见是另一个担忧,特别是因为质性内容分析严重依赖解释。为了减轻这种情况,备忘录和注释等反思性实践至关重要。NVivo 和 ATLAS.ti 通过内置的备忘录写作、链接见解和记录分析决策的功能支持这些实践,帮助研究者意识到他们的假设并在解释中保持严谨性。
质性内容分析的耗时性质——特别是对于大型数据集——也是一个常见的障碍。手动排序、编码和分析可能会很繁重。在这里,NVivo 和 ATLAS.ti 提供自动化工具,如词频计数、文本搜索、情感分析和按主题自动编码(识别名词短语),这些工具可以加快初始编码并减少手动工作量,而不会牺牲深度。
尽管存在挑战,质性内容分析仍然是生成丰富、详细发现的有价值方法。当与 Lumivero 的研究软件等工具配对时,研究者可以简化他们的工作流程,增强可靠性,并加深他们的见解。
质性内容分析示例
以下虚构案例展示了研究者如何在不同数据源和分析逻辑中应用质性内容分析。虽然不是来自实际研究,但每个示例都遍历了分析单元、编码框架和可信度检查的关键决策,说明了该方法如何适应不同的研究目标。
示例 1:患者体验社交媒体帖子的归纳分析
研究目标和数据集。一个质性健康研究团队想了解患者在社交媒体上如何谈论门诊化疗。他们在六个月的窗口内抓取了 12,000 条公共社交媒体帖子,然后抽样了 2,000 条提到输液诊所的英语帖子。每个帖子成为分析单元。
编码工作流程。分析人员将样本导入他们的 CAQDAS 项目并开始开放编码。"长等待"、"护士支持"和"账单冲击"等短语捕捉了帖子内容,而不会强迫其进入预定义结构。两轮之后,团队将代码分组为更广泛的类别——物流、人际护理、身体副作用和财务压力——检查帖子在最低级别适合一个类别。
可信度。两个编码者对样本的 10% 进行双重编码,协商分歧,并在重叠导致混淆的地方完善定义。备忘录记录了当新模式出现时将"副作用"分割为"急性"和"延迟"子类别的决策。项目外的同行审查者阅读链接到每个类别的随机摘录,并同意标签与内容匹配。
关键见解。归纳方法浮现了一个意想不到的类别:"众包提示",患者在其中交换有关管理恶心和安排的实用建议。这个类别指导临床团队指向可能值得正式评估的患者生成资源。
示例 2:大学政策文件的演绎分析
研究目标和数据集。一项教育政策研究调查美国大学如何在学术诚信政策中嵌入公平语言。研究人员从机构网站收集了 150 份公开可用的政策文件。分析单元是一个句子,因为它在语境和特异性之间取得了平衡。
编码框架构建。借鉴现有的公平框架,团队在编码之前构建了类别矩阵:(1) 包容性语言,(2) 恢复性实践,(3) 惩罚性重点,(4) 学生支持资源。每个类别都带有包含和排除规则以及示例句子。
分析和报告。交叉表查询按大学类型(公立旗舰、区域公立、私立非营利)统计类别计数。私立机构在"包容性语言"和"学生支持"方面显示较高比例,而惩罚性语言主导区域公立机构。报告在条形图中呈现这些比例,并引用说明性句子以显示公平引用如何因机构使命而异。
实际结果。发现为政策简报提供了信息,该简报突出了差距领域,并建议基于同行机构中较高频率的恢复性陈述的修订模板。
这些示例演示了归纳和演绎逻辑如何指导框架开发,单元选择如何塑造可比性,以及可信度检查如何与研究设计保持一致,而不是一刀切的协议。
质性数据分析软件
虽然质性内容分析可以使用 Microsoft Word 文件和 Microsoft Excel 电子表格完成,但专门的研究软件管理重复性任务、跟踪决策并以手动系统难以匹配的方式组织证据。
Lumivero 以下质性数据分析软件满足大多数研究者导入数据、应用编码、查询模式和导出结果的需求——允许您简化质性内容分析。两者都在 Windows 和 macOS 上运行,支持多媒体项目,并允许团队通过服务器或云附加组件共享相同的项目文件。在它们之间选择取决于界面偏好、协作工作流程和所需分析工具的深度。
NVivo
NVivo 将所有内容——来源、编码、备忘录和分类——分组在一个单一的项目文件中。文本、音频、视频、图像、PDF 和网络捕获只需点击几下即可导入,保留原始格式。
编码通过熟悉的高亮和分配操作处理,其工作方式类似于常见文字处理器中的注释功能。当重叠在理论上合理时,分析人员可以将同一片段标记为多个编码,拖放让他们即时合并或重新组织节点。
NVivo 中的查询功能为内容分析提供强大支持。编码查询检索链接到所选编码的所有来源中的所有片段,对于检查概念在访谈和政策文本中出现的一致性很有用。矩阵编码查询交叉两组编码——例如,错误类型按医院部门——创建一个显示每个单元格计数和文本数据提取的列联表。用户可以将这些矩阵导出到 Excel 进行进一步统计或直接复制到报告中。
NVivo 的自动化见解包括词频列表、词云和由大型语言模型支持的主题摘要。这些工具在不取代手动解释的情况下快速提供主导语言感。分类表存储人口统计或组织元数据,这些元数据直接输入交叉表查询,使更容易按参与者组或文档类型比较模式。
团队协作通过独立项目的合并功能得到支持,但较大的团队通常选择 Collaboration Cloud 服务。它管理检出和检入,以便用户永远不会覆盖彼此的工作。审计日志记录项目更改,这在可信度检查期间很有价值。NVivo 的容量限制很高——数千个来源和编码——尽管非常大的视频数据集需要足够的硬件以实现峰值性能。
ATLAS.ti
ATLAS.ti 将项目视为链接对象的网络,而不是单个容器。文档、编码、备忘录、引文和组出现在可以跨多个显示器平铺或浮动的侧面板中。这种布局适合喜欢在工作时看到关系的分析人员,因为链接是通过从一个对象拖动到另一个对象创建的。软件支持所有常见数据类型,并嵌入用于将音频或视频与时间戳同步的转录编辑器。
编码过程使用类似于 XML 的标记模型:每个引文接收一个或多个显示在边距中的编码标签。编码列表可以按组、颜色或创建日期过滤。编码编码注释直接位于每个标签下方,使容易将操作定义与示例一起存储。ATLAS.ti 的网络视图允许用户在编码、备忘录和文档之间绘制链接线,产生一个可视地图,该地图也是分析备忘录。
对于内容分析,编码共现表和编码-文档表提供编码重叠频率或出现位置的快速计数。分析人员可以设置邻近规则——相同引文、相同句子或在"x"单词内——以完善这些计数。表导出到 Excel 或 SPSS 进行额外分析。情感分析工具对整个数据集中的积极和消极基调进行评分,这可以在研究情感语言时指导进一步的类别完善。
团队受益于存储在 ATLAS.ti Cloud 或网络驱动器上的多用户项目,具有基于用户的访问控制以防止意外编辑。注释日志列出每个更改,显示谁移动了编码或编辑了备忘录。通过内置函数检查编码者间一致性,该函数计算 Krippendorff's α 并按编码可视化一致性,帮助团队早期解决分歧。
ATLAS.ti 与外部参考文献管理器和调查平台集成。.QDpx 导出确保与其他 CAQDAS 程序的互操作性,因此如果机构许可证更改,研究者可以移动项目。定价模型对个人基于订阅,对机构永久,为短期项目提供灵活性。用户经常引用其网络图和灵活链接作为选择它的原因,当关系分析是研究设计的核心时。
准备简化您的质性分析?
无论您是在编码社交媒体帖子、政策文档还是访谈转录稿,正确的工具都会产生重大影响。Lumivero 的质性研究软件帮助您管理、编码和可视化您的数据,而不会失去使质性工作如此强大的细微差别。
在线留言
尊敬的客户朋友,如您有任何意见建议,请通过下表反馈给我们,我们会尽快与您联系。
|