PLS-SEM结果汇报和案例分析
前言
论文顺顺利利写完,拿到了全组最高的评分,让我过了把 Distinction 的瘾,还拿到了 Dean’s List,算是意外之喜了。导师也继续了以前的想法,想要对我的论文进行进一步修改之后投期刊,这期间所有工作她来负责,她拿一作我拿二作。很划算。
既然为期将近 50 天的研究画上了个圆满的句号,我也可以来进行一项早在九月就在筹划的工作了:撰写论文的 Results and Analysis 章节时,mlln-cn 的一篇博客给了我很大的帮助,在总体上为我提供了汇报数据的思路,虽然一些部分不完全适用于我的研究,但是我还是从中收获了很多。那时就在想,等我论文尘埃落定,我也要结合我的论文研究过程来写一篇针对 PLS-SEM 方法的结果汇报攻略,现在可以开始着手来做了。文中部分内容直接转发自 mlln-cn 的 pls-sem 结果汇报方法和案例【以 SmartPLS 为例】,文章为个人记录用,还望不要介意。
此外,由于论文还在投稿阶段,在下文中不会提到详细的研究内容,给出的数据也都不是真实数据,仅作为汇报形式的参考。
通用报告原则
在开始 PLS-SEM 的报告之前,我们需要强调实证研究一些常用的基本原则,这些原则有助于你的论文顺利通过评审,并且有助于学科发展,提高研究的可重复性和可批判性。原则上说,以下信息都需要在论文中给出声明或解释:
- 数据样本来自哪里,数据量是多少,总体是什么,抽样方法是什么,为什么采取这种抽样方法。
- 数据分布以及对统计方法的适用性
- 理论模型,以便确认统计方法的适用性
- 统计结果
- 统计软件的名称和版本号
对于 SEM 模型来说,最好的方法是绘制概念图(理论模型),在图中可以看到每个潜变量的测量指标, 并且可以看到每个潜变量之间的关系(箭头),这种方式可以快速让读者(或者评审)理解你的模型,而且很全面。
PLS-SEM 的优势
基于偏最小二乘法的结构方程模型(PLS-SEM, Partial Least Square Structural Equation Modeling)和基于协方差的结构方程模型(CB-SEM, Covariance Based Structural Equation Modeling)都是结构方程模型的子类,其中 CB-SEM 是无偏估计,PLS-SEM 是有偏估计,因此 CB-SEM 有着更广泛的应用。我们在采用 PLS-SEM 时必须结合理论模型和数据来解释选择这种方法的原因。
Hair 在 《When to use and how to report the results of PLS-SEM》这篇文章中介绍了 PLS-SEM 的优势,总结和翻译过来, 选择 PLS-SEM 而不是 CB-SEM 的原因通常有以下几个:
- 数据的性质:PLS-SEM 适用于小样本数据,而 CB-SEM 更适用于大样本数据。因此,如果数据样本较小,则可以选择 PLS-SEM。并且你需要说明为何无法收集更多样本。
- 复杂性:CB-SEM 通常比 PLS-SEM 更复杂,因为它需要指定更多的参数,例如路径和方差。如果你的模型非常复杂,CB-SEM 经常无法收敛,则可以选择 PLS-SEM。
- 研究目的:PLS-SEM 更适用于探索性研究或理论建立,而 CB-SEM 更适用于验证性研究或检验理论模型。
- 形成性潜变量存在时。
- 当数据分布问题令人担忧时,例如缺乏正态分布特性。
- 当研究用到了潜变量的分数,以便在后续分析中使用时。
我为什么选择 PLS-SEM
与 CB-SEM 方法相比,PLS-SEM 对数据分布的要求更低,不要求数据严格服从正态分布(Ringle et al., 2012)。此外,PLS-SEM 方法被证明在探索性研究和预测性研究中有着优秀的表现,并且特别适合处理复杂的理论模型(Hair et al., 2017)。本研究整合了多个感知价值维度,并引入了新的变量(感知通畅度)来探索免费增值移动游戏的付费意愿。考虑到本研究的探索性质和模型的复杂性,PLS-SEM 成为了最适合的分析方法选择。
两阶段汇报原则
结构方程模型(不管是 PLS 还是 CB)的结果汇报通常包含两部分:
- 测量模型的结果:测量题目的信效度(或者叫测量模型的信效度), 变量都是用题目来测量的, 但是你凭什么证明这些题目可以代表某个变量呢, 通常需要做信效度分析的
- 结构模型的结果:变量之间的关系的检验, 或者说变量之间的路径系数的显著性检验

测量模型的结果
为了确保研究结论具有说服力,研究人员必须对测量工具的信效度进行验证,具体来说分为内部一致性信度分析、收敛效度分析、区分效度分析和共线性诊断。
内部一致性信度分析
内部一致性信度分析是评估测量工具质量的关键步骤,它反映了测量项目间的相互关联程度,确保它们共同测量同一构念。本研究采用 Cronbach’s Alpha 和组合信度(CR)两个指标来评估内部一致性信度。Cronbach’s Alpha 是衡量量表项目间一致性程度的传统指标,其评判标准通常为:0.7 ≤ α < 0.8为可接受,0.8 ≤ α < 0.9为良好,α ≥ 0.9为优秀。组合信度(CR)作为对Cronbach’s Alpha的补充,考虑了不同指标载荷的差异,提供了一个更为精确的信度估计。一般情况下,CR > 0.7 被认为具有良好的内部一致性。
Alpha 和 CR 如下图所示(我还将 AVE、AVE 平方根和相关矩阵在下图中一并给出,这些指标会在后续汇报中用到)。

收敛效度分析
收敛效度是评估测量模型质量的另一个重要方面,它反映了理论上相关的指标是否在实际测量中也表现出预期的相关性。高收敛效度表明用于测量特定构念的指标确实捕捉到了该构念的本质。本研究主要通过平均方差提取(AVE)和外部载荷两个指标来评估收敛效度。平均方差提取(AVE)反映了构念能够解释的指标方差占总方差的比例,通常应大于 0.5。外部载荷应该大于 0.708。这个标准基于一个简单的数学关系:0.708 的平方约等于 0.5,这意味着潜在构念至少解释了该指标 50%的方差。
AVE 在表 10 中已经给出,外部载荷的汇报如下图所示:
区分效度分析
区分效度反映了不同构念之间的独特性和差异程度。如果只有收敛效度满足要求而区分效度没有达到标准,意味着测量工具虽然可以准确测量相应的概念,但是不同的概念之间存在重合,需要针对某些构念进行删除或合并。常用的检验模型区分效度的方法有交叉载荷验证和 Fornell-Larcker 准则。交叉载荷验证是指所有指标在其对应的构念上的载荷都应高于在其他构念上的载荷。Fornell-Larcker 准则则要求每个构念的 AVE 平方根应大于该构念与其他构念的相关系数。
交叉载荷验证通过表 11 汇报,每一列中加粗的部分(也就是红框的部分)数值大于未加粗部分的数值即可。AVE 平方根和相关矩阵在表 10 中也已经给出。
共线性诊断
多重共线性是结构方程模型中需要注意的问题,它发生在预测变量之间存在高度相关性时。严重的多重共线性可能导致回归系数估计不稳定,增加标准误,从而影响统计推断的可靠性。本研究使用方差膨胀因子(VIF)来评估多重共线性的程度,一般而言,VIF 值小于 5 被认为是可接受的。
结构模型的结果
如前所述,PLS 分析的主要重点是方差解释以及确定所有路径估计的显著性。具体而言,通过内生变量(因变量)的 R² 值评估结构模型的预测能力。需要注意 PLS 不可以直接计算显著性,它是一个非参数估计方法。在 Smartpls 中,通常是使用 Bootstraping 方法来估计路径系数的置信区间及其显著性。
路径系数和显著性分析
这里我参考了文献中的汇报方法,将路径系数、显著性(p-Value)、R² 以及不同自变量与因变量之间的关系性质全部汇总到模型中一并给出,如下图所示:
此外,我还计算了自变量与因变量之间的中介效应大小,中介效应的强度可以通过计算间接效应与总体效应的比率来评估,这个比率被称为 Variance Accounted For(VAF)。对 VAF 的汇报如下表所示:
决定系数(R²)分析
决定系数(R²)是结构方程模型中一个重要的评估指标,它表示模型中内生变量被其前因变量解释的方差比例。R² 值越高,表示模型的解释力越强,根据 Chin 的标准,0.19、0.33 和 0.67 分别代表弱、中等和强的解释力。R² 已经在前图中给出。
效应量(f²)分析
效应量(f²)衡量了外生潜变量对内生潜变量的相对影响强度。根据 Cohen 的建议,f² 值的判断标准为:0.02 代表小效应,0.15 代表中等效应,0.35 代表大效应。通过下表汇报效应量:
