R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化-CFANZ编程社区

潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法，用于描述生命过程中的暴露，它将异质人群简化为同质模式或类别。然而，对于给定的数据集，可以根据类的数量、模型结构和轨迹属性得出不同模型的分数。

本文说明了LCTM的基本用法，用于汇总拟合的潜在类轨迹模型对象的输出。要安装 R 包，请在 R 控制台中使用命令

例子

目的：通过将 BMI 建模为年龄函数，识别具有不同轨迹的参与者亚组。根据迄今为止可用的文献，我们假设初始 K=5 类 BMI 轨迹。

我们使用体重指数 (BMI) 重复测量 10,000 个人的长格式数据框。

提供了一个示例（模拟）数据集 bmi 来描述整个步骤， bmi_long 是长格式版本。

包含的变量有：

id - 个人 ID
年龄 - BMI 测量的年龄，以年为单位
bmi - 个人在 T1、T2、T3 和 T4 时间的体重指数，以 kg/m^2 为单位 true_class - 用于识别模拟个人 BMI 数据的类别的标签从

加载数据

绘制数据

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言

潜在类轨迹建模的八步示例

为了对纵向结果 yijk 进行建模，对于 k=1:K，类，对于个体 i，在时间点 j，tj可以使用许多建模选择。我们在这里给出方程来说明这些，并按照复杂度增加的顺序将它们命名为模型 A 到 G。

模型 A：无随机效应模型 | 固定效应同方差 | - 解释个人轨迹与其平均类轨迹的任何偏差仅是由于随机误差

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_02

其中假设所有类的残差方差相等，

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_03

模型 B：具有特定类别残差的固定效应模型 | 异方差 | 与模型 A 相同的解释，随机误差在不同的类别中可能更大或更小。

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_04

其中假设残差方差不同

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言_05

模型 C：随机截距解释是允许个体的初始体重不同，但假设每个班级成员遵循平均轨迹的相同形状和大小

对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj,

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_06

其中随机效应分布

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_07

模型 D：随机斜率允许个体在初始权重和平均轨迹的斜率上有所不同，但曲率与轨迹

对于 k=1:K，类，对于个体 i，在时间点 j , tj,

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_08

其中假设随机效应分布为

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言_09

模型 E：随机二次 - 跨类的共同方差结构允许个体在类内通过初始权重、形状和大小变化的额外自由，但是假设每个类具有相同的变异量 R lcmm hlme/lcmm 对于 k=1： K, 类, 对于个体 i, 在时间点 j, tj,

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_10

其中假设随机效应分布为

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_11

模型 F 和 G：随机二次 - 允许方差结构跨类变化的比例约束增加模型 E 的灵活性，因为允许方差结构相差一个乘法因子，以允许某些类具有更大或更小的类内方差。该模型可以被认为是模型 G 的更简洁版本（将要估计的方差-协方差参数的数量从 6xK 参数减少到 6+（K-1）个参数。

对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj,

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_12

其中假设随机效应分布为

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言_13

第一步：选择随机效应结构的形式

为了确定随机效应的初始工作模型结构，可以遵循 Verbeke 和 Molenbergh 的基本原理来检查没有随机效应的模型中每个 K 类的标准化残差图的形状。

如果残差轮廓可以近似为平坦、直线或曲线，则分别考虑随机截距、斜率或二次项。

为了拟合没有随机效应的潜在类模型。

hlmfixed(bmig)

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_14

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_15

然后，我们将拟合模型输入 LCTM中的 step1 函数，以检查特定类别的残差。

第2步

优化步骤 1 中的初步工作模型以确定最佳类数，测试 K=1,...7。可以根据最低贝叶斯信息标准 (BIC) 来选择所选类别的数量。

1.  set.seed(100)
2.   
3.   
4.  for (i in 2:4) {
5.    mi <- lchlme( data.frame(bmg[1:500,])
6.   
7.  }
8.  #> Be patient, hlme is running ... 
9.  #> The program took 0.29 seconds 
10.  #> Be patient, hlme is running ... 
11.  #> The program took 0.69 seconds 
12.  #> Be patient, hlme is running ... 
13.  #> The program took 2.3 seconds
14.   
15.  modelut <-kable(lin)

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言_16

第 3 步

使用步骤 2 中推导出的偏好 K 进一步细化模型，测试最优模型结构。我们测试了七个模型，从简单的固定效应模型（模型 A）到允许残差在类别之间变化的基本方法（模型 B）到一组具有不同方差结构的五个随机效应模型（模型 CG）。

A（SAS、PROC TRAJ）

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_数据_17

B型（R，mmlcr）

调用 source() 命令。

mmldata = bmi_l01
# )

# model_b$BIC

C （SAS、PROC TRAJ）

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_r语言_18

D 型（SAS、PROC TRAJ）

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_19

E型 (R, lcmm)

1.  model_e <- hlme(fixed = bmi ~1+ age + I(age^2),
2.             mixture = ~1 + age + I(age^2),
3.              random = ~1 + age,
4.              ng = 5, nwg = F, 
5.              idiag = FALSE, 
6.              data = data.frame(bmi_long[1:200,]),
7.             subject = "id")
8.  #> Be patient, hlme is running ... 
9.  #> The program took 0.77 seconds
model_e$BIC

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化_方差_20