一项针对英格兰 606,434 人的社区研究中持续存在的 COVID-19 症状

栏目：人物资讯时间：2023-07-31

　　本文有些词语翻译可能不对，有资源的小伙伴还是建议自己看原文。https://www.nature.com/articles/s41467-022-29521-z#Sec2

　　长期 COVID 仍然是一种广义定义的综合征，其患病率和持续时间的估计差异很大。我们使用 REACT-2 研究第 3-5 轮的数据（n=?508,707；2020 年 9 月至 2021 年 2 月），一项针对英格兰成年人的代表性社区调查，以及第 6 轮的复制数据（n=?97,717；2021 年 5 月）估计患病率并确定持续 12 周或更长时间的持续症状的预测因素；和无监督学习根据报告的症状对个体进行聚类。在第 3-5 轮的 12 周时，37.7% 的人至少经历过一种症状，在第 6 轮中下降到 21.6%。女性、年龄增长、肥胖、吸烟、吸电子烟、因 COVID-19 住院、生活匮乏和成为医护人员与第 3-5 轮持续症状的概率较高相关，而亚洲种族的概率较低。聚类分析确定了一个主要具有呼吸道症状的参与者子集。管理 COVID-19 的长期后遗症仍将是受影响的个人及其家人以及卫生服务的主要挑战。

　　英国经历了欧洲最大的 COVID-19 流行病之一。作为一种新疾病，除了直接疾病之外的自然病程和可能的长期后遗症在很大程度上仍然未知。除了因 COVID-19 住院和死亡的急性风险外，一些出现症状的人患有长期且使人衰弱的疾病，可能会持续数周或数月1 , 2 , 3 , 4 , 5。这被称为后 COVID 综合症6或 Long COVID，该术语最初是由人们在社交媒体上分享他们持续症状的经历并建立支持小组7创造的。

　　人们对 COVID-19 持续症状的频率、性质和持续时间知之甚少，如果要制定有效的治疗和管理策略，这代表了一个主要的知识缺口。报告的症状包括严重疲劳、呼吸困难、胸痛或沉重、发烧、心悸、认知障碍（“脑雾”）、嗅觉丧失（嗅觉缺失）、味觉丧失（味觉丧失）、皮疹和关节痛或肿胀1 , 2 , 3 , 4 , 5。症状流行率和持续性的估计差异很大，可以说是由于异质性研究设计和综合征定义8、9、10、11. 有人提出，长期COVID描述了一组不同的病症，包括病毒后综合症、长期组织或器官损伤以及持续的炎症3、9、12、13。

　　Long COVID 的发生似乎与 COVID-19 的严重程度有关；例如，据报道，在因 COVID-19 住院的患者中，持续性症状的发生率很高14 , 15 , 16。除了年龄较大和女性8之外，急性症状的数量也与长期 COVID 的风险有关。

　　虽然迄今为止许多 Long COVID 研究都集中在住院的 COVID-19 病例14 , 15 , 16 , 17 , 18 , 19，但我们在这里报告来自英格兰随机社区人口样本的数据。这些涉及超过 600,000 人，他们在 2020 年 9 月至 2021 年 5 月期间参加了社区传播实时评估 2 (REACT-2) 研究的第三轮至第五轮（主要分析）和第六轮（复制）。参与者中在疑似或确诊 COVID-19 后报告持续 12 周或更长时间的症状，我们会估计症状流行率、调查症状的共现情况并评估症状持续存在的风险因素。

　　图 1显示了研究设计和人群。共有 508,707 人参加了 REACT-2 第 3-5 轮，97,727 人参加了 REACT-2 第 6 轮（不包括在 55 岁及以上招募的额外人员的“加强”样本），回复率为 29.4% 和分别为 29.9%。与反应者相比，无反应者更有可能是男性、更年轻（18-24 岁）或更年长（>75 岁）的成年人，并且生活在更贫困的地区（补充表 1）。图 1：研究人口流程图。

　　共有 92,116 名受访者在第 3-5 轮报告了之前的 COVID-19，在第 6 轮报告了 14,562 名受访者，加权患病率分别为 19.2% (19.1,19.3) 和 17.9% (17.7,18.0)。

　　表 1显示了 COVID-19 患者在症状出现 12 周后仍报告 29 种症状中的一种或多种，??或三种或多种症状的比例。在第 12 周时，第 3-5 轮中 37.7% (37.4,38.1) 的人报告了一种或多种症状，17.5% (17.2,17.7) 报告了三种或更多症状；在第 6 轮中，这些数字分别为 21.6%（20.9、22.3）和 11.9%（11.4、12.5）。对于第 3-5 轮，这些转化为加权人口患病率为 5.80% (5.73,5.86) 有或曾经有一种或多种持续症状 12 周或更长时间，以及 2.23% (2.19,2.27) 三种或更长时间更持久的症状。在第 6 轮中，与第 3-5 轮相同的 27 种症状的等效百分比分别为 3.06% (2.98,3.14) 和 1.61 (1.56,1.67)（补充表 5 ）)，如果包括第 6 轮调查的所有 35 种症状，则一种和三种症状分别增加到 3.26% (3.18,3.34) 和 1.86% (1.80,1.92)（补充表 6）。表 1 (i) 第 3-5 轮和 (ii) 第 6 轮中在初始症状出现 12 周后仍报告一种或多种（或三种或多种）症状的受访者比例。

　　图 2显示了自症状出现以来随着时间的推移出现一种或多种症状的人群比例。症状报告在第 4 周迅速下降，在第 12 周进一步下降较小，但随后男性和女性的进一步下降限制在 22 周左右，女性在每个时间点的症状流行率较高.图表显示在任何时间报告症状的人中症状持续存在的比例，在我们有 150 天观察时间的n ?= 71,642 名受访者中。女性的持续症状发生率更高；在 12 周后观察到两种性别的症状流行率下降较慢。垂直虚线分别显示症状发作后 4 周和 12 周。

　　在第 3-5 轮中，最普遍的持续症状是疲倦，占 16.8% (16.5,17.1)，而在第 6 轮中报告疲倦的比例要低得多，为 8.0% (7.5,8.6)（图 3，补充表 2）。对于所有四轮共有的其他 26 种症状中的 16 种，观察到从第 3-5 轮到第 6 轮的患病率下降较小，而观察到四种症状的患病率增加（图 3）。

　　在 REACT-2 的第 3-6 轮中调查的 37 种症状的患病率。顶部面板显示了所有轮次中调查的症状（n ?= 606,434 次观察）；中间面板显示仅在第 3-5 轮中调查的症状（n ?= 508,707 次观察）；底部面板显示仅在第 6 轮中调查的症状（n ?= 97,727 次观察）。右图比较了主要研究队列（REACT-2 第 3-5 轮，2020 年 10 月至 2021 年 2 月期间调查）与复制队列（REACT-2 第 6 轮，2021 年 5 月调查）中的症状患病率。星号表示在第 6 轮调查中分组的症状。右侧面板中的绿色条表示与第 3-5 轮相比，第 6 轮的症状流行率有所降低。误差线表示流行率的 95% 二项式置信区间。

　　补充表3-8显示了按社会人口学和生活方式因素划分的患病率。为了测试这些因素对持续症状风险的独立影响，我们进行了年龄和性别相互调整的逻辑回归以及变量选择的多变量分析。在第 3-5 轮中，一种或多种症状持续 12 周或更长时间与女性、年龄增长、超重或肥胖、吸烟、吸电子烟、因 COVID-19 住院、贫困、低家庭收入和医疗保健有关或护理家庭工作人员，比值比从女性的 1.38 (1.32,1.45) 到因 COVID-19 住院的比值比 3.45 (2.57,4.64)（图 4，补充表 9 ）). 与白人相比，亚裔与持续性症状的风险较低相关 (OR: 0.84 [0.74,0.96])。在用于变量选择和排序的多变量分析中，持续症状的最强预测因子依次为年龄、性别、体重指数 (BMI)、家庭收入、医疗保健/护理家庭工作者、剥夺、吸烟状况、既往因 COVID- 19 和 vaping 状态。

　　a以 12 周时的一种或多种症状 (y/n) 作为二元结果变量的 Logistic 回归模型，均针对年龄-性别进行调整并相互调整*；b平均每个变量对多变量提升树模型的曲线下面积 (AUC) 的贡献，通过依次排列每个变量（1000 倍以获得分布）并量化模型性能的变化得出；c将 12 周时持续症状的概率建模为年龄和性别的函数，使用广义加法模型对年龄和年龄与性别之间的相互作用进行样条。所有模型都适合n?= 71,642 名受访者，我们对其进行了 150 天的观察。在多变量模型中，年龄、性别、肥胖家庭收入、医疗保健/家庭护理人员、剥夺、当前吸烟状况和既往因 COVID-19 住院是持续症状的最强预测因素，而亚裔与较低的持续症状风险相关12周。面板b中的箱形图显示中位数、第一和第三四分位数；胡须表示 1.5 × 四分位数间距；超出此范围的数据绘制为点。注：由于部分变量数据缺失，a图相互调整模型的总n为55730。

　　在将症状持续 12 周或更长时间的可能性建模为性别和年龄的平滑函数的广义相加模型 (GAM) 中，持续症状的风险在男性和女性中随年龄线性增加，每十年增加 3.5 个百分点的风险生活。在所有年龄段，女性的风险比男性高约 8 个百分点（图 4，补充图 1）。

　　复制数据集（REACT-2 第 6 轮，从 2021 年 5 月开始）中的逻辑建模和变量选择结果相似（补充图 2），除了吸烟、吸电子烟和剥夺与多个患者的持续症状无关逻辑回归，在多变量变量选择分析中，未选择医疗保健/护理家庭工作人员身份、家庭总收入和剥夺，而选择了亚裔。然而，考虑到与第 3-5 轮相比，第 6 轮的样本量较小，这些分析的统计功效较低。

　　在第 3-5 轮的 20,240 名参与者的聚类分析中，他们在初始症状出现 12 周后仍有症状，根据 12 周时的症状概况确定了两个稳定的参与者集群（图 5，补充图 3）。在 bootstrap 稳定性分析中，集群在 100% 的稳定性 bootstrap 中恢复。Cluster L1 ( n ?= 15,799) 中持续疲倦的患病率很高，并伴有肌肉酸痛、睡眠困难和呼吸急促（补充图4）。Cluster L2 ( n = 4441) 呼吸系统症状的患病率很高，包括呼吸急促和胸闷，?以及胸痛（图 5、6），补充图 4）。集群中心点——每个集群中心的代表性观察结果——是一名参与者在 12 周时仅感到疲倦（集群 L1）和一名参与者在 12 周时呼吸急促和胸闷（集群 L2）（图 5，补充）图 5）。呼吸群（L2 群）中报告在 COVID-19 患病时有严重症状的人比例更高，为 43.5% (42.0,44.9)，高于 L1 群中的 27.4% (26.7,28.1)。集群 L2 (2.9% [2.5–3.5]) 的住院率几乎是集群 L1 (1.1% [0.9,1.3]) 的三倍（图 5，补充表 10）。

　　使用 CLARA（围绕中心点划分）算法进行聚类。在 12 周时确定了两个稳定的簇。集群 L1（“疲劳集群”）的疲劳患病率很高。Cluster L2（“呼吸群”）是 4,441 名参与者中较小的一个子集，他们呼吸急促、胸闷和胸痛的患病率很高。图a显示了集群的症状流行率。图b显示了按集群划分的症状计数分布（集群 L1 的中位数为 2 个症状 [n?= 15,799]，集群 L2 的中位数为 3 个症状 [n=?4441]）。面板b中的箱形图显示中位数、第一和第三四分位数；胡须表示 1.5* 四分位数间距；超出此范围的数据绘制为点。控制板c显示集群的自我报告症状严重程度和寻求的医疗（与那些在 12 周时不再有症状的人进行比较）。

　　图 6：按症状群划分的个别症状的持续性。所有有症状参与者（上图）和 12 周症状群 L1 和 L2（下图）的症状持续存在。虚线分别显示症状发作后 4 周和 12 周。

　　在第 6 轮的复制数据中，聚类分析再次确定了一部分受访者（Cluster R6 L_2；n ?= 1582）呼吸急促的发生率很高，同时伴有胸闷/胸痛，但疲劳的发生率也很高，而另一个集群（集群R6 L_1；n ?= 1263）的嗅觉和味觉丧失率很高（补充图 6）。

　　在敏感性分析（第 3-5 轮）中，我们评估了 (i) 使用与自我报告的 PCR 阳性相关的一组减少的 15 种症状的影响（补充图 7），以及 (ii) 将研究人群限制为那些自我报告过 COVID-19 并在横向流动免疫测定 (LFIA) 中检测呈阳性的人。使用 15 个而不是 29 个症状将 12 周时持续性症状的流行率仅降低了 4 个百分点至 32.9% (32.6,33.2)，并确定了相同的一组风险因素（补充图 8），而在 LFIA 阳性亚组中12周时持续症状的患病率增加了 42.4% (41.6,43.2)（补充表3、4、11）。

　　在第 3-5 轮数据的聚类敏感性分析中，额外的聚类方法（使用 Dice 距离和 Jaccard 距离的 PAM）分别确定了 5 个和 6 个聚类。在每种情况下，都确定了两个主要具有呼吸道症状的集群，其中包含主要分析中“呼吸”集群 L2 的几乎所有观察结果（补充图 9）。在所有方法和可能的簇数中，当使用具有汉明距离的两个簇时，轮廓宽度最大化（在主要分析中呈现）。

　　潜在类别分析确定了一个以呼吸系统症状和较高的总体症状患病率为特征的较小类别，以及一个主要以疲倦为特征的较大类别（补充图 10）。

　　我们使用 REACT-1 数据来估计 PCR 阴性成人中症状报告的背景水平（方法）。在 REACT-1 第 2-14 轮（2020 年 6 月至 2021 年 9 月）期间的 1,879,842 名 PCR 阴性成年人中，26 种症状中任何一种持续 11 天或更长时间的平均加权患病率为 3.06% (3.04,3.09)（补充图 11）。我们还使用 REACT-1 数据来调查按年龄划分的潜在差异回忆偏差。报告在感染时出现任何症状的 PCR 阳性个体的比例在较大年龄组中较低，这与 REACT-2 的发现一致（补充表 12）。

　　在这项针对英格兰 18 岁及以上成年人 COVID-19 后症状的大型社区研究中，参与者报告持续 12 周或更长时间的持续症状的高患病率。估计范围从 5.8% 的成年人在 COVID-19 后经历或曾经经历过一种或多种持续性症状（相当于英格兰超过 200 万成年人），到 2.2% 的人经历或已经经历过一种或多种持续性症状（相当于英格兰超过 200 万成年人）英格兰成年人）在第 3-5 轮中，在第 6 轮中，一种和三种持续症状分别为 3.1% 和 1.6%。我们对具有持续 COVID-19 症状的人群比例的估计高于其他一些研究，尽管之前的估计差异很大。在低端，一项研究发现 2.3% 的 COVID-19 患者在 12 周时仍报告有症状8；其他研究报告称，13.7% 的人在 84 天时出现症状9，14.8% 的人在 90 天时出现症状10，27% 在 60 天时出现症状20，35% 在 2 个月时出现症状21，34.7% 在 7 个月时出现症状6，46% 在 6 个月时出现症状11 , 并且在 6 个月时高达 51–52% 16 , 22. 我们的估计是，2020-2021 年秋冬季节，37.7% 的 COVID-19 患者在 12 周内出现一种或多种症状，2021 年春季为 21.6%，这可能部分反映了我们调查的大量症状，其中许多是常见且不特定于 COVID-19。然而，在超过 180 万 PCR 阴性 REACT-1 受访者中，持续症状持续 11 天以上的估计背景患病率约为 3%，这为 12 周时非 COVID-19 相关持续症状患病率提供了上限或者更多。因此，我们对 COVID-19 相关持续性症状患病率的估计大约是背景患病率的十倍。这与英国国家统计局 (ONS) 在 2021 年 4 月至 2021 年 8 月期间对 26,922 名英国居民进行的一项研究一致，该研究估计 12 种症状中任何一种的流行率为 3。23 . 因此，我们对 COVID-19 相关持续性症状患病率的估计大约是背景患病率的十倍。

　　第 3-5 轮和第 6 轮之间持续性症状的总体减少是由于持续性疲倦减少了一半以上，从 16.8% 下降到 8.0%。有几种可能的解释。第 6 轮报告的大多数 (60%) 感染发生在 2020 年 7 月之前，因此患病率下降可能反映出一部分人已经从疾病中康复但没有报告（回忆偏差）。季节性可能影响症状流行，尽管背景症状流行在整个研究期间基本一致。研究发现封锁措施与疲劳程度24和压力水平升高25 , 26之间存在关联虽然第 3-5 轮主要是在英国受到限制或封锁措施时进行的，但第 6 轮是在从重新开放的“第二步”（学校、零售和户外招待业开放）过渡到“第三步”期间进行的，当“六人规则”实施后，室内场馆被允许重新开放27。最后，调查的结构在第 6 轮发生了变化，调查的症状列表也进行了修改。在我们对第 6 轮的分析中，我们重点关注与第 3-5 轮共有的 27 个（共 29 个）症状，与前几轮相比，这些症状在第 6 轮中的报告流行率可能略有低估。

　　年龄增长、女性、BMI、住院和合并症先前已被确定为长期COVID 8、28、29的风险因素。我们发现年龄与 COVID-19 后持续症状之间存在线性关联，这与其他一些研究表明患病率最高的是中年人群9形成鲜明对比。这种差异可能反映了这样一个事实，即社区中年龄较大的人群感染率低于年轻人30并且更有可能无症状31 , 32; 一旦通过对 COVID-19 后的症状进行调节来纠正这些因素，那么老年人持续性症状明显较低的患病率就不再存在。我们在第 3-5 轮 12 周时确定了两个稳定的症??状群，并在使用不同聚类方法的敏感性分析中确定了相似的模式，这表明 Long COVID 可能有不同的亚组，包括一个（Cluster L2），其特征是呼吸和胸闷/胸痛。在第 6 轮复制数据中，这些和其他相关症状在 Cluster L2 R6中也很普遍。以前的研究采用了类似的无监督方法来表征 Long COVID 的亚型，尽管是在较早的时间点：Sudre 等人。8在症状出现后 28 天确定了两个症状群，尽管这些与我们的群不同。黄等。20在 61 天时确定了五个集群，其中两个集群 L2（和集群 L2 R6）中的呼吸道症状患病率很高。

　　这项研究包括来自具有高响应率（26-29%，跨 3-5）的大型随机社区样本的数据，并使用加权来提供人口流行率估计，从而提供有关社区中持续存在的 COVID-19 症状的更具代表性的信息. 这与其他基于特定患者群体的研究形成对比，尤其是那些基于住院病例的研究5。我们询问是否存在症状而不是 Long COVID，以减少潜在的报告偏差。但是，很明显可能涉及 COVID-19 后的广泛症状和临床表现；例如，我们的开放式自由文本问题确定了一些未包含在我们问卷中的症状，包括“脑雾”、“心悸”和“脱发”，这些症状随后被包含在第 6 轮中33 . 由于该研究基于自我报告的数据，并且许多症状很常见，并非 COVID-19 特有，因此我们将我们的估计值与在 REACT-1 研究中检测呈阴性的普通人群中获得的估计值进行了比较。

　　局限性包括回顾性研究设计，它引入了回忆偏倚的可能性。然而，在之前的分析中，我们已经表明，参与者报告其症状发作日期会产生一条非常接近流行病的流行病曲线31 , 34 , 35。此外，我们对 REACT-1 数据的分析支持老年组无症状感染比例增加的发现，并表明这不是老年参与者对症状的差异回忆的假象。受访者仅限于报告（初始）症状发作的单一日期，这不允许延迟出现某些症状，也不允许报告似乎是 Long COVID 8特征的复发症状. 受访者也仅限于报告整体疾病的严重程度，而不是特定症状的严重程度，并且当他们的症状更严重时也没有被要求报告。尽管响应率很高，但另一个限制是参与偏倚的可能性，因为 REACT-2 研究包括自我管理的 LFIA 31；有持续症状的人可能更有可能参与以确定他们的抗体状态，这似乎是合理的。

　　我们已经确定有相当一部分人在 COVID-19 后出现持续 12 周或更长时间的持续症状。在症状流行率最初下降 4 到 12 周后，持续症状的流行率趋于稳定，这表明大量人可能有慢性症状，需要调查和干预，包括康复。我们在此表明??，经济上处于不利地位的人和贫困地区的人在 COVID-19 后似乎有更高的持续症状负担，加剧了这些群体因 COVID-19 所经历的严重疾病和死亡率的额外负担36、37。我们根据参与者的症状确定了两组参与者，其中一组以呼吸急促和胸闷/胸痛为主。需要进一步的研究来调查潜在的病理生理学。临床医生和其他医疗保健专业人员可能会受益于有关症状范围的教育，以最好地支持患者康复。总之，本研究确定的 COVID-19 后发病率规模对受影响的个人及其家庭提出了重大挑战，并表明潜在的人口健康负担很高。管理 COVID-19 的长期后遗症仍将是受影响的个人及其家人以及卫生服务的主要挑战。

　　REACT-2 计划评估了英格兰 SARS-CoV-2 抗刺突蛋白抗体阳性的社区流行率。英格兰成年人的随机人口样本被邀请每 2-4 个月使用国家卫生服务 (NHS) 患者名单参加一次，以在 315 个下级地方当局 (LTLA) 地区中的每个地区获得相似数量的参与者38. 参与者通过在线门户网站或电话注册。那些注册的人通过邮寄方式收到了一个测试套件，其中包括一个带有说明和在线视频链接的自我管理的即时 LFIA 测试。参与者在完成自测后完成了一项调查（在线/电话）。参与者提供了有关人口统计数据、家庭构成、合并症以及他们是否认为自己患有 COVID-19 的信息。那些报告患有 COVID-19 的人被问及他们是否进行过 PCR 检测、与 COVID-19 相关的症状、首次症状出现的日期、症状的严重程度以及 29 种症状中任何一种症状的持续时间39. 此外，我们要求参与者以自由文本的形式报告任何其他症状。在 2020 年 9 月 15 日至 28 日（第 3 轮）、2020 年 10 月 27 日至 11 月 10 日（第 4 轮）进行的 REACT-2 研究的第 3-5 轮中，向 560,000 至 600,000 名 18 岁以上的个人发送了个性化邀请) 和 2021 年 1 月 25 日至 2 月 8 日（第 5 轮）。每轮约有 190,000 人报名后，报名截止。2021 年 5 月 12 日至 25 日进行的第 6 轮又发出了 384,988 份邀请，并在约 100,000 人报名后关闭了报名。第 6 轮还招募了 55 岁及以上人群的加强样本，但这些数据被排除在此处的分析之外，以便与第 3-5 轮进行比较。

　　我们的主要研究人群包括来自第 3-5 轮的 76,155 名参与者，他们在调查日期前 12 周或更长时间自我报告患有 COVID-19（疑似或 PCR 确诊）并具有 29 种症状中的一种或多种（补充图 1）。除了第 3-5 轮问卷中询问的 29 种症状外，还有 8370 名受访者对其他症状进行了自由描述。对共现词的自由文本分析显示了第 3-5 轮调查中没有的常见附加症状，包括脑雾、脱发、血压、心悸和严重关节痛（补充图. 3). 自由文本回复告知了第 6 轮调查的其他症状（所有 27 个症状中的 35 个症状——作为 23 个症状组——与第 3-5 轮中询问的症状相同）。

　　我们在一个独立数据集中重复了我们的主要分析，该数据集包含来自第 6 轮的 13,170 名参与者，他们在调查日期前 12 周或更长时间报告了 35 种症状的扩展列表中的一种或多种；这 35 种症状中有 27 种（作为 23 个症状组）与第 3-5 轮相同（见补充方法）。为了与第 3-5 轮的症状报告保持可比性，我们还将第 6 轮的一些分析限制在 27 种常见症状。

　　在敏感性分析中，我们使用了来自第 3-5 轮的 14,704 名参与者的子集，他们自我报告感染了 COVID-19，并在 REACT-2 LFIA 测试中抗体检测呈阳性。

　　为了估计症状的背景流行率，我们使用了来自 REACT-1 研究的数据，该研究通过与 REACT-2 相同的抽样框架招募的独立人群样本中的 PCR 测试跟踪社区感染。REACT-1 还包括 5-17 岁的儿童，他们被排除在当前的分析之外。REACT-1 寻找持续 11 天或更长时间的 26 种症状中任何一种的病史。REACT-1 数据以与 REACT-2 数据类似的方式加权，以给出代表整个英格兰成年人口的人口估计值（见下文）。

　　在第 3-5 轮（2020 年 9 月至 2021 年 2 月）中，我们获得了在初始症状出现后 12 周按性别、年龄和其他特征报告 29 种症状中的一种或多种症状的流行率估计值。我们的主要分析集中于报告持续 12 周（84 天）或更长时间的个体症状，排除了 260 名数据不一致或缺失的参与者（见图 1）。我们还获得了第 6 轮（2021 年 5 月）的患病率估计值。

　　流行率估计值按性别、年龄、种族、LTLA 人口和多重剥夺指数加权，以考虑抽样设计，每个 LTLA 的参与者人数大致相等，以及不同的反应率，以获得具有代表性的流行率估计值整个英格兰的人口。

　　我们使用逻辑回归（年龄-性别和相互调整）来调查人口统计和生活方式因素与症状持续 12 周或更长时间的关联，并使用梯度提升树模型40来调查预测能力（曲线下面积，AUC）的变化在 12 周或更长时间时将变量添加到持续性症状的模型中。在 REACT-2 第 6 轮数据中重复了该分析。补充方法中详细描述了建模方法。

　　为了确定一组更具体的与 COVID-19 病史相关的持续性症状，在敏感性分析中，我们在第 3-5 轮中对 30% 的有症状参与者子集进行了变量选择：在单变量模型中，我们确定了一个持续性子集与先前报告的阳性 PCR 检测呈正相关的症状（12 周或更长时间），并估计这些症状中的一种或多种持续存在的人群流行率。我们还使用此症状子集作为结果变量重复逻辑和梯度提升树建模。

　　广义加性模型 (GAM) 的构建具有 12 周或更长时间症状持续存在的可能性，建模为年龄和性别的平滑函数。使用默认的薄板样条曲线并绘制平滑函数以可视化持续症状风险与年龄之间的关系。

　　我们使用自由文本分析的结果来识别单个和同时出现的词，以指示参与者记录的其他症状，并将这些症状绘制在网络中。

　　为了识别第 3-5 轮中对参与者进行细分的症状群，为每个参与者构建了一个二元矩阵，用于确定症状出现后 12 周时 29 种被调查症状中每一种的存在或不存在（1 或 0）。聚类是使用 Partitioning Around Medoids (PAM) 算法的 CLustering LARge Applications (CLARA) 扩展执行的，在 R 包 fpc 41中实现. 简而言之，PAM 通过最小化数据点与其分配的质心之间的差异之和来搜索最具代表性的数据点以成为聚类质心。CLARA 使用抽样方法来减少大型数据集的计算负担。我们使用汉明距离作为参与者之间差异的度量。在第 3-5 轮中，我们使用平均轮廓宽度确定了最佳簇数。我们使用两种方法来评估集群稳定性。首先，我们自举和重新聚类 100 次，然后使用 Jaccard 系数量化自举和非自举聚类之间的差异，范围从 0（无重叠）到 1（完全重叠）42. 其次，我们依次移除每个症状，重新聚类，然后计算这些和整个数据集聚类之间的平均非重叠比例 (APN)，作为个体变量重要性和对人口细分43的贡献的代理。

　　为了可视化集群中的症状模式，我们创建了热图，分别显示集群中 12 周时的成对症状共现。

　　作为敏感性分析，我们还使用 Jaccard 和 Dice 距离44（与汉明距离不同，不考虑负共现）运行 PAM 聚类，并且进一步进行潜在类分析 (LCA) 作为一种完全不同的方法来识别结构症状数据。使用 R 45中的 poLCA 包应用 LCA 。

　　REACT2 研究的所有数据收集都是使用 Questback（2020 年春季安装）46捕获的。分析是在 R 版本 4.0.5 47中进行的。我们获得了南伯克希尔 B 研究伦理委员会（IRAS ID：283787）的研究伦理批准。REACT 公共咨询小组定期审查研究过程和结果。研究参与者提供了知情同意书。

上一篇：原创“南郊北谷，天涯四美”，这六位绝色美人，到底有多帅啊！
下一篇：原创43岁章子怡带娃种菜！露白皙长腿皮肤娇美，素颜出镜少女感十足

一项针对英格兰 606,434 人的社区研究中持续存在的 COVID-19 症状

最近更新人物资讯