福昕翻译

>

翻译学堂

>

基于11个基因特征预后指数,可预测结直肠癌的系统性复发

基于11个基因特征预后指数,可预测结直肠癌的系统性复发


  善奎金,#12 善,扬金,#3 赞郁金,24 善阂卢武铉,24 叶金哈,24 Lyul李,24 Haejeong许,1 Dong-亨卓,25 SEOG李,6 雍酥嗯金,23和 金千金24

  

摘要:

  大约一半的结直肠癌(CRC)患者经历疾病复发和转移,这些个体由于其临床和生物学多样性而常常对治疗无反应。在这里,我们旨在确定由一个小的基因组组成的预后标志,以精确地预测CRC异质性。我们使用从130名CRC患者的主要组织样本中产生的RNA-seq数据进行了转录组分析。开发了基于复发相关基因的预后指数(PI),并在两个较大的独立CRC患者队列中进行了验证(n = 795)。使用Kaplan-Meier图,对数秩检验,Cox回归分析和RT-PCR分析评估了PI与CRC患者的预后之间的关联。在130例CRC患者中进行转录组分析,发现了两种与系统性复发相关的不同亚型。途径富集和RT-PCR分析显示PI系统中包含11个基因标记,这是CRC的重要预后指标。多变量和子集分析表明,PI是一个独立的危险因素(HR = 1.812,95%CI = 1.342–2.448,P <0.001)具有预测价值,可识别对辅助化疗反应最差的低危II期患者。最后,与先前报道的共识分子亚组(CMS)进行的比较分析表明,根据PI分类的高危患者发现,与CMS4相似的独特分子特性与不良预后相关。这种基于11个基因特征的新型PI预测因子可能代表了一种替代诊断工具,可用于识别高危CRC患者并预测应答最差的患者进行辅助化疗。

  关键词:癌症基因组学,预后标志物,结直肠癌

1. 介绍

  大肠癌(CRC)是全球第三大最常见的癌症,也是癌症死亡的第四大诱因1。尽管病理分期是预后和确定CRC 2辅助化疗治疗的金标准,但很少有研究可作为特定阶段复发的预测工具。手术完全切除后,大量的结直肠癌患者的复发,大约一半患者的III期疾病复发在5年内3,4。有关II期CRC辅助治疗的国际指南建议,从观察到采用单药或联合治疗的化疗方案,应视高风险特征的存在而定,包括低分化的组织学,淋巴血管浸润,神经周浸润, <12个淋巴结的恢复,肠梗阻,局部穿孔或切缘阳性5。已经进行了一些前瞻性研究来探讨辅助化疗在II期CRC中的作用,但辅助治疗的价值仍存在争议5。当前的国家综合癌症网络指南并未明确定义高危II期结肠癌,因为许多具有高危特征的患者没有复发,而有些患者被认为是中等风险6。

  但是,根据世界卫生组织(WHO:http : //www.who.int/cancer/en/)的报告,结肠癌是男女中最普遍的癌症类型之一,占50%的患者患有这种类型的癌症的人会在疾病过程中发生转移,主要是在肝,肺或两者之间。目前,转移性切除CRC的患者的分离的肝和/或肺转移仍是潜在固化的唯一选择6,7。但是,即使将切除术与现代辅助性全身治疗方案相结合,这种治疗也只能治愈20%的患者,并且由于肿瘤的进展和扩散而大多无效。因此,迫切需要对CRC的更好的分子理解,以便早期和准确的患者预后,从而使精确的药物得以治愈8。

  复发可分为局部和全身两种。局部复发定义为在吻合处,肠系膜或淋巴结或腹膜处发生的疾病9。在这里,我们研究了使用多个队列的CRC患者中与全身复发相关的公认遗传指标,这些指标占据了大多数复发,无论手术的治愈潜力如何。为了探索与CRC全身复发相关的所有可能基因,我们对转录组数据进行了全基因组调查,并试图区分具有与CRC复发相关的独特生物学特征的CRC亚组。通过实验分析,我们还验证了基因签名和CRC复发之间的强关联。

2. 材料和方法

2.1. 患者和组织样本

  我们分享了以前研究的组织样本中的RNA-seq数据,这些样本仅从130名CRC患者(作为训练集)的结肠或直肠原发部位获得,以寻找差异表达的基因及其功能,以了解其病理特征。淋巴管和神经周浸润10。在2008年至2015年之间,所有患者均在Asan医疗中心(韩国首尔市AMC)接受了治疗,其中分别有72例和58例无系统性复发和系统性复发的患者(补充表S1))。在II期疾病患者中,高危人群使用5-FU /亚叶酸钙进行治愈性手术后的术后辅助化疗,而年轻患者有时使用FOLFOX。否则,对于晚期III和IV期患者,建议单独或联合使用FOLFOX,FOLFIRI和生物制剂。如前所述11进行术后辅助化疗或术后放化疗。在这项研究中,系统性复发被认为是系统性疾病的CRC复发,并且在诊断时被认为是转移性CRC(即IV期)。

  在征得每个患者的同意后,所有的肿瘤样品均获得了组织样品捐赠并接受了检查。根据《赫尔辛基宣言》,该研究方案已获得阿山医学中心机构审查委员会(注册号2018-0087)的批准。

2.2. RNA提取,RNA序列实验和数据处理

  如先前所述进行RNA提取和RNA-seq实验12。智人的参考基因组序列数据是从美国国家生物技术信息中心(NCBI)基因组数据库(程序集ID:GRCh38)获得的。将Kallisto应用于组织样品,以对参照基因组的读数进行定位和定量(版本0.43.1)。为了估计基因表达水平,为每个样品计算了每百万转录本(TPM)映射的读取值。在R语言环境(版本3.2.5)中使用分位数归一化对TPM数据进行归一化。补充表S2中介绍了AMC队列中RNA-seq数据的测序范围。RNA-seq生成的数据集可在NCBI Gene Expression Omnibus公共数据库中获得,数据序列号为GSE50760和GSE107422。

2.3. CRC患者的公共数据集

  为了开发和验证预测CRC疾病复发的分类器,我们收集了两个大型的CRC患者公开数据集:基因表达数据来自法国国立国会抗癌组织(CIT)计划CIT队列(GSE39582,n  = 566)13,基因表达数据来自从皇家墨尔本医院,西部医院,澳大利亚彼得·麦卡勒姆癌症中心和H. Lee Moffitt癌症组织的组织中检索到的新鲜冷冻肿瘤标本美国中心(AUS队列,GSE14333,n  = 229)14。使用Affymetrix人类基因组U133 Plus 2.0平台生成了CIT和AUS队列的所有基因表达数据。这些患者队列的详细信息已在先前的文献12中进行了描述,所有患者队列(包括AMC队列)的基线特征在补充表S1中进行了说明。在这项研究中,无病生存期(定义为从手术到首次确诊复发的时间)被认为是主要终点。根据IV期患者的严重倾向(44.6%),在我们的训练队列中无法进行足够的生存分析。

2.4. 统计分析

  为了确定与CRC的系统性复发高度相关的基因列表,我们对AMC队列的转录组数据应用了点双序列相关性测试,并选择了与疾病复发具有显着相关系数的基因(| r |> 0.3和P  <0.001) 。使用由与复发相关的基因组成的基因表达数据矩阵,进行以中心相关系数作为相似性度量和完全连锁聚类方法的分层聚类分析。根据样本群,将CRC患者分为两个亚组,在这两个亚组之间,使用Fisher精确检验评估疾病复发频率的差异。使用Ingenuity Pathway Analysis工具进行了功能富集分析。

  为了开发用于与CRC每个患者的预后指数(PI),我们通过使用用于从CIT队列的基因的Cox回归系数一个先前开发的策略12,15,16。每个患者的PI计算为每个基因的分数,这是由通过其相应的系数(即,PI =Σ考克斯基因的系数的基因的表达水平乘以衍生的总和ģ我 ×基因的表达值ģ我)。然后,以风险评分的中位数截止为阈值,将患者分为两组(即复发的高风险或低风险)。从CIT队列获得的每个基因的系数直接应用于来自AUS队列的数据,以将患者分为高风险和低风险组。

  Kaplan–Meier方法用于计算复发时间,并使用对数秩统计来评估两组之间的生存差异。使用多变量Cox比例风险模型评估PI与已知临床病理因素之间的预后关联。应用了后退步骤程序来优化具有最多信息量的变量17的多元模型。为了估计亚组之间基因表达差异的重要性,对每个基因进行了两次样本t检验。R语言环境软件(3.5.1版)主要用于统计分析,其中生存分析是使用APPEX平台18进行的。

  为了比较PI显示的亚组与先前报道的共有分子亚型(CMS)19之间的比较分析,我们采用了CMS联盟提供的CMS分类器进行分层。在AMC和AUS队列中,CRC患者分为四种CMS亚型。在CIT队列的情况下,CMS分类数据可作为调查的补充材料,在本研究中用于比较分析19。

2.5. 实时逆转录聚合酶链反应(RT-PCR)分析

  为了确定基因与CRC全身复发之间的关联,根据RN Plus迷你试剂盒(QIAGEN#74136)从AMC队列中排除的CRC患者中分离出RNA(1μg)。将分离的RNA样品用Superscript II逆转录酶(Invitrogen,Carlsbad,CA)在42°C下反转录1 h,在85°C下反转录5 min,并使用定量RT-PCR和补充表中所述的引物组进行扩增S3。对于定量RT-PCR,使用2×SYBR Green Supermix(Bio-Rad,Hercules,CA)和CFX96TM光学模块(Bio-Rad Inc.,Foster City,CA)通过以下扩增方案分析100 ng cDNA:在95°C下进行3分钟,然后在95°C下进行40个循环20 s,在(56–60°C)下进行20 s退火,然后在72°C下进行20 s延伸。扩增编码β-肌动蛋白的基因作为对照。通过比较阈值循环(Ct)方法分析靶mRNA的相对定量。


3. 结果

3.1. 通过转录组谱分析鉴定CRC中两种不同的预后亚型

  我们首先使用AMC队列的数据评估了系统性复发与基因表达之间的相关性。当估计疾病复发与基因表达水平之间的相关系数时(点-二重相关检验,P  <0.001,| r |> 0.30),共鉴定出1160个与系统性复发相关的表达变化的基因特征。使用这些基因,我们进行了层次聚类分析,将CRC样本分为两个子类(聚类1和2;图2。图1a)。1a)。比较两个样本组之间的全身复发率,组1的复发率(69.09%,55中的38)显着高于组2的复发率(26.67%,75中的20)。CRC簇之间疾病复发的差异具有统计学意义(Fisher's精确检验,优势比为6.049,95%置信区间(CI)= 2.675–14.261,P  <0.001;图。1b)。探索了1160个基因的表达模式,我们发现了一个独特的基因子集,其在样品簇1中的表达比在簇2中的表达更高(图1中有152个基因用紫色虚线围住了)。图。1)。1个)。在这些基因中,许多与EIF2或CRC转移信号通路有关的基因都被显着富集(图2)。(图。1),1个),表明我们新发现的CRC亚型可能反映了预后不良CRC的独特分子特征。

  

图1.AMC队列中系统性复发相关基因的基因表达谱(n  = 130)。.png

  图1.AMC队列中系统性复发相关基因的基因表达谱(n  = 130)。

  a总共选择了1160个基因的表达模式与大肠癌(CRC)的疾病复发显着相关的基因进行聚类分析(点-二元相关性检验,P  <0.001,r  <-0.3或r  > 0.3)。通过分层聚类,将患者分为两个子类。b比较第1组和第2组的复发频率。使用Fisher精确检验获得P值和置信区间(CI)。


3.2. 两种预后性CRC亚型的分子特征

  为了探索在CRC复发期间活跃的生物学特征,对1160个与复发相关的基因进行了功能富集测试。当寻找显着相关的先前建立的途径时,毫不奇怪,与先前观察到的结果一致,参与EIF2和CRC转移信号通路的基因被显着富集(补充图S1)。(图。1)。1个)。与这些途径一起,许多重要的规范途径,如IL-6,AMPK,ERK / MAPK,IL-8,JAK / Stat,PDGF,mTOR和CDK5信号传导途径,在预后较差的情况下得到了显着激活。样本群1.相反,在群1中干扰素,PTEN,凋亡,p53和ATM信号通路被显着抑制,表明各种生物学过程可能密切影响CRC的侵袭性临床行为(补充图S1)。当汇总这些途径中包括的基因时,仅涉及1160个基因中的127个(补充表S4),而其余基因则不相关。我们在随后的下游分析中应用了这127个基因。

3.3. PI系统的开发及其验证

  为了生成CRC复发的最佳预测模型,我们评估了其他CRC队列中127个基因的预后价值。当将Cox比例风险模型应用于CIT队列中每个基因的表达以及CRC患者的无复发生存时,只有17种独特探针中的11个基因显示出与CRC复发的强烈预后相关性(Cox回归分析,P  <0.01;补充表S5)。使用11个基因中每个基因的Cox回归系数计算CIT队列中每个患者的PI。使用PI的中位数截止值,将CIT队列中的CRC患者分为高风险或低风险亚组(图2)。(图2a)。2a)。根据PI分类的高危患者的复发率显着高于低危亚组(对数秩检验,P  <0.001;图。图2b)。2b)。为了验证PI系统,将CIT队列得出的系数值直接应用于AUS队列的基因表达数据,其中将患者分为高风险和低风险组。在对数秩检验分析中,两个亚组之间的复发率显着不同(P  <0.001;图。图2c)。

  图2大肠癌(CRC)患者分层与预后指数(PI)。.png

  图2大肠癌(CRC)患者分层与预后指数(PI)。

  一个酒吧,阴谋基于CIT队列的11基因签名PI的。每个条形图表示单个患者的风险评分。b Kaplan–Meier曲线显示了由11个基于基因的PI分层的CIT队列中两个亚组的复发时间。c由源自CIT队列的PI分层后的AUS队列中两个亚组的Kaplan–Meier曲线。d比较随机生成的分类器和基于11个基因的PI。显示在随机分类器中使用对数秩检验获得的P值的置信区间(CI)图。每个点表示平均P-价值。上方和下方的条分别表示重要性的95%CI的上限值和下限值。从1000次重采样事件中获得了95%的CI。每个红点表示PI分类器的重要性级别。所有值均以-log10转换量表表示,显着性阈值为P  <0.05

  为了验证PI系统是否偶然显示出显着的预后价值,我们生成了11个基于基因的随机分类器,并将其与PI的预后意义进行了比较。使用用于开发PI的相同程序,我们使用1160个基因中的11个随机选择的基因创建了一个分类器(图。(图。1)1个),并证实其具有预后意义。我们将随机分类器的生成迭代了1000次。与PI系统和随机生成的分类器相比,CIT和AUS队列中PI的显着性水平在CI范围之外对于随机分类器而言具有显着性(图。(图2d),2d),表示该PI不是偶然生成的。

  为了进一步验证PI与CRC全身性复发之间的关联,我们还独立于AMC队列,将RT-PCR分析应用于其他CRC样本。在该分析中评估了纳入PI的11个基因中的四个(EIF4A2,ITGB1,RHOC和BID),它们在AMC队列中的复发和无复发亚组之间在表达上有统计学上的显着差异。比较11例有疾病复发的CRC患者和8例无复发的CRC患者的基因表达水平时,三个基因(即EIF4A2,ITGB1和RHOC)在复发亚组之间表现出显着差异,并且与AMC队列中的RNA-seq数据呈正相关(补充图S2a-c)。RT-PCR样品之间BID表达的差异无统计学意义,但基因表达的变化与AMC队列中的疾病复发事件呈正相关(补充图S2d)。总的来说,这些结果支持了参与PI的基因与CRC系统性复发之间的关联。


3.4. CRC复发的已知临床因素与基于11个基因的PI系统之间的关系评估

  分期是确定CRC患者预后的金标准20。为了调查PI的预后独立性,我们结合了CIT和AUS队列的临床数据,并根据AJCC分期系统进行了亚组分析。当将基于PI的分层应用于合并队列中的I–III期患者时,II和III期疾病的高危患者的复发率显着低于低危患者(P  =第二阶段为0.008,第三阶段为P  <0.001;3b,c)。尽管在第一阶段观察到了将高危CRC复发患者明确分类的趋势,但我们并未观察到亚组间疾病复发的任何统计学显着差异(P  = 0.117;图。图3a)。3a)。为了进一步估计PI的独立预后效用,我们还将Cox回归分析应用于PI和CRC中已知的临床病理危险因素。在单因素分析中,CRC复发的重要预后指标包括AJCC分期,肿瘤位置,化疗,CMS亚型和PI(表(表格1)。1个)。当进行多变量分析时,即使采用了变量选择程序(风险比(HR)= 1.812,95%CI = 1.342–2.448,P  <0.001;表P),PI仍然显示出疾病复发的统计学意义。表格1)。1个)。在验证队列中,DNA错配修复(MMR)数据仅在CIT队列中可用,其中我们将Cox回归分析进一步应用于PI和其他风险因素,包括MMR状态。在使用CIT队列的单变量和多变量分析中,PI强有力地显示出疾病复发的统计学意义(HR = 1.709,95%CI = 1.194–2.447,P  = 0.003;补充表S6),证明了PI系统的预后相关性作为CRC复发的独立风险预测因子。

  

图3在该队列中按AJCC分期与CIT和AUS队列相结合的患者的无病生存期(DFS)的Kaplan-Meier图(n  = 795)。.png

图3在该队列中按AJCC分期与CIT和AUS队列相结合的患者的无病生存期(DFS)的Kaplan-Meier图(n  = 795)。

a–c(a)I期,(b)II期和(c)III期患者基于预后指数(PI)的子集分析。PI预测因子在III期患者中具有预测性。通过对数秩检验获得P值。d–g根据PI预测因子预测两个亚组对化疗的反应。PI的II期患者的Kaplan-Meier图将(d)低风险和(e)高危亚组分类,而PI的III期患者将(f)低风险和(g)分类)说明了高风险的亚组。PI评分对(d)低危II期CRC患者辅助化疗具有显着的预测价值。根据患者是否接受化疗(CTX)绘制数据。P值通过对数秩检验获得

 1大肠癌无病生存的单因素和多因素Cox回归分析(结合CITAUS队列)

表1大肠癌无病生存的单因素和多因素Cox回归分析(结合CIT和AUS队列).png

HR危险比,CI置信区间,CMS共识分子亚型,PI预后指标

a使用后退步骤程序来优化具有最多信息量的变量的多变量模型

b2b中的预测结果,c用于分析

  

  因为联合队列中有辅助化疗数据,所以我们检查了PI是否可以预测将受益于辅助化疗的CRC患者。已于AJCC II期患者(执行的分析Ñ  = 353),对他们来说,辅助治疗是有争议5,和III期患者(Ñ  = 292),谁经历延长生存以下辅助化疗21,22。当根据PI将II期患者分为高危和低危亚组并独立评估疾病复发的差异时,接受辅助化疗的II期低危患者的临床反应明显差于那些未经治疗(P  = 0.015,图图3d),3D),而在高危II期患者亚组中未观察到相关性(P  = 0.161,图9)。图3e)。3e)。当将Cox回归模型应用于II期患者时,PI与辅助化疗的相互作用达到了统计学上的显着水平(P  <0.001,补充图S3a)。与Kaplan–Meier图和对数秩检验一致,低风险组中辅助化疗的估计HR为2.426(95%CI = 1.158–5.081;P  = 0.018),保留了显着的预测价值,而HR高危组的风险为1.571(95%CI = 0.832–2.967;P  = 0.163)。在另一项III期患者的亚组分析中,辅助化疗明显改善了高危和低危患者亚组患者的无病生存期,但未显示任何统计学意义(每个P > 0.05,图 3f,克)。我们还将Cox回归模型应用于III期患者,以检查PI是否与辅助化疗相互作用。在该测试中,PI与辅助化疗的相互作用达到统计学上的显着水平(P  = 0.034),但是在III期患者的辅助化疗中未发现PI分类的显着预测价值(补充图S3b)。综上所述,PI系统在II期和III期CRC患者中均显示出显着的预后潜力,尤其是在II期CRC患者中确定辅助化疗的可能性。


点击查看:文章下部分总结内容

更多医学分类文章

免费使用文档翻译功能

成为福昕翻译会员文档翻译免费翻到爽!


免责声明:福昕翻译只充当翻译功能,此文内容及相关信息仅为传递更多信息之目的,仅代表作者个人观点,与本网站无关,版权归原始网站所有。仅供读者参考,并请自行核实相关内容。若需要浏览原文、下载参考文献等,请自行搜索文中提到的原文网站进行阅读。
来源于:pubmed.nih


福昕翻译转换文章内容来源:https://fanyi.pdf365.cn/help/200
上一篇: 怎么免费翻译文档|翻译图片?秘诀交给你
下一篇: 基于11个基因特征指数,可预测结直肠癌的系统性复发(下