摘要:目的:通过生物信息学方法分析数据库NCBI-GEO中关于结直肠癌(CRC)的队列数据集,以阐明CRC中潜在的关键候选基因。方法:从NCBI-GEO下载获得数据GSE44076、GSE28000和GSE75970的CRC和癌旁组织基因表达谱。筛选差异表达基因(DEGs)并分析候选基因和途径富集。利用在线数据库STRING进行DEGs编码的相关蛋白质-蛋白质相互作用网络(PPI)分析。通过qPCR验证5名CRC患者癌旁组织和癌组织样本中关键基因的表达。结果:从3个数据集中筛选出98个差异基因(65个上调和33个下调)。根据功能和信号通路对DEG进行聚类,并进行显著的富集分析,结果表明大多数DEGs在单个生物体、结合、细胞组分和有丝分裂细胞周期中富集。通过PPI网络的整合,筛选4个关键基因CXCL1、BUB1、CCL19、CDK1。与癌旁组织相比,CRC癌组织中CXCL1,BUB1和CDK1的表达升高,CCL19表达降低,差异均有统计学意义(均P<0.05)。结论:CXCL1、BUB1、CCL19、CDK1在CRC组织中异常表达。