利用生物信息分析挖掘乳腺癌发病差异基因并寻找预后标志物

(整期优先)网络出版时间:2018-10-20
/ 2

利用生物信息分析挖掘乳腺癌发病差异基因并寻找预后标志物

朱琳1于佳1张宏飞1吕怀盛2杨文君1(通讯作

(1宁夏医科大学生育力保持教育部重点实验室基础医学院生物技术系宁夏银川750004)

(2宁夏医科大学总医院病理科宁夏银川750004)

【摘要】目的:利用生物信息分析的手段筛选乳腺癌组织与正常组织之间的差异表达基因,寻找乳腺癌特异分子标志物并探索其发病机制。方法:从GEO数据库中检索获取乳腺癌患者的芯片数据,进行差异基因的筛选及相关分析。结果:共得到212个差异基因,分别富集在细胞周期调控、激素刺激反应、代谢和碱基切除修复等功能簇中。筛选出的关键基因(FOS、H2AFV、HDAC3、OAS1、PCNA和RB1基)能够预测乳腺癌患者的预后。结论:筛选获得乳腺癌与正常乳腺组织差异表达的基因,为乳腺癌的诊断、治疗、及预后判断提供新的理论依据。

【关键词】乳腺癌;差异表达基因;高通量基因芯片;生物信息学

【中图分类号】R737.9【文献标识码】A【文章编号】1007-8231(2018)10-0023-02

【Abstract】ObjectiveScreeningthedifferentiallyexpressedgenesbetweenbreastcancertissueandadjacenttissueinordertofindbiomarkersofbreastcancer.MethodsGeneexpressionprofilesofbreastcancerpatientswereobtainedfromGEOdatabase.Morpheus,DAVIDdatabase,STRINGdatabase,andCytoscapesoftwarewereusedtofindandanalyzedifferentiallyexpressedgenes.ResultsAtotalof212differentiallyexpressedgeneswerefoundandtheymainlyenrichedinfunctionalcategoriesinvolvingpositiveregulationofcellcycle,cellularresponsetohormonestimulus,metabolicpathways,andbaseexcisionrepair.ConclusionThisresearchmayprovidenewevidencetobreastcancerdiagnosisandtreatment.

【Keywords】Breastcancer;Differentiallyexpressedgenes;High-throughputmicroarray;Bioinformatics

乳腺癌是全球女性中最常见的恶性肿瘤,其发病率占全球女性恶性肿瘤发病的首位[1]。差异表达基因(DEGs)具有收集快捷、检测准确等特点,利用生物信息学对其分析可以帮助我们为乳腺癌的诊断新的理论基础[2]。

1.材料和方法

芯片数据来源于GSE20437样本集。使用DAVID数据库对DEGs进行GO分析和KEGG分析。使用STRING数据库来评估相关DEGs蛋白质相互作用关系(PPI)。选择PPI网络中的关键核心基因,并将其导入Kaplan–Meierplotter网站,通过该网站的临床数据库来评估预后。

2.结果

本次分析共涵盖乳腺癌样本18例,正常样本24例,对数据分析共获得212个DEGs,其中上调DEGs共157个,下调DEGs共55个。分析发现上调DEGs在生物学过程中主要涉及细胞周期的正向调节和减数分裂调节;在分子功能中主要涉及维甲酸反应调节和肌动蛋白结合。下调DEGs在生物学过程中主要涉及细胞对环磷酸腺苷的反应和骨骼肌细胞分化;在分子功能中主要涉及转录因子活性调节和序列特异性DNA结合。上调DEGs主要涉及的信号通路包括碱基切除修复、代谢通路和DNA复制,而下调DEGs主要涉及的信号通路包括苯丙胺成瘾和癌症胆碱代谢。

基于STRING数据库,在Cytoscape软件上选择得分最高的前15位基因认定为核心基因,其分别为JUN、FOS、HDAC1、PCNA、EGR1、HDAC3、RB1、H2AFV、DUSP1、OAS1、ATF3、FOSB、HIST2H2BE、PARP1和CCT2。根据PPI网络筛选出的15个核心基因,通过Kaplan–Meierplotter网站评估其对乳腺癌的预后作用,发现2个下调DEGs和4个上调DEGs具有预测评估乳腺癌预后的作用。其中,FOS和H2AFV的低表达预示着较差的预后,而HDAC3,OAS1,PCNA和RB1的高表达则预示着较差的预后。

3.讨论

本研究通过对GEO数据库的GSE20437样本集中的乳腺癌组织和正常组织进行生物信息学比对,筛选出157个上调基因和55个下调基因。通过GO分析发现,上调DEGs涉及细胞周期正向调控等生物学过程。

在GO富集分析中,发现下调DEGs主要涉及细胞对激素刺激反应等生物学过程。在KEGG通路分析中,我们发现乳腺癌的差异基因主要富集于代谢、碱基切除修复等通路。

利用PPI和预后队列,我们确认了FOS基因、H2AFV基因、HDAC3基因、OAS1基因、PCNA基因和RB1基因的表达量可以预测乳腺癌患者的预后。前期研究已经部分证实了这一发现[3]。

【参考文献】

[1]DeSantisC,MaJ,BryanL,etal.Breastcancerstatistics,2013[J].CACancerJClin,2014,64(1):52-62.

[2]ChenW,ZhengR,BaadePD,etal.CancerstatisticsinChina,2015[J].CACancerJClin,2016,66(2):115-132..

[3]林俊杰,杨昭婷,玄延花,等.HDAC3和HDAC5在乳腺癌中的表达与临床病理特征意义[J].中国实验诊断学,2016,20(6):1001-1003.