雄激素依赖型与非依赖型前列腺癌基因芯片数据分析
发表时间:2012-10-31 浏览次数:838次
作者:罗烈伟,马文丽,郑文岭 作者单位:南方医科大学 基因工程研究所,广东 广州 510515; 广东药学院 生物化学与分子生物学教研室,广东 广州 510006; 华南基因组研究中心,广东 广州 510800
【摘要】目的根据高通量基因表达谱数据,采用数据挖掘技术识别前列腺癌相关的特征基因与功能,探讨雄激素非依赖型前列腺癌形成的分子机制。方法 应用GeneSifter在线分析软件对6个雄激素依赖型前列腺癌(ADPC)和6个雄激素非依赖型前列腺癌(AIPC)基因芯片数据分成两组进行分析。结果 筛选得到348个差异表达基因,并发现这些差异表达基因涉及的生物学过程和KEGG通路的一些相关基因。结论 雄激素非依赖型前列腺癌的形成可能与GREB1 protein基因表达下调有关,并在细胞通讯和细胞黏附等过程和通路方面与雄激素非依赖型前列腺癌的形成有一定关系。
【关键词】 ADPC;AIPC; 基因表达谱;数据分析
Microarray data analysis in androgen-dependent and androgen-independent prostate cancer
LUO Lie-wei,MA Wen-li,ZHENG Wen-ling
(Institute of Genetic Engineering,Southern Medical University,Guangzhou,Guangdong 510515; Department of Biochemistry and Molecular Biology,Guangdong Pharmaceutical University,Guangzhou,Guangdong 510006; South China Genomic Research Center,Guangzhou,Guangdong 510800,China)
Abstract:Objective To investigate the molecular mechanisms of androgen-independent prostate cancer using microarray data.Methods Microarray data from the Gene Expression Omnibus (GEO) was used to examine the molecular changes between androgen-dependent and independent primary prostate tumors. This dataset was analyzed with GeneSifter microarray analysis software (VizX Labs,Seattle,WA).Results After filtering the data,348 differentially expressed genes were identified. Gene Ontology and KEGG analysis showed that the genes are correlated with RNA metabolism,cell cycle,macromolecule biosynthesis,and cell adhesion.Conclusions The GREB1 protein gene possibly plays an important role in androgen-independent prostate cancer. Gene’s changes of cell adhesion and cell communication also contribute to the understanding of androgen-independent prostate cancer.
Key words:ADPC;AIPC;gene expression profile; data analysis
前列腺癌(prostate cancer,PC)为全世界男性最常见的癌症之一,在美国男性所有诊断出来的肿瘤当中PC占了1/3,病死率排第二,仅次于肺癌。近年来PC在中国的发病率也呈不断上升趋势[1,2]。前列腺癌细胞的生长有依赖雄激素的生物学特性,多数前列腺癌患者在首次接受雄激素剥夺疗法后都有显著疗效,但最后超过一半的患者会复发并由雄激素依赖型前列腺癌(androgen-dependent prostate cancer,ADPC)发展成高度恶化且广泛转移的雄激素非依赖型前列腺癌(androgen-independent prostate cancer,AIPC)[3]。AIPC的形成机制还不清楚,基因芯片技术对PC在雄激素剥夺治疗前后的基因表达改变分析也许对了解AIPC的形成过程可以提供一些线索。本研究利用基因芯片数据分析软件GeneSifter对来自基因芯片公共数据库Gene Expression Omnibus(GEO)的12个ADPC和AIPC基因表达谱芯片数据作进一步生物信息学分析,以了解PC在雄激素剥夺治疗后的基因表达变化,并进一步探讨AIPC形成的分子机理,并为其他研究提供参考。
1 材料与方法
基因表达谱芯片数据来自GEO公共数据库(http://www.ncbi.nlm.gov/geo/),由BEST CJ等提交的GSE2443系列20个样品芯片数据中选取12个,分别是6个AIPC患者和6个ADPC患者原位肿瘤活检组织用激光捕获显微切割(LCM)方法取得的样品经RNA提取、扩增、逆转录和荧光标记等步骤,最后与Affymetrix Human Genome U133A芯片杂交,经Affymetrix GeneChip Scanner 3000扫描得到原始图像数据,再经标准化等处理后输出的芯片数据[4]。
GeneSifter(VizX Labs LLC,Seattle,WA,USA; http://www.genesifter.bet)属于基因芯片数据网络在线分析工具,经登陆GeneSifter网站以个人名义注册可以得到一定期限功能完整的免费试用。
从GEO下载下来的压缩数据经解压缩得到的是CEL文件格式,再将需要上传的12个GEL文件压缩成一个ZIP格式文件上传至GeneSifter网站进行分析,启动pair-wise analysis,以ADPC样品为第一组,AIPC样品为第二组。设置分析参数为:标准化:None; 统计学方法:t-test;阀值:1.5; 校正方法:Benjamini and Hochberg;数据转换:Data Aleady Log Transformed。原数据已经过GC-RMA对数转换和标准化处理[5],由于是两组样本的比较,所以采用t检验,筛选阀值至少为1.5,P<0.05,用Benjamini and Hochberg校正方法减少假阳性[6]。经过上述设置筛选得到的差异表达基因,进一步用GeneSifter软件自带的Gene Ontology(GO)工具和Kyoto Encyclopedia of Genes and Genomes (KEGG)通路分析其生物学意义。
2 结果
2.1 基因表达差异筛选结果
表达差异基因筛选得到348个基因,其中108个基因表达上调,占31.0%;240个基因表达下调,占69.0%。以ADPC样品的荧光信号强度值为X轴,AIPC样品的荧光信号强度值为Y轴,作基因表达谱散点图(图1),可以直观地表示两组样品间基因表达差异情况。每一个点代表芯片上一个基因点的杂交信号值,没有差异表达的基因分布在斜线周围,而远离斜线则为差异表达的基因。
图1 AIPC和ADPC基因表达谱散点图(略)
Fig.1 The scatter spot of the gene expression profile of ADPC and AIPC
2.2 生物学意义分析结果
2.2.1 GO分析结果 GO分析结果发现差异基因涉及的生物过程按Z分值从大到小排序上调的有细胞黏附、细胞发育过程、细胞表面受体有关信号转换过程等,下调的有翻译、大分子生物合成、细胞生物合成等,见表1。Z分值表示在GO和KEGG通路分析报告中的统计学差异,Z分值>2则认为GO术语(或通路)具有显著丰度(Over-representation),而Z分值<-2暗示GO术语(或通路)具有显著贫度(Under-representation),两者均具有显著性意义[7]。
2.2.2 KEGG通路分析结果
KEGG通路分析发现细胞外基质受体相互作用、细胞通讯、黏着斑(focal adhesion)等相关基因表达上调;核糖体、氨基糖代谢、氧化磷酸化等相关基因表达下调,见表2。
表1 差异表达基因GO分析结果 (略)
Tab.1 Gene Ontology analysis of some differentially expressed genes
表2 差异表达基因KEGG通路分析(略)
Tab.2 KEGG pathway analysis of some differentially expressed genes
3 讨论
ADPC一旦发展成为AIPC就往往意味着这些肿瘤细胞的生长不受控制,这个阶段是前列腺癌病人死亡的主要原因,基因表达的改变和表观遗传的改变被认为是ADPC发展为AIPC的主要原因,基因芯片表达谱的应用为这种改变的分子机制研究提供很好的线索,基因芯片应用同时产生了海量的数据,如何分析这些数据的生物学功能已经成为基因芯片技术广泛应用的瓶颈,于是专门分析这些数据的软件应运而生,GeneSifter软件是一个以网络为基础集统计分析和生物学功能分析为一体的基因芯片数据分析系统,它具有快速、易用和直观的特点。
从GeneSifter对ADPC和AIPC两组表达谱数据差异分析结果看,表达差异基因筛选得到348个基因中有108个基因表达上调,240个基因表达下调,其中有一些基因以前有文献报道过与肿瘤有关,如Bcl-2、Tetraspanin 1、GALNT12[8-10],其中表达最具显著意义的是GREB1 protein基因,下调表达达到15.48倍,是表达倍数最高的基因,GREB1(gene regulated by estrogen in breast cancer1)是雌激素应答基因,在乳腺癌研究中被认为在肿瘤对激素反应中有重要的作用,此次发现在AIPC中显著低表达,提示其对前列腺癌在激素剥夺治疗后可能也有重要的作用。通过GeneSifter自带的GO生物学过程分析和KEGG通路分析,得到比较有意思的结果是,在细胞黏附以及细胞通讯相关的基因表达有显著的变化,提示细胞黏附过程可能与前列腺癌相关。相邻细胞间的连接决定细胞和组织的形态、调控细胞的运动、生长、分化和存活等。细胞间黏附连接结构(adherens junction) 的形成是通过相邻细胞表面的钙依赖性钙黏着素受体的细胞外区域的相互作用实现的[11],细胞的恶变通常表现为组织结构中细胞骨架的根本改变,一方面通过下调钙黏素或连环蛋白(catenin)家族成员的表达实现,另一方面可以通过激活一些可阻断细胞间黏附连接结构聚集的信号传导途径实现。已有研究发现,上皮型钙黏素(E-cad) 表达的缺失可使腺瘤向腺癌转化[12]。另有研究也表明, 细胞黏附蛋白的共同异常表达对前列腺癌的预后诊断有重要意义[13]。
通过对前列腺癌基因芯片数据的再挖掘,虽然筛选出的差异基因及其相关通路还有待更多的实验验证,但可为雄激素非依赖性前列腺癌的基因诊断以及药物作用靶点方面提供更多的信息。
【参考文献】
[1]AHMEDIN J,REBECCA S,ELIZABETH W,et al. Cancer statistics[J]. CA Cancer J Clin,2007,57:43-66.
[2]叶定伟,李长岭. 前列腺癌发病趋势的回顾和展望[J].中国癌症杂志,2007,17(3):177-180.
[3]SCHRODER F H. Progress in understanding androgen-independent prostate cancer (AIPC):a review of potential endocrine-mediated mechanisms [J]. Eur Urol,2008,28(2):28.
[4]BEST C J M,GILLESPIE J W,GADISETTI Y Y,et al. Molecular alterations in primary prostate cancer after androgen ablation therapy [J]. Clin Cancer Res,2005,11(19):6823-6834.
[5]WU Z,IRIZARRY R A. Preprocessing of oligonucleotide array data[J]. Nature Biotechnology,2004,22(6):656-658.
[6]ANAT R,DANIEL Y,YOAV B R. Identifying differen-tially expressed genes using false discovery rate controlling procedures [J]. Bioinformatics,2003,19(3):368-375.
[7]廖之君,马文丽,梁爽,等 GeneSifter在基因表达谱芯片数据挖掘中的应用[J]. 医学信息学,2007,20(11):1882-1887.
[8]LEONETTI C,BIROCCIO A,D’ANGELO C,et al. Therapeutic integration of c-myc and bcl-2 antisense molecules with docetaxel in a preclinical model of hormone-refractory prostate cancer[J]. Prostate,2007,67(13):1475-1485.
[9]LEE S,BANG S,SONG K,et al. Differential expression in normal-adenoma-carcinoma sequence suggests complex molecular carcinogenesis in colon[J].Oncol Rep,2006,16(4):747-754.
[10]GUO J M,CHEN H L,WANG G M,et al. Expression of UDP-GalNAc:polypeptide N-acetylgalactosaminyltransferase-12 in gastric and colonic cancer cell lines and in human colorectal cancer[J]. Oncology,2004,67(3-4):271-276.
[11]NAGAFUCHI A.Molecular architecture of adherens junctions [J]. Curr Opin Cell Biol,2001,13(5):600-603.
[12]PERL A K,WILGENBUS P,DAHL U,et al. A causal role for E-cadherin in the transition from adenoma to carcinoma[J]. Nature,1998,392(6672):190-193.
[13]KALLAKURY B V,SHEEHAN C E,ROSS J S. Co-downregulation of cell adhesion proteins α- and β-catenins,P120 CTN,E-cadherin,and CD44 in prostatic adenocarcinomas[J]. Hum Pathol,2001,32(8):849-855.