详细信息
detail information
假基因的功能及其在癌症疾病中的重要作用
来源:遗传 | 作者/编辑:汤静思 等 | 发布时间: 2015-01-01 | 2638 次浏览 | 分享到:
假基因是一段具有与功能基因相似的 DNA 序列,但由于存在许多突变以致失去了原有的功能。过去的研究认为假基因是没有功能的 DNA 片段,是基因组进化过程中产生的噪音。然而,随着分子生物学技术的发展,越来越多的研究证明了假基因具有重要的生物学功能。假基因可与功能基因竞争性结合 miRNA,从而调控功能基因的表达;假基因还可产生内源性小干扰 RNA 抑制功能基因的表达;甚至有的假基因还可以编码具有功能的蛋白质。文章通过假基因的分类、假基因的识别、假基因的功能和假基因与癌症疾病的关系等方面综述了假基因研究的最新进展。
  1977 年,Jacq 等[1]在非洲爪蟾(Xenopus laevis D.)基因组中发现了一段不转录的核苷酸序列,并且这段序列与编码 5S rRNA 的功能基因高度相似,因此被定义为假基因(Pseudogene)。目前普遍认为具有以下两种特征的核苷酸序列称为假基因:一是与功能基因的核苷酸序列具有高度相似性;二是不具有转录功能或者转录但不能翻译成蛋白质,这主要归因于核苷酸序列中终止密码子的提前出现(Premature stop codon)或者存在移码突变(Frame shift)[2]。因此假基因被认为是没有功能的核苷酸序列,而且不受选择压力束缚[3]。然而,在过去的 20 年里,人们发现假基因广泛分布于各个物种的基因组中,尤其在哺乳动物中最多[4]。同时,一些假基因被证明具有重要的功能[5~9]。这说明假基因不仅仅是基因组进化的遗骸,还可能具有重要的功能。由于假基因与功能基因的密切关系以及假基因在基因组进化过程中的重要性,假基因的研究也就越来越多。本文从假基因的分类、假基因的识别、假基因的功能和假基因与癌症疾病的关系等方面综述了假基因研究的最新进展。
1假基因的分类
  根据假基因的形成机理,可划分为 3 种类型的假基因,即复制型假基因(Duplicated pseudogene)、单一型假基因(Unitary pseudogene) 和加工型假基因(Processed pseudogene) 。复制型假基因是基因组DNA 串联复制或者染色体不均等交换过程中基因编码区或调控区发生突变,导致复制后的基因失去正常功能而成为假基因[10];单一型假基因是原本具有功能的单一拷贝基因在编码区或调控区发生自发突变(Spontaneous mutations),导致该基因无法转录和翻译而成为假基因[11];复制型假基因和单一型假基因又被称为未加工型假基因 (Unprocessed pseudogene),因为它们都是直接由 DNA 序列演化而来,具有内含子-外显子的结构和调控元件。加工型假基因是由mRNA 转录本逆转录成 cDNA 后随机整合到基因组,由于插入位点不合适或者序列发生突变而失去正常功能而形成的假基因[12,13]。这种类型的假基因通常包含 mRNA 的特征是:(1)没有内含子和 5'端调控序列;(2)具有 3'端聚腺苷酸化信号序列; (3)侧翼区一般存在正向重复序列。加工型假基因在基因组的位置是随机的,而复制型假基因是在亲本功能基因(Parent gene)附近[14]。
2假基因的识别
  在基因组中区分假基因与功能基因具有重要的 意义,因此,假基因的识别是假基因相关研究的基 础。由于假基因与功能基因具有高度的序列相似性, 并且假基因积累的突变属于中性或者近中性突变。 因此,1981 年 Li 等[15]提出通过计算核苷酸非同义替换与同义替换的比率(Dn/Ds)来识别假基因。理论 上,由于假基因不编码蛋白质,不受正选择 (Positive selection)或者纯化选择(Purifying selection)束缚,那么处于近中性选择压力下的假基因的非同义替换与 同义替换的比率应该等于或接近 1[16,17]。通过这种方法已经在多个物种中识别出假基因,其中在人类基 因组中发现 8000 多个加工型假基因[18]。然而,2003 年Balakirev 等[19]在果蝇中发现假基因Est-6(Esterase 6)的非同义替换与同义替换比率小于 1,即相比非同义替换,同义替换发生更频繁,说明该基因可能具 有功能。2002 年 Betran 等[20]发现假基因 PGAM3 (Phosphoglycerate  mutase  processed  gene)不支持中性选择模型,而是受正向选择压力限制,说明该假 基因可能正在进化成新的功能基因,所以会受正选 择作用。另外针对假基因的特征及与同源功能基因 的关系可用于识别假基因。对于复制型假基因和加 工型假基因而言,由于基因组中存在亲本功能基因, 所以可在基因组中利用亲本功能基因序列比对搜索, 继而通过这两类假基因的特征来区分:复制型假基 因有内含子和调控元件;加工型假基因无内含子,有 多聚腺苷酸化信号序列等特征。根据单一型假基因 的定义,可知该类型假基因在基因组中只有一个拷 贝,所以可利用其他物种的基因组作为参考基因组 进行比对识别[11]。
  针对全基因组内大规模的识别假基因,可采用生物信息学的方法解决。鉴定假基因的主要生物信息方法有 3 种:PseudoPipe,RetroFinder 和 Pseudo- Finder。PseudoPipe 是一种基于基因组数据利用同源性搜索鉴定假基因的方法,可区分假基因类型[21]。PseudoFinder 是一种利用同源匹配(Homologous mapping) 鉴定假基因的方法,而 RetroFinder 是一种专注于加工假基因的注释的方法[22];以上两种方法都需要物种的基因组和转录组信息,适用于模式生物。对于非模式生物,Molineris 等[23]提出 Retrotrans- posed Gene EXPlorer(REGEXP)方法,该方法主要利用加工型假基因无内含子的特点鉴定加工型假基因, 仅依赖物种的 DNA 序列信息。以人类基因组为例, Jennifer 等[24]采用不同的方法鉴定出的假基因数量 均不同:利用 PseudoPipe 方法鉴定出 18 046 个假基因;利用 RetroFinder 方法鉴定出 13 644 个假基因; 利 用 HAVANA(Human and Vertebrate Analysis and Annotation)小组的方法鉴定出 11 224 个假基因。Pei 等[25]结合以上方法在人类基因组中鉴定出 11 216 个假基因以及 138 个单一型假基因;同时,通过实验发现一些如核糖体蛋白(Ribosomal protein L21 , RPL21)有 143 个假基因,甘油醛-3-磷酸盐脱氢酶(Glyceraldehyde-3-phosphate dehydrogenase,GAPDH) 有 68 个假基因。这与之前的研究一致,说明管家基因(House-keeping genes)有更多的假基因[26]。
3假基因的功能
  在 20 世纪 80~90 年代,虽然假基因与亲本功能基因具有高度相似性,但由于物种基因组信息匮乏, 假基因被认为缺乏生物学功能和不受选择压力束缚, 因此常被理解为基因组里的遗迹,仅作为中性进化 的经典材料,研究基因的演化过程和物种基因组的 进化方向[4]。随着二代测序技术的广泛应用和人类 基因组计划的完结,使得对于假基因的研究越来越 多。近年来的研究发现,一些假基因在调控生物体 生长发育和癌症疾病方面具有重要的功能。本文将 假基因分为转录的假基因、不转录的假基因及编码 蛋白质的假基因来阐述其重要功能。
3.1转录的假基因
  自假基因被发现后,其功能研究也逐渐成为研究的热点。目前已报道的大多数有功能的假基因均是通过其转录本行使功能,如假基因的转录本作为反义 RNA(Antisense RNA)抑制亲本功能基因的表达; 假基因转录本竞争性地结合 miRNA(MircoRNA);假基因的转录本产生内源性小干扰 RNA(Endogenous small interfering RNA,endo-siRNA)等。转录的假基因可通过以上途径达到调控其他功能基因的作用。
  1992 年 Zhou 等[5]发现在人类基因组中的加工型假基因 TOPI(Topoisomerase I)能产生反义 RNA, 并且该反义 RNA 可与亲本功能基因 TOPI 的转录本互补配对。尽管这项研究并未说明假基因产生的反义 RNA 具有功能,但在随后的研究中证明了假基因转录的反义 RNA 在细胞水平上扮演的重要角色。如Korneev 等[6]在蜗牛里发现假基因 NOS(Nitric oxide synthase)的转录本同样也是反义 RNA,并证明了假基因 NOS 的转录本能与亲本功能基因的转录本形成RNA 双链,从而抑制了功能基因 NOS 在蜗牛神经细胞中的表达。2013 年,Korneev 等[27]通过实验进一步证明了假基因 NOS 转录的反义 RNA 在蜗牛记忆形成的关键时期抑制了一氧化氮(NO)合成,该研究说明假基因转录的反义 RNA 在细胞中的重要作用。
  编码磷酸张力同源物蛋白质的基因 PTEN (Phosphatase and tensin homolog)是一个抑癌基因, 通过抑制 PI3K/AKT 信号通路达到抑制肿瘤生长的功能。2010 年,Poliseno 等[8]发现假基因 PTENP1 (Phosphatase and tensin homolog pseudogene)是一个能转录的加工型假基因,并与 PTEN 具有高度的同源性。其中,在 PTEN 与 PTENP1 的 3′UTR (Untrans- lated region)上有一段具有高相似度的 DNA 片段, 并发现在该 DNA 片段上享有共同的 miRNA 结合位点。同时,证明了 PTENP1 的 3′UTR 可竞争性结合miRNA,并阻挡了 miRNA 结合亲本功能基因 PTEN 的 3′UTR,从而确保了 PTEN 的正常表达。2013 年, Per Johnsson 等[9]发现假基因 PTENP1 既能转录正义RNA(Sense RNA),又可转录反义 RNA。其中, PTENP1 转录的反义 RNA 又分为 3 个亚型,即未剪切的 α、剪切的 α 和剪切的 β 亚型。未剪切的 α 亚型反义转录本与正义转录本的 3′端均没有被多聚腺苷酸化(Polyadenylated,PolyA),且发现未剪切的 α 亚型反义转录本出现在细胞核内。而剪切的 α 亚型转录本和 β 亚型转录本的 3′端都被多聚腺苷酸化, 且在细胞质中检测到高水平的表达。随后的实验证明了剪切的 α 亚型反义转录本和未剪切的 α 亚型反义转录本能与 PTEN 的启动子结合,以反式调控的方式抑制 PTEN 的转录;虽然 PTENP1 的正义转录本缺少多聚腺苷酸尾,但是可通过剪切的 β 亚型反义转录本与正义转录本结合,以顺式调控的方式保证正义转录本顺利地由细胞核运输到细胞质中,使得正义转录本能与miRNA 结合从而确保 PTEN 正常表达。随后 Zina 等[28] 发现另一个抑癌候选基因TUSC2(Tumor suppressor candidate-2) 的假基因TUSC2P(Tumor   suppressor   candidate-2 pseudogene)也是通过 3′UTR  竞争性地结合 miRNA  来保护TUSC2 正常表达。另外,Chiefari 等[29]发现假基因HMGA1-p(High mobility group A1 pseudogene) 的 转录本可降解功能基因 HMGA1(High mobility group A1)的转录本,其主要机制是假基因的转录本和亲本功能基因的转录本在 3′UTR 上共享一个重要的转录后调控元件,随后的实验证明了这个假基因的转录本可竞争性地结合反式作用因子 αCP1(Cytoplasmic protein)[30]。
  假基因的转录本还可形成内源性小干扰 RNA 来调控基因的表达。如 Tam 等[7]在小鼠卵母细胞中发现假基因可产生内源性小干扰 RNA,通过 RNA 干扰(RNA interference,RNAi)的机制来调控亲本功能基因的表达。同时,假基因产生的内源性小干扰RNA 是通过以下两种方式:一是由假基因的反义转录本与亲本功能基因的正义转录本杂合形成双链RNA,或者由假基因的反义转录本与假基因的正义转录本杂合形成双链 RNA,随后双链 RNA 经加工形成小干扰 RNA;二是直接由具有反向重复序列的假基因转录本加工形成[31]。2013 年,Chan 等[32]发现转录的假基因 ψPPM1K(Protein phosphatase , Mg2+/Mn2+ dependent,1K pseudogene)通过上述第二种方式形成了小干扰 RNA,并且在转染了这种小干扰 RNA 的细胞中功能基因 NEK8(NIMA-related kinase 8) 和 PPM1K(Protein phosphatase,Mg2+/Mn2+ dependent,1K)的表达量下降。其中,相对于正常细胞,NEK8 在肿瘤细胞中的表达量增加,而由假基因ψPPM1K 产生的小干扰 RNA 抑制了 NEK8 的表达, 说明这些小干扰 RNA 具有抑制肿瘤的活性和调控人类细胞生长的功能。
3.2不转录的假基因
  关于假基因的功能研究主要对象是能转录的假基因,然而对于不转录的假基因的功能却鲜为人知或者被默认为没有功能。2011 年,Michael 等[33]在分析硬骨鱼类的基因组时,首次发现 3 段 DNA 序列ttc29、dock9 和 ccdc46 是新产生(Do novo generation) 的、具有活性的增强子。硬骨鱼类的祖先在 3.5  亿年前发生了一次全基因组复制(Whole genome du- plication,WGD),而 75%的复制基因积累突变而失去了编码功能成为假基因。其中,一些假基因在选 择压力的驱使下进化成具有功能的基因或调控元件, 如 ttc29、dock9 和 ccdc46。在硬骨鱼类基因组中, dock9 和 ccdc46 各有一个旁系同源基因,ttc29 没有旁系同源基因。同时,这 3 个假基因与它们的旁系同源基因和直系同源基因都具有高度的相似性,而 且在哺乳动物和硬骨鱼类中的同源基因都是具有能 编码蛋白质的功能基因。ttc29、dock9 和 ccdc46 的核苷酸序列在哺乳动物中非常保守。尽管它们的同 源基因都具有编码蛋白质的功能,但却没有增强子 的调节功能。研究证明,这 3 个假基因是有活性的增强子,它们能调控邻近基因的表达,说明不转录 的假基因可能也具有重要的调控功能。
3.3具有编码能力的假基因
  最早定义的假基因是不具有编码蛋白质的功能, 可是近年的研究却指出一些假基因也可编码短链肽 或者截短的蛋白质,即相比亲本功能基因编码的蛋 白质要短一些。在灵长目中非常保守的加工型假基 因 PGAM3(Phosphoglycerate mutase family 3)是首次被发现的具有编码能力的假基因。1977 年,Dierick 等[34] 发现假基因 PGAM3 是通过亲本功能基因PGAM1 的 mRNA 反转录整合到基因组中形成,并且假基因 PGAM3  有完整的开放阅读框,同时还在开放阅读框上游发现了具有启动子特征的区域,但 是通过 RT-PCR  和限制性内切酶酶切实验没有发现假基因 PGAM3 在任何组织里转录。2002 年,Betran 等[20]以人的cDNA 文库作为模板进行PCR 扩增和限制性内切酶酶切实验,发现假基因 PGAM3  不仅能转录,而且证明了在正向选择压力的驱使下还进化 出具有编码蛋白质的能力。1991 年,Fishman 等[35] 发现了另外一个加工型假基因 Cx43(Connexin 43)具 有完整的开放阅读框。2004 年,Kandouz 等[36]在癌细胞中发现假基因 Cx43 的转录本,并证明了假基因Cx43 是编码一个 43  kDa 的蛋白质;同时,证明该蛋白质具有与亲本功能基因 Cx43 编码的蛋白质一样的功能,即抑制细胞生长。2014 年,Porter 等[37] 发现假 基因 NLRP2P(NLR family , pyrin do- main  containing  2  pseudogene)是高等灵长目特有的加工型假基因,具有与功能基因 POP2(Pyrin-only protein  2)相似的功能。假基因 NLRP2P 具有完整的开放阅读框,并且编码 45 个氨基酸。其中,这些氨基酸构成了类似脓素结构域(Pyrin-domain)的蛋白质。同时,假基因 NLRP2P 的编码区与功能基因 POP2 相似度达 80%以上。通过选择压力分析,在旧大陆猴中该基因的编码区受纯化选择压力限制。研究证 明,在人类单细胞中假基因 NLRP2P 转录本受脂多糖上调,并且该假基因具有调控细胞因子生成、细 胞周期和细胞死亡的功能[37]。
  这些例子说明了假基因并不是无功能的 DNA, 有些假基因在选择压力的作用下不断进化,为了生物体更好的生存而具有各种各样的功能。因此,假基因是生物体的基因贮备库,是原基因(Protogene)[38]。
4假基因与癌症疾病的关系
4.1假基因在肿瘤细胞中的表达
  随着新一代高通量测序技术的成熟,Kalyana- Sundaram 等[26]通过分析 RNA-Seq 数据检测假基因的转录和评估假基因在肿瘤细胞中的表达量。他们发现在肿瘤转录组中有大量假基因表达,其中包含了已注释的 1500 个假基因和 400 个新的假基因。他们鉴定了 218 个具有癌症特异性的假基因,其中 178 个假基因在多种肿瘤细胞类型中均有表达,如功能基因 PTMA(Prothymosin alpha)产生的 5 个加工型假基因,这些假基因在 30 多种癌细胞中均有表达,但却不在正常细胞中表达。另外,40 个假基因只在一种肿瘤细胞类型中高度特异表达。他们发现假基因的表达不仅具有癌症特异性,还具有组织特异性。在前列腺癌细胞中,识别了多个特异性表达的假基因,如加工型假基因 CXADR-Ψ(Coxsackie virus and adenovirus receptor pseudogene),该假基因在大约25%的前列腺癌细胞中表达上调,而在正常的前列腺细胞和非前列腺细胞中基本不表达。另外,他们发现假基因 ATP8A2P1(ATPase, aminophospholipid transporter, class I,  type 8A,  member 2 pseudogene) 在大约 25%的乳腺癌细胞中大量表达,并且指出该假基因具有调控细胞生长和致癌的功能。
  2014 年,Han 等[39]分析了 2808 个癌症患者样品的假基因表达谱,其中包含了 7 种类型的癌症。他们发现在这些癌细胞样本中共有 9925  个假基因表达。其中,547 个假基因在乳腺侵润性癌细胞中表达,138 个假基因在肺鳞状细胞癌中表达。同时, 他们指出在多种癌细胞类型中假基因的表达与癌细胞分子亚型具有高度的一致性,且大部分假基因的表达与对应的亲本功能基因无关。随后他们发现在102 个可表达的假基因中,64 个假基因可能通过竞争性结合 miRNA 来调控功能基因表达,4 个假基因可能作为反义 RNA 抑制功能基因的表达。
4.2假基因在肿瘤细胞中的作用
  目前,越来越多的证据(表 1)表明,假基因在人类癌症等疾病方面扮演着重要的角色。首先,假基 因通过编码具有功能的蛋白质行驶功能,如八聚体 结合转录因子 4(Octamer-binding transcription factor 4,Oct4)的假基因 Oct4-pg1。2007 年,Lin 等[40]发 现假基因 Oct4-pg1 可抑制间充质干细胞的生长与分化,并且该假基因能促进细胞的增殖。同时,有研 究指出,在人类胶质瘤、乳腺癌等细胞中没有发现 功能基因 Oct4 的表达,却观察到其假基因的表达, 并且这些假基因可以转录并翻译成蛋白质,但该蛋 白质缺乏相应的生物学功能[41~43]。2010 年,Kastler 等[44, 45]在前列腺癌细胞中发现假基因 Oct4-pg1 是Oct4 家族成员中有且仅有的一个能表达的成员,并且该假基因可编码一个含有 359 个氨基酸的蛋白质, 可能具有类似亲本功能基因的功能,即维持癌细胞 的无限增殖和自我更新的能力。
  假基因可通过竞争性地结合 miRNA  调控功能基因的表达,从而抑制或者促进肿瘤的发生。如假基因 TUSC2P1 通过竞争性地结合 miRNA 的方式保护抑癌基因 TUSC2 的表达,从而抑制乳腺癌细胞的增殖[28]。2013 年,Wang 等[46]在肝癌细胞中发现假基因 Oct4-pg4 可竞争性地结合 miR-145,从而确保了亲本功能基因的表达,并促进了肝癌细胞的生长和致瘤性。假基因 KRASP1(Kirsten rat sarcoma viral oncogene  homolog  pseudogene)通过竞争性地结合miRNA 保护致癌基因 KRAS(Kirsten rat sarcoma viral oncogene homolog)的表达,从而促进前列腺癌细胞的增殖[8]。另外,假基因不仅通过竞争性地结合miRNA 保护功能基因的表达,还可产生反义 RNA 表 1 已报道的假基因在相关癌症等疾病中的作用机制抑制功能基因的转录,从而调控肿瘤细胞的生长、增殖、迁移和凋亡,如假基因 PTENP1[8, 20]。假基因Xist(X inactive-specific transcript)可产生反义 RNA, 通过与其正义转录本结合而抑制了正义转录本的功能,使 X 染色体异常,该现象不仅出现在乳腺癌细胞和前列腺癌细胞,还发生在其他癌症细胞中[47]。假基因还可产生小干扰 RNA 来抑制功能基因的
表达而调控肿瘤的发生。如假基因 ψPPM1K 产生小干扰 RNA 抑制功能基因 NEK8 及其亲本功能基因PPM1K 的表达,从而抑制肝癌细胞的生长[32]。假基因还可通过一些其他的方式调控肿瘤的发生。如假基因 MYLKP1(Myosin light chain kinase pseudogene) 在癌细胞中特异表达,并在转录后水平降低了功能基因 MYLK(Myosin light chain kinase)的表达,促进癌细胞的增殖[48]。另外,假基因也参与一些疾病的发生过程,如在二型糖尿病中,假基因 HMGA1-P 可与其亲本功能基因 HMGA1 竞争性地结合反式作用因子,从而抑制功能基因的转录,以致 HMGA1 无法正常行使其调节胰岛素受体的功能[30]。
5结 语
  在很长的一段时间,进化的基础理论认为所有试 图保留下来的随机遗传变化都是具有某种优势,而 随后提出的中性学说则认为通过进化产生的 DNA 片段对生物体不造成任何优势或劣势[49]。没有功能 的假基因则被人们认为是研究中性选择的经典材料, 然而随着研究的深入,越来越多的研究发现一些假 基因并不适合中性选择模型,而且这些假基因还具 有某些生物功能,尤其表现在癌症疾病方面。如今, 假基因的研究不仅是进化生物学的热点,也成为了 生物医学和临床医学的新起点。


参考文献

[1]Jacq C, Miller JR, Brownlee GG. A pseudogene structure  in 5S DNA of Xenopus laevis. Cell, 1977, 12(1): 109–120.
[2]Proudfoot N. Pseudogenes. Nature, 1980, 286(5776): 840–841.
[3]Petrov DA, Hartl DL. Pseudogene evolution and natural selection for a compact genome. J Hered, 2000, 91(3): 221–227.
[4]Podlaha O, Zhang JZ. Pseudogenes and their evolution. Chichester: John Wiley & Sons, 2001.
[5]Zhou BS, Beidler DR, Cheng YC. Identification  of antisense RNA transcripts from a human DNA topoisomeraseⅠ pseudogene 1. Cancer Res, 1992, 52(15): 4280–4285.
[6]Korneev SA, Park JH, O'shea M. Neuronal expression of neural nitric  oxide  synthase  (nNOS)  protein  is suppressed by an antisense RNA transcribed from an NOS pseudogene. J Neurosci, 1999, 19(18): 7711–7720.
[7]Tam OH, Aravin AA, Stein P, Girard A, Murchison EP, Cheloufi S, Hodges E, Anger M, Sachidanandam R, Schultz RM, Hannon GJ. Pseudogene-derived small interfering RNAs regulate gene expression in mouse oocytes. Nature, 2008, 453(7194): 534–538.
[8]Poliseno L, Salmena L, Zhang JW, Carver  B,  Haveman WJ, Pandolfi PP. A coding-independent function of gene and pseudogene mRNAs regulates tumour biology. Nature, 2010, 465(7301): 1033–1038.
[9]Johnsson P, Ackley A, Vidarsdottir L, Lui WO, Corcoran M, Grandér D, Morris KV. A pseudogene long-noncoding-RNA network regulates PTEN transcription and translation in human cells. Nat Struct Mol Biol, 2013, 20(4): 440–446.
[10]Mighell AJ, Smith NR, Robinson PA, Markham AF. Vertebrate pseudogenes. FEBS Lett, 2000, 468(2–3): 109–114.
[11]Zhang ZD, Frankish A, Hunt T, Harrow J, Gerstein M. Identification and analysis  of  unitary  pseudogenes: historic and contemporary gene losses in  humans  and  other primates. Genome Biol, 2010, 11(3): R26.
[12]Maestre J, Tchenio T, Dhellin O, Heidmann T. mRNA retroposition in human cells: processed pseudogene formation. EMBO J, 1995, 14(24): 6333–6338.
[13]D'errico I, Gadaleta G, Saccone C. Pseudogenes  in metazoa: origin and features. Brief Funct Genom Proteom, 2004, 3(2): 157–167.
[14]Vanin EF. Processed pseudogenes: Characteristics and evolution. Annu Rev Genet, 1985, 19(1): 253–272.
[15]Li WH, Gojobori T, Nei M. Pseudogenes as a paradigm of neutral evolution. Nature, 1981, 292(5820): 237–239.
[16]Wang W,  Zhang JM, Alvarez C, Llopart A, Long  MY.  The origin of the Jingwei gene and the complex modular structure of its parental gene, Yellow emperor, in  Drosophila melanogaster. Mol Biol Evol, 2000, 17(9): 1294–1301.
[17]Torrents D, Suyama M, Zdobnov E, Bork P. A  genome-wide survey of human pseudogenes. Genome Res, 2003, 13(12): 2559–2567.
[18]Li W, Yang W, Wang XJ. Pseudogenes: pseudo or real functional elements? J Genet Genomics, 2013, 40(4): 171–177.
[19]Balakirev ES, Ayala FJ. PSEUDOGENES: Are they “Junk” or functional DNA? Annu Rev Genet,  2003,  37(1): 123–151.
[20]Betrán E, Wang W, Jin L, Long MY. Evolution of the Phosphoglycerate mutase  processed  gene  in   human   and chimpanzee revealing the origin of  a  new  primate gene. Mol Biol Evol, 2002, 19(5): 654–663.
[21]Zheng DY, Gerstein MB. A computational approach for identifying pseudogenes in the ENCODE regions. Genome Biol, 2006, 7(Suppl. 1): S13.
[22]Zheng DY, Frankish A, Baertsch R, Kapranov P, Reymond A, Choo SW, Lu Y, Denoeud F, Antonarakis SE, Snyder M, Ruan YJ, Wei CL, Gingeras TR, Guigó R, Harrow J, Gerstein    MB.    Pseudogenes    in    the    ENCODE regions: consensus annotation, analysis  of  transcription, and evolution. Genome Res, 2007, 17(6): 839–851.
[23]Molineris I, Sales G, Bianchi F, Di Cunto F, Caselle M. A new approach for the identification of processed pseudogenes. J Comput Biol, 2010, 17(5): 755–765.
[24]Harrow J, Frankish A, Gonzalez JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S, Barnes I, Bignell A, Boychenko V, Hunt T, Kay M, Mukherjee G, Rajan J, Despacio-Reyes G, Saunders G, Steward C, Harte R, Lin M, Howald C, Tanzer A, Derrien   T, Chrast J, Walters N, Balasubramanian S, Pei BK,  Tress M, Rodriguez JM, Ezkurdia I, Van Baren J, Brent M, Haussler D, Kellis M, Valencia  A,  Reymond A,  Gerstein M, Guigó R, Hubbard TJ.  GENCODE:  the  reference human genome annotation for The ENCODE Project. Genome Res, 2012, 22(9): 1760–1774.
[25]Pei BK, Sisu C, Frankish A, Howald C, Habegger L,  Mu XJ, Harte R, Balasubramanian S, Tanzer A, Diekhans M, Reymond A, Hubbard TJ, Harrow J, Gerstein MB. The GENCODE pseudogene resource. Genome Biol, 2012, 13(9): R51.
[26]Kalyana-Sundaram S, Kumar-Sinha C, Shankar S, Robinson DR, Wu YM, Cao XH, Asangani IA, Kothari V, Prensner JR, Lonigro RJ, Iyer MK,  Barrette  T,  Shanmugam A, Dhanasekaran SM, Palanisamy N, Chinnaiyan AM. Expressed pseudogenes in the transcriptional landscape of human cancers. Cell, 2012, 149(7): 1622–1634.
[27]Korneev SA, Kemenes I, Bettini NL, Kemenes G, Staras K, Benjamin PR, O'shea M.  Axonal  trafficking  of  an antisense RNA  transcribed  from  a  pseudogene  is regulated by classical conditioning. Sci  Rep,  2013,  3:  1027.
[28]Rutnam ZJ, Du WW, Yang WN, Yang XL, Yang BB. The pseudogene TUSC2P promotes TUSC2 function by binding multiple microRNAs. Nat Commun, 2014, 5: 2914.
[29]Borrmann L, Wilkening S, Bullerdiek J. The expression of HMGA genes is regulated by their 3 ' UTR. Oncogene, 2001, 20(33): 4537–4541.
[30]Chiefari E, Iiritano S, Paonessa F, Le Pera I, Arcidiacono  B, Filocamo M, Foti D, Liebhaber SA, Brunetti A. Pseudogene-mediated posttranscriptional silencing of HMGA1 can result in insulin resistance and type 2  diabetes. Nat Commun, 2010, 1: 40.
[31]Watanabe T, Totoki Y, Toyoda A, Kaneda M, Kuramochi-Miyagawa S, Obata Y, Chiba H, Kohara Y, Kono T, Nakano T, Surani MA, Sakaki Y, Sasaki H. Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes. Nature, 2008, 453(7194): 539–543.
[32]Chan WL, Yuo CY, Yang WK, Hung SY, Chang YS, Chiu CC, Yeh KT, Huang HD, Chang JG. Transcribed  pseudogene ψPPM1K generates endogenous siRNA to suppress oncogenic cell growth in hepatocellular carcinoma. Nucleic Acids Res, 2013, 41(6): 3734–3747.
[33]Eichenlaub MP, Ettwiller L. De novo genesis of enhancers in vertebrates. PLoS Biol, 2011, 9(11): e1001188.
[34]Dierick HA, Mercer JFB, Glover TW. A phosphoglycerate mutase brain isoform (PGAM1) pseudogene is localized within the human Menkes disease gene (ATP7A). Gene, 1997, 198(1–2): 37–41.
[35]Fishman GI, Eddy RL, Shows TB, Rosenthal L, Leinwand LA. The human connexin gene family of gap junction proteins: distinct chromosomal locations but similar structures. Genomics, 1991, 10(1): 250–256.
[36]Kandouz M, Bier A, Carystinos GD, Alaoui-Jamali MA, Batist  G.  Connexin43  pseudogene  is   expressed   in tumor cells and inhibits growth. Oncogene, 2004, 23(27): 4763–4770.
[37]Porter KA, Duffy EB, Nyland P, Atianand MK, Sharifi H, Harton   JA.   The   CLRX.    1/NOD24    (NLRP2P) pseudogene codes a functional negative regulator of NF-κB, pyrin-only protein 4. Genes Immun, 2014, 15(6): 392–403.
[38]Zheng DY, Gerstein MB. The ambiguous boundary between genes and pseudogenes: the dead rise up, or do they? Trends Genet, 2007, 23(5): 219–224.
[39]Han L, Yuan Y, Zheng SY, Yang Y, Li  J,  Edgerton ME, Diao LX, Xu YX, Verhaak RGW, Liang H.  The  Pan-Cancer   analysis   of    pseudogene    expression reveals biologically and clinically relevant tumour subtypes. Nat Commun, 2014, 5: 3963.
[40]Lin H, Shabbir A, Molnar M, Lee T. Stem cell regulatory function mediated by expression of a novel mouse Oct4 pseudogene. Biochem Biophys Res Commun, 2007, 355(1): 111–116.
[41]Zhao SD, Yuan QH, Hao HB, Guo YJ, Liu SM, Zhang YM, Wang JL, Liu HJ, Wang FW, Liu K, Ling EA, Hao AJ. Expression of OCT4 pseudogenes in human  tumours: lessons from glioma and breast carcinoma. J Pathol, 2011, 223(5): 672–682.
[42]Redshaw Z, Strain AJ. Human haematopoietic stem cells express Oct4 pseudogenes and lack the ability to initiate Oct4 promoter-driven gene expression. J Negat Results Biomed, 2010, 9(1): 2.
[43]Guo XP, Tang YM. OCT4 pseudogenes present in human leukemia cells. Clin Exp Med, 2012, 12(4): 207–216.
[44]Kastler S, Honold L, Luedeke M, Kuefer R, Möller P, Hoegel J, Vogel W, Maier C, Assum G. POU5F1P1, a putative cancer susceptibility gene, is overexpressed in prostatic carcinoma. Prostate, 2010, 70(6): 666–674.
[45]Poliseno L. Pseudogenes: Newly discovered players in human cancer. Sci Signal, 2012, 5(242): re5.
[46]Wang L, Guo ZY, Zhang R, Xin B, Chen R, Zhao J, Wang  T, Wen WH, Jia LT, Yao LB, Yang AG. Pseudogene OCT4-pg4 functions as a natural micro RNA sponge to regulate OCT4 expression by competing for miR-145 in hepatocellular carcinoma. Carcinogenesis, 2013, 34(8): 1773–1781.
[47]Prensner JR, Chinnaiyan AM. The emergence of lncRNAs in cancer biology. Cancer Discov, 2011, 1(5): 391–407.
[48]Han YJ, Ma SF, Yourek G, Park YD, Garcia JGN. A transcribed pseudogene of MYLK promotes cell proliferation. FASEB J, 2011, 25(7): 2305–2312.
[49]Gherman A, Chen PE, Teslovich TM, Stankiewicz P,  Withers M, Kashuk CS, Chakravarti A, Lupski JR, Cutler DJ, Katsanis N. Population bottlenecks as a potential major shaping force of human genome architecture. PLoS Genet, 2007, 3(7): e119.
[50]Samaan S, Lichner Z, Ding Q, Saleh C, Samuel  J, Streutker C, Yousef GM. Kallikreins are involved in an miRNA network that contributes to prostate cancer progression. Biol Chem, 2014, 395(9): 991–1001.
[51]Poliseno L, Haimovic A, Christos PJ, Vega YSDMEC,
Shapiro R, Pavlick A, Berman RS, Darvishian F, Osman I. Deletion of PTENP1 pseudogene in human melanoma. J Invest Dermatol, 2011, 131(12): 2497–2500.
[52]Liu L, Liu Y, Liu JB, Zhai XJ, Wen J, Xie KP, Shen HB, Hu ZB, Fan ZN. Genetic variants in pseudogene E2F3P1 confer risk for HBV-related hepatocellular carcinoma in a Chinese population. J Biomedical Res, 2013, 27(3): 215–219.
[53]Pan Y, Sun CQ, Huang MD, Liu Y, Qi FZ, Liu L, Wen  J, Liu JB, Xie KP, Ma HX, Hu ZB, Shen HB. A  genetic  variant in pseudogene E2F3P1 contributes to prognosis of hepatocellular carcinoma. J Biomedical Res, 2014, 28(3): 194–200.
[54]Zhang JY, Wang X, Li MX, Han J, Chen B, Wang B, Dai JW. NANOGP8 is a retrogene expressed in cancers. FEBS J, 2006, 273(8): 1723–1730.
[55]Jeter CR, Badeaux M, Choy G, Chandra D, Patrawala L, Liu C, Calhoun-Davis T, Zaehres H, Daley GQ, Tang DG. Functional evidence that the self-renewal gene NANOG regulates human tumor development. Stem Cells, 2009, 27(5): 993–1005.
[56]Bier A, Oviedo-Landaverde I, Zhao J, Mamane Y, Kandouz M, Batist G. Connexin43 pseudogene in breast cancer cells offers a novel therapeutic target. Mol Cancer Therapeutics, 2009, 8(4): 786–793.
[57]Liu Y, Wang ZQ, Li HM, Wu ZP, Wei F, Wang HP. Role of the ERas gene in gastric cancer cells. Oncol Rep, 2013, 30(1): 50–56.
[58]Piehler AP, Hellum M, Wenzel JJ, Kaminski E, Haug KB, Kierulf P, Kaminski WE. The human ABC transporter pseudogene family: Evidence for transcription and gene-pseudogene interference. BMC Genomics, 2008, 9: 165.
[59]Zou M, Baitei EY, Alzahrani AS, Al-Mohanna F, Farid NR, Meyer B, Shi Y. Oncogenic activation of MAP kinase by BRAF pseudogene in thyroid tumors. Neoplasia, 2009, 11(1): 57–65.
[60]Weakley SM, Wang H, Yao QZ, Chen CY. Expression and function of a  large  non-coding  RNA  gene  XIST  in human cancer. World J Surg, 2011, 35(8): 1751–1756.
[61]Duret L, Chureau C, Samain S, Weissenbach J, Avner P.  The Xist RNA gene evolved in eutherians by pseudogenization of a protein-coding gene. Science, 2006, 312(5780): 1653–1655.