睡莲的细胞器基因组和转录组联合分析
2022/5/3 来源:不详北京中科白癜风医院有治好的吗 http://m.39.net/news/ylzx/bjzkhbzy/
本文是Zheng-ShanHe,AndanZhu,Jun-BoYang,WeishuFan,andDe-ZhuLi
来自UniversityofChineseAcademyofSciences发表的,研究内容是睡莲的细胞器基因组和转录组相关的内含子剪接和RNA编辑等。文章发表时间年9月11日,杂志《MolecularSciences》,影响因子5.(Q1)。
摘要:
转录后修饰,包括内含子剪接和RNA编辑,是常见的植物细胞器基因组中基因表达调控的过程。然而,内含子剪接的中间产物,以及内含子剪接和RNA编辑之间的相互作用仍不清楚。大多数细胞器转录组分析基于Illumina短读无法捕获细胞器内转录中间产物的全谱。使用PacBioDNAseq和Isoseq,以及Illumina短读基因组和用于组装睡莲叶绿体和线粒体基因组的转录组测序数据。叶绿体和线粒体基因组中分别鉴定了98个和个RNA编辑位点。两种细胞器中的密码子偏好、增加蛋白质疏水性的趋势以及编辑位点的偏差分布相似,表明了它们共同的进化起源和共同的编辑机制。
材料和方法01材料从萌芽的花朵中收集新鲜的花瓣和雄蕊,并在液氮中快速冷冻。使用改良的十六烷基三甲基溴化铵(CTAB)方案提取总DNA,并用于基因组测序。PacBioSequel平台对五个SMRT细胞进行测序(SequelTM测序试剂盒1.2.1)。使用IlluminaTruSeq纳米DNA文库制备试剂盒制备了大小为bp的插入物并通过IlluminaHiseqXTen在Nextomics进行2×bp双端(PE)测序。
使用Iso-seq、IlluminaRNA序列测定(RNA-seq)和链特异性RNA-seq(ssRNA-seq)来评估转录本转录后修饰导致的多样性。对于Iso-seq,来自五个组织的总RNA(雄蕊、子房、幼叶、须根、根茎)
02方法Organelle_PBA成功组装。GetOrganelle未能组装叶绿体。NOVOPlasty成功组装。考虑到PacBio的易出错特性,通过NOVOPlasty组装的作为最后的结果。
通过HISAT2,samtools,SNP-callinginbcftools,REDOv1.0,Trinity得到RNA编辑位点。
结果与讨论:通过NOVOPlasty组装的叶绿体基因组(bp)。基因组最终线粒体基因组为bp。LSC,bp)区域和一个小的单拷贝区域组成拷贝区(SSC,bp)和一对反向重复序列(IRs,bp)。叶绿体基因组中有个独特基因(IR中有17个重复基因),包括4个rRNA,30个tRNA和80个蛋白质编码基因。有丝分裂基因组有65个独特的基因,包括3个rRNA,21个tRNA,和41个蛋白质编码基因。
N.“JoeyTomocik”的线粒体基因组有65个独特的基因,包括3个rRNA,21个tRNA,
和41个蛋白质编码基因除了两个基因(rpl6和rps8)在所有被子植物中都不存在。与其他被子植物线粒体基因组相比,包括安博雷拉属、睡莲属、五味子属(澳大利亚亚目)和鹅掌楸,N.“JoeyTomocik”的线粒体基因组拥有最完整的基因组。
在所有个校正的全长Iso-seq转录本中,和个转录本被定位到叶绿体和线粒体。经过手动细化后,和个Iso-seq转录本用于共转录检测。
叶绿体和线粒体基因组中分别鉴定了21个和5个多顺反子转录单位(PTU)。将相邻的顺反式转录物连接成同样的PTU,我们最终在质体组和线粒体基因组中分别获得了18个和5个PTU。五个线粒体PTU覆盖了11个蛋白质编码基因
在种子植物的许多线粒体基因组中发现了rpl2-rps19-rps3簇,表明随着进化,保留一个保守的共转录基因簇。
检测到四个反式剪接事件(rps12-i1,nad1-i3、nad5-i2、nad5-i3)和其他三种反式剪接事件(nad1-i1、nad1-i4和nad2-i2)
我们的PTU分析显示rps12-50(外显子1和内含子1a)可以与上游clpP基因和下游rpl20基因,以及rps12-30(内含子1b,外显子2-内含子2-外显子3)可与下游rps7和ndhB基因(PTU11和PTU15)共转录。然而,转录(c/f1p0/)显示反式剪接事件,但顺式剪接内含子仍然未剪接。反式剪接可能发生在顺式剪接之前,这也在线粒体nad5中观察到。
在严格过滤程序之后我们最终确定了叶绿体和线粒体中98个和个RNA编辑位点分别为基因组。我们发现了一个RNA编辑系统rps12-i1(反式剪接内含子)中以前未报道的位点,
但我们没有在rps12-i2中检测到之前报道的两个位点。此外,没有发现编辑在tRNA或rRNA基因中的位点。
在叶绿体基因组中,有48、36和41个RNA编辑分别在Amborella、Nymphaea和鹅掌楸的编码基因中。在所有三个物种中,NDH、matK和clpP拥有最高密度的RNA编辑位点。对于单个基因,ndhD,rpoC1,matK,rpoB和ndhB拥有最多的编辑位点。
线粒体nad4中的RNA编辑位点内含子3下游6bp的外显子4,如果内含子3未拼接,则无法编辑。
在未剪接的前mRNA中,内含子-外显子连接附近的编辑位点可能是后期处理。这进一步明,某些基因的识别靶点可能是只有在内含子剪接后才能形成。
结论
观察到多个部分或完全内含子剪接的中间产物,这意味着顺式和反式剪接内含子都是随机剪接的。
利用链特异性RNA序列数据确定了睡莲细胞器基因组中的RNA编辑位点:直接调用SNP,然后通过转录本映射方法进行复查。通过比较根据两种细胞器中RNA编辑的特点,我们推断出一个共同的进化过程睡莲的叶绿体和线粒体可能共享起源和编辑机制。
除了一些被未剪接的内含子阻断的外显子位点,内含子和外显子区域的RNA编辑位点可能会同步剪接。
亮点
文章通过分析睡莲的叶绿体以及线粒体基因组,并通过转录组工作严谨而全面的分析的得到了rna编辑位点,避免了SNP杂声的干扰。并通过比较叶绿体和线粒体编辑位点的共有特征判断共有起源以及相同机理的RNA编辑机制。
END
出于对生命科学的热爱
对细胞器研究的着迷
我们创立了细胞器研究联盟