De Novo Transkriptom Assambleyasi va Cistanche Deserticola Fleshy Poyasining genini kashf qilish - Ⅰ
Sep 18, 2024
Fonlar
Cistanche deserticola katta dorivor ahamiyatga ega bo'lgan mutlaqo fotosintetik bo'lmagan parazit o'simlik bo'lib, asosan Shimoliy-G'arbiy Xitoy cho'lida tarqalgan. Uning quritilgan go'shtli poyasi hal qiluvchi tonik hisoblanadian'anaviy xitoy tibbiyotiasosan erkaklar jinsiy funktsiyasini yaxshilash va immunitetni mustahkamlash rollari bilan, ammo qisman genomik va transkriptomik resurslarning etishmasligi tufayli bir nechta mexanik tadqiqotlar o'tkazildi.

NATURAL CISTANCHE TUBULOSA XItoy an'anaviy tibbiyoti PHGS75% ECH 30% ACT 12%
Natijalar
Ushbu tadqiqotda biz C. deserticola ning go‘shtli poyasida chuqur transkriptom sekvensiyasini amalga oshirdik va HiSeq2000 platformasida Illumina juft uchli sekvensiyasi yordamida taxminan 80 million o‘qish hosil qilindi. Trinity assemblerdan foydalanib, biz 200bp dan 15698bp gacha bo'lgan, o'rtacha uzunligi 950 ta bazaga va N50 uzunligi 1519 ta asosga ega bo'lgan 95 787 ta transkript ketma-ketligini oldik. 63 957 ta transkript FPKM 0,5 dan katta yoki unga teng faol ifodalanganligi aniqlandi, ularda 30 098 ta transkript bir nechta ommaviy ma'lumotlar bazalariga (NCBI va KEGGda Uniprot, NR va Nt) nisbatan ketma-ketlik o'xshashligi tahlillari orqali gen tavsiflari yoki gen ontologiyasi atamalari bilan izohlangan. . Bundan tashqari, biz asosiy faol moddalar bo'lgan lignin va feniletanoid glikozidlar (PhGs) biosintezida ishtirok etadigan asosiy ferment genlarini aniqladik. To'rtta fenilalanin ammiak-liyaza (PAL) geni, lignin va PhG biosintezidagi birinchi asosiy ferment ketma-ketlikni taqqoslash va filogenetik tahlil asosida aniqlandi. PhGlarning ikkita biosintez yo'li ham birinchi marta taklif qilingan.
Xulosa
Umuman olganda, biz RNK-seq texnologiyasidan foydalangan holda C. deserticola go'shtli ildiz transkriptomining global tahlilini yakunladik. Yig'ilgan va izohlangan transkriptlardan lignin va feniletanoid glikozidlarning biosintezi bilan bog'liq ferment genlarining to'plami aniqlandi va PAL gen oilasi ham bashorat qilindi. Ushbu tadqiqotdan olingan ketma-ketlik ma'lumotlari kelajakda feniletanoid glikozidlar biosintezi tadqiqotlari va ushbu muhim dorivor o'simlikda funktsional genomik tadqiqotlar o'tkazish uchun qimmatli manba bo'ladi.
Kirish
C. deserticola — Orobanchaceae oilasiga mansub koʻp yillik choʻl oʻsimliklarining butun dunyo boʻylab turi boʻlib, butunlay fotosintetik boʻlmagan tur boʻlib, odatda er ostidagi holoparazit oʻsimliklar oʻsadi. Qurgʻoqchilik va shoʻrlanishga yuqori chidamliligi tufayli, asosan, choʻl va chala choʻllarda yashaydigan psammofit Haloxylon ammodendron (Chenopodiaceae) ildizlarida parazitlik qiladi. C. deserticola og'ir ekologik sharoitlarga kuchli qarshilik ko'rsatadi va asosan Shimoliy-G'arbiy Xitoyda, ayniqsa Ichki Mo'g'uliston, Gansu va Shinjonda tarqalgan. So'nggi yillarda odamlar tomonidan ko'proq iste'mol qilinganligi sababli yo'qolib ketish xavfi ostidagi yovvoyi tur hisoblanadi. Ko'pincha cho'l jenshen deb ataladigan C. deserticola odatda cho'l-supurgi sifatida tanilgan va quritilgan go'shtli poyasi ko'p yillar davomida Xitoy va Yaponiyada an'anaviy muhim tonik sifatida keng qo'llanilgan. Dastlab u taxminan 1800 yil oldin Shen Nong Ben Cao Jing (Xitoy Materia Medica lug'ati, 1977) da qayd etilgan va asosiy manbalardan biri sifatida qabul qilingan.Xitoy dorivor o'ti Cistanche.

JINSIY FUNKSIYANI YASHLASHTIRISH UCHUN TABIY CISTANCHE TUBULOSA PHGS75% ECH 30% ACT 12%
C. deserticolaning ekstraktlari ko'plab dorivor funktsiyalarga ega, ayniqsa jinsiy funktsiyani yaxshilash, buyraklarni tonlash, jigarni himoya qilish, aperient faolligini oshirish, xotirani kuchaytirish, immunomodulyator, antioksidant faollik, yallig'lanishga qarshi, virusga qarshi faollik va boshqalar. C. deserticola ning asosiy bioaktiv komponentlari feniletanoid glikozidlardir (PheGs, PhGs). Hozirgi kunga qadar C.deserticola ning suvli poyasidan 20 dan ortiq feniletanoid glikozidlar ajratilgan. Ular orasida,akteozid va echinacosidemuhim farmakologik faoliyatga ega bo'lgan ikkita asosiy komponent bo'lib, Xitoy farmakopiyasida (2005 va 2010 nashrlarida) C. deserticolaning sifat standartlari sifatida hujjatlashtirilgan. PhGlarning uchta kimyoviy komponenti organik kislota, saxarid va feniletanoiddir, ammo feniletanoidning biosintetik yo'llari bilan bog'liq tafsilotlar C.deserticolada yaxshi tushunilmagan.
C.deserticola ning tijorat va dorivor ahamiyatiga qaramasdan, bu turning genomik va transkriptomik ma'lumotlari juda cheklangan. NCBI ma'lumotlar bazasida EST mavjud emas va bu tur uchun to'liq genom ma'lumotlari xloroplast genomlari ketma-ketligidan tashqari mavjud emas. Cheklangan transkriptomik ma'lumotlar PhG biosintetik mexanizmlarini o'rganishga to'sqinlik qiladi. RNK-seq texnologiyasi maqsadli genomning ifodalangan qismlari ketma-ketligini yaratishi va NGS texnologiya platformalari (masalan, Applied Biosystems SOLiD, Illumina HiSeq va Roche 454) yordamida genlarni aniqlashi mumkin [18]. Bu transkriptome de novo assambleyasida tobora ommalashib bormoqda, chunki bu yuqori aniqlik va keng dinamik diapazonga ega iqtisodiy jihatdan samarali va kuchli yondashuv, ayniqsa, kam miqdordagi transkriptlarni o'rganish uchun afzalliklarga ega. Turli xil afzalliklarga ega bo'lganligi sababli, RNK-seq cheklangan genetik resurslarga ega bo'lgan model bo'lmagan organizmlar uchun ayniqsa jozibali. Biroq, RNK-seq tomonidan C. deserticola transkriptomasi bo'yicha batafsil tadqiqot yo'q.
Ushbu tadqiqotda biz Illumina Hiseq2000 platformasidan foydalangan holda C. deserticola uchun ildiz transkriptomini global miqyosda ketma-ketlashtirdik va 7,9G xom ma'lumotga ega bo'ldik. Yig'ish va izohlash orqali biz PhG biosintezida ishtirok etadigan genlarni va butun lignin biosintezi uchun mas'ul genlarni qazib oldik. Bizning RNK-seq tahlilimiz birinchi C. deserticola konsensus transkriptomini yaratdi va C. deserticola ning dorivor qiymatini har tomonlama tushunishga yangi tushunchalar berdi. Bundan tashqari, bu erda tasvirlangan usul juda cheklangan genomik resurslarga ega bo'lgan boshqa dorivor o'simlikda o'ziga xos dorivor komponentlar biosintezi yo'llarida ishtirok etadigan genlarni kashf qilishni osonlashtirish uchun profil transkriptomlariga keng qo'llanilishi mumkin.
Materiallar va usullar
O'simlik materiallarini yig'ish
Qazish bosqichida C. deserticola uchun yangi suvli poya Xitoyning shimoli-g'arbiy qismidagi Ichki Mo'g'ulistondagi Alxa Ligasining BayanHot shahridagi o'simlik bazasidan yig'ilgan. Yig'ish uchun ruxsat zavod bazasining egasidan (HongKui CongRong Group) olingan. Vaucher namunasi Xitoy Fanlar akademiyasi Pekin Genomika Institutidagi Yadro genomik muassasasiga saqlangan. Tozalashdan so'ng, suvli ildiz to'qimalari mayda bo'laklarga bo'linib, darhol suyuq azotda muzlatilgan va keyingi ishlov berishgacha -80 darajada saqlanadi.
RNK ekstraktsiyasi, cDNK kutubxonasi qurilishi va Illumina ketma-ketligi
Jami RNK ishlab chiqaruvchining ko'rsatmalariga muvofiq TRIzol reagenti (Invitrogen Inc., Kaliforniya, AQSh) yordamida suvli poyadan olingan. Olingan namunalar har qanday genomik DNKni olib tashlash uchun DNase I bilan ishlov berildi. Ekstraksiya qilingan RNKlar Agilent 21{10}}0 bioanalizatori (Agilent Technologies) yordamida miqdori aniqlandi va etidiy bromid bilan bo‘yash bilan denaturatsiya qiluvchi agaroz gel elektroforezi yordamida yaxlitligi tekshirildi. Keyingi tahlillarda A260/A280 nisbati 1,9 va 2,1, RNK 28S:18S nisbati 1,0 dan yuqori va RNK yaxlitlik raqamlari (RIN) -8,5 bo'lgan RNK namunalari ishlatilgan.
RNK-seq kutubxonalari Illumina Truseq RNK namunalarini tayyorlash to'plamlari yordamida yaratilgan. Poly(A)+ RNK ishlab chiqaruvchining ko'rsatmalariga muvofiq Dynal ligo(dT)25 boncuklari yordamida umumiy RNKdan ajratilgan. Tozalashdan so'ng, mRNKni qisqa bo'laklarga bo'lish uchun parchalanish buferi qo'shildi. Birinchi zanjirli cDNK ushbu qisqa fragmentlardan SuperScript III teskari transkriptaza va N6 tasodifiy heksamer primeri bilan birga shablon sifatida sintez qilindi. Keyin ikkinchi zanjirli cDNK bufer, dNTPs, RNaseH va DNK polimeraza I yordamida sintez qilindi. Natijada paydo bo'lgan ikki zanjirli cDNK T4 DNK polimeraza, DNK polimeraza I Klenow fragmenti va T4 polinukleotid kinaz yordamida so'nggi reparatsiyaga duchor qilindi va bog'langan. T4 DNK ligazasidan foydalanadigan adapterlar. Adaptor bilan bog'langan fragmentlar QiaQuick PCR ekstraksiya to'plami yordamida tozalandi va EB buferi bilan elutsiya qilindi. Agaroz gel elektroforezi yordamida tahlil qilingandan so'ng, mos bo'laklar PCR kuchaytirilishi uchun shablon sifatida tanlangan. Olingan cDNK kutubxonasining ketma-ketligi Illumina HiSeq 2000 tizimi yordamida amalga oshirildi.
Transkriptlar de novo assambleyasi va gen ifoda miqdorini aniqlash
Tartiblash natijasida hosil bo'lgan xom o'qishlar ichki usul yordamida adapter ketma-ketliklarini (ATCTCGTATGCCGTC) olib tashlash orqali tozalandi. Keyin biz qattiq past sifatli filtrlash jarayonini amalga oshirdik. Birinchidan, phred sifat ko'rsatkichi 20 dan past bo'lgan bazalar ketma-ketlikning 3' oxiridan yuqori sifatga ega (20 dan katta yoki unga teng) bitta bazaga kirgunga qadar qisqartiriladi. Agar o'qish uzunligi 50bp dan qisqa bo'lsa, u bekor qilinadi. Ikkinchidan, o'qishlar bitta o'qishdagi bazalarning 70% yuqori sifatli ballga ega bo'lgan mezon bo'yicha filtrlanadi (20 dan katta yoki teng). Uchinchidan, keyingi yig'ish uchun faqat juftlashtirilgan o'qishlar ishlatilgan. De novo transkript yig'ilishi Trinity reliz_20130216 [30] yordamida amalga oshirildi, u uchta ketma-ket dasturiy ta'minot modullaridan iborat: Inchworm, Chrysalis va Butterfly. Yig'ish parametrlari quyidagicha o'rnatildi:-seqType fq-JM 300G -min_contig_uzunligi 200-CPU 20-inchworm_cpu {{21} }bflyCPU 20.
Transkriptning ko'pligini aniqlash uchun ketma-ketlashtirilgan juftlik o'qishlari Trinity'dagi skript yordamida yig'ilgan transkriptlarga qayta moslashtirildi. Xaritalangan o'qishlar RSEM (RNA-Seq by Expectation Maximization) dasturi tomonidan miqdoriy aniqlash uchun ishlatilgan. Gen yoki izoformning ko'pligi har bir million fragment xaritalangan (FPKM) qiymatidagi transkriptning kilobazasi uchun fragment bilan ifodalangan, FPKM qiymati 0.05 ga teng yoki undan katta bo'lgan transkriptlar ifodalangan sifatida belgilangan.
Ko'rsatilgan transkriptlarning funktsional annotatsiyasi
C. deserticolaning xloroplast genomidan tashqari hech qanday gen annotatsiyasi mavjud emas [1]. Biz BLAST dasturi (E< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.
Gen ontologiyasi va KEGG yoʻli annotatsiyasi Uniprot maʼlumotlar bazasiga ketma-ketlik oʻxshashligi boʻyicha (barcha yigʻilgan transkriptlarning Gen Ontologiyasi (GO) izohi (ftp://ftp.ebi.ac.uk/pub/) dan yuklab olingan assotsiatsiya fayli yordamida olingan. ma'lumotlar bazalari/GO/goa/UNIPROT/gen_assotsiatsiyasi. goa{1}}uniprot.gz). CC, BP va MF toifalari alohida.
KEGG yo'li haqidagi ma'lumot KAAS (KEGG Avtomatik izoh serveri) [34] onlayn vositasi yordamida barcha prognoz qilingan oqsil ketma-ketligi uchun tayinlangan. Fasta formatidagi ketma-ketliklar KAAS so'roviga yuborildi va natijada C. deserticola ildiz transkriptomiga tegishli barcha yo'llar ma'lumotlarining fayllari yuklab olindi. KEGGdagi 13 ta o'simlik organizmlari genlari to'plamidan BBH (ikki yo'nalishli eng yaxshi zarba) usuli yordamida izohlash uchun foydalanilgan.

NATURAL CISTANCHE TUBULOSA CISTANCHE EKSTRAKT PHGS75% ECH 30% ACT 12%
RT-qPCR tahlili
DNase I bilan hazm qilingandan so'ng, umumiy RNKning taxminan 5ug oligo(dT)15 primerlari va GoScript teskari transkripsiya tizimi (Promega) bilan teskari transkripsiya reaktsiyasi orqali birinchi zanjirli cDNKga aylantirildi. Keyin cDNK mahsulotlari real vaqtda PCRda shablon sifatida foydalanishdan oldin nukleazsiz deionlangan suv bilan 10- barobar suyultirildi. Maxsus cDNKlar GoTaq 2-Step RT-qPCR tizimi (Promega) tomonidan 20 ul hajmda kuchaytirildi. PCR kuchaytirilishi ishlab chiqaruvchining ko'rsatmalariga muvofiq 7500 Real-Time PCR Detection System (Applied Biosystems) bilan 60 daraja tavlanish haroratida amalga oshirildi. Nisbiy transkript ko'pligi 7500 Manager dasturidan foydalangan holda ichki standart sifatida "comp{13}}c0" geni bilan qiyosiy sikl chegarasi usuli bilan hisoblab chiqilgan.
RT-PCR uchun primer juftliklari onlayn dasturiy ta'minot (http://primer3.ut.ee/) asosida ishlab chiqilgan va S1 ma'lumotlar to'plamida keltirilgan.
Natijalar
C. deserticola go'shtli poyasining RNK ketma-ketligi va de novo transkriptom yig'ilishi
C. deserticolaning poyasi ko'p yillar davomida Xitoy va Yaponiyada an'anaviy muhim tonik sifatida keng qo'llanilgan. C. deserticola go'shtli poyasida gen ekspressiyasining global ko'rinishini olish uchun biz mos ravishda 2013 va 2014 yillarda bir xil o'simlik bazasidan C. deserticola poyasi namunalarini to'pladik. Umumiy RNKlar ajratib olindi va poliA+ RNKlar juft uchli RNK-seq kutubxonalarini yaratish uchun tozalandi. Illumina HiSeq 2000 sekvensiyasi yordamida ketma-ketlikning qariyb 8 milliard va 8,6 milliard asosiga mos keladigan 79 433 734 va 86 019 176 juftlik koʻrsatkichlari olindi.

platformasi 2013-yil va 2014-yil namunalarida (1-jadval). Adapter ketma-ketligini olib tashlaganingizdan va past sifatli o'qishlarni filtrlaganingizdan so'ng (batafsilroq usullarga qarang), 2013- yil namunasidagi 64 831 040 ta yuqori sifatli juftlik o'qishlari de novo transkriptom yig'ish uchun ishlatilgan. Trinity sequence assembler [30] yordamida transkript uzunligi 200 dan 15 698 bp gacha bo'lgan 51 719 gen va 95 787 transkript ketma-ketligi yaratildi. Yig'ilgan transkriptlarning o'rtacha uzunligi 950 ta bazani, N50 uzunligi esa 1519 tani tashkil qiladi. Turli uzunlikdagi transkriptlar soni yig'ilgan transkriptlarning 57,32% taxminan 500 bp yoki undan ko'proq ekanligini ko'rsatdi (1A-rasm). 2014-Yil namunasidagi yuqori sifatli juftlik oʻqishlari yigʻilgan transkriptom bilan taqqoslandi. Bundan tashqari, biz har bir yig'ilgan gen uchun transkript raqami turlicha ekanligini va genlarning 69% bitta ifodalangan izoformga ega ekanligini, 31% genlar esa ikki yoki undan ortiq transkriptni ifodalaganligini aniqladik (1B-rasm).
Yig'ilgan transkriptlarning ifoda miqdori va funktsional annotatsiyasi
Gen yoki transkriptning ko'pligi RSEM to'plami yordamida aniqlandi, unda ketma-ket o'qishlar yig'ilgan genlar yoki Bowtie yordamida transkriptlar ketma-ketligiga qayta moslashtirildi va bu xaritalangan o'qishlar miqdoriy aniqlash uchun ishlatilgan. Har bir gen yoki transkript uchun FPKM qiymati hisoblab chiqildi va nihoyat, biz 63,957 va 52,857 faol ifodalangan transkriptlarni (FPKM qiymati 0.5 dan katta yoki unga teng) aniqladik. }13 va 2014 yil. 44 776 transkript (2013-yil namunasida 70,01%, 2014-yil namunasida 84,71%) odatda ikkita takrorlashda ifodalangan va ularning ifoda ma’lumotlarining korrelyatsiyasi (Pirson korrelyatsiya koeffitsienti: 0,91979) edi. S1-rasmda ko'rsatilgan. Tartiblash xom ashyosi NCBI SRA ma'lumotlar bazasiga yuklangan edi (kirish raqamlari: SRX857402 va SRX858938). Biz keyingi tahlil uchun 2013-yil namunasida aniqlangan ekspress genlardan foydalandik. Barcha ifodalangan transkriptlar uchun funktsional annotatsiya ma'lumotlari ikkita usul yordamida olingan. Birinchidan, barcha ifodalangan transkriptlar BLAST algoritmi bo'yicha ma'lum nukleotid (GenBank nt) va peptid ketma-ketligi ma'lumotlar bazalariga (GenBank nr va Arabidopsis peptidlari) alohida moslashtirildi. 63 957 ta ifodalangan transkriptdan,

29 220 ta (45,7%) izohlangan va E-qiymat chegarasi 1e-20 boʻlgan uchta mavzu maʼlumotlar bazasidan birida ketma-ketliklarga oʻxshashlik koʻrsatgan. Shu bilan birga, TransDecoder dasturi yordamida barcha ifodalangan transkript ketma-ketliklari uchun nomzod kodlash hududlari bashorat qilingan va har bir transkript uchun eng uzun ORFlar Pfam domenini qidirish uchun ishlatilgan. Natijada, Pfam ma'lumotlar bazasi asosida 21 358 ta (33,4%) transkriptga izoh berildi. Umuman olganda, 30 098 (47,1%) transkript yuqoridagi ikkita usulni birlashtirgan holda ommaviy ma'lumotlar bazalarida ma'lum genlarga sezilarli darajada mos keldi. Funktsiya izohlari bilan ifodalangan to'liq transkriptlar ro'yxati qo'shimcha ma'lumotlarda (S2 Dataset) ko'rsatilgan.
Biz barcha ketma-ket o'qishlarning 18,99% ga to'g'ri keladigan 20 ta eng yuqori ifodalangan transkriptni (2-jadval) o'rganib chiqdik va ularning aksariyati abiotikaga javob beradigan genlar ekanligini aniqladik.

stress stimuli. Degidrin (DHNs), gidrofilik va termostabil stressli oqsillar sinfi bo'lib, ular ko'p miqdorda zaryadlangan aminokislotalarga ega bo'lib, II guruh kech embriogenezning mo'l-ko'l (LEA) oilasiga tegishli bo'lib, eng yuqori darajada ifodalangan gendir. Uch xil Degirin transkripti (komp{0}}c0_seq1/2/4) go'shtli poyalarda yuqori darajada ifodalanganligi aniqlandi, ular hujayralarni qurg'oqchilik stressi natijasida etkazilgan zarardan himoya qilishda ishtirok etishi mumkin. Issiqlik zarbasi oqsili, patogen bilan bog'liq protein va metallotionin kabi stress bilan bog'liq boshqa genlar ham yuqori darajada ifodalangan, bu uning og'ir omon qolish muhiti bilan bog'liq bo'lishi mumkin. Bundan tashqari, ba'zi konstitutsiyaviy genlar, shu jumladan 26S ribosoma RNK geni (komp22329_c2_seq1), aoksin bilan bostirilgan/dormansiya bilan bog'liq oqsil (kom20999_c0_seq1), ADP-ribosilatsiya omili (komp20499_ c0_seq1) ham yuqori darajada transkripsiyalangan.

Immunitetni yaxshilash uchun TABIY CISTANCHE TUBULOSA PHGS75% ECH 30% ACT 12%







