Bitki bilimi araştırması için kodlama yapmayan RNA'ların web tabanlı kaynaklarının kapsamlı bir derlemesi

Bitki bilimi araştırması için kodlama yapmayan RNA'ların web tabanlı kaynaklarının kapsamlı bir derlemesi
Yazıyı beğendiyseniz lütfen Paylaşın


açık Erişim Global erişim, daha yüksek etki

hem teşhis hem

Uluslararası Tıp Bilimleri Dergisi

Kanser Dergisi

Genomik Dergisi

Nanotheranostics

Oncomedicine

Biyomedikal Dergisi

PubMed Central

Dergi Etki Faktöründe Endeksli

Int J Biol Sci
2018; 14 (8): 819-832.
 doi: 10,7150 / ijbs.24593

gözden geçirmek

Peiran Liao1, *, Shipeng Li1, *, Xiuming Cui1,3, Yun Zheng2 Ilgili adres

1. Yaşam Bilimleri ve Teknolojisi Fakültesi, Kunming Bilim ve Teknoloji Üniversitesi, Kunming, Yunnan, 650500, Çin;
2. Yunnan Temel Primatik Biyomedikal Araştırma Laboratuvarı, Primat Çeviri Tıp Enstitüsü, Kunming Bilim ve Teknoloji Üniversitesi, Kunming, Yunnan, 650500, Çin;
3. Panax notoginseng, Kunming, Yunnan, 650500, Çin'deki Yunnan anahtar laboratuvarı.
* Bu yazarlar çalışmaya eşit katkıda bulundu.

Bu, Creative Commons Attribution (CC BY-NC) lisansı (https://creativecommons.org/licenses/by-nc/4.0/) kapsamında yayınlanan bir açık erişim makalesidir. Tüm şartlar ve koşullar için http://ivyspring.com/terms adresini ziyaret edin.

Nasıl
bu makaleden alıntı yapmak için:

Liao P, Li S, Cui X, Zheng Y. Bitki bilimi araştırması için kodlama yapmayan RNA'ların web tabanlı kaynaklarının kapsamlı bir derlemesi. Int J Biol Sci 2018; 14 (8): 819-832. doi: 10,7150 / ijbs.24593. Den mevcut
http://www.ijbs.com/v14p0819.htm

Kodlamayan RNA'lar (ncRNA'lar) genomdan kopyalanır, ancak proteinlere çevrilmez. Birçok ncRNA, bitkilerin büyümesi ve gelişmesi, metabolizması ve stres toleransının ana düzenleyicileridir. Bitki bilimi araştırması için web tabanlı ncRNA kaynaklarını daha kolay erişilebilir ve anlaşılabilir hale getirmek için, ncRNA verilerini içeren genom veritabanları, microRNA (miRNA) veritabanları ve uzun süre dahil üç türden 83 web tabanlı kaynak için kapsamlı bir derleme yaptık. kodlamayan RNA (lncRNA) veritabanları. Bu kaynakların etkili kullanımını kolaylaştırmak için, anlamlı analizler yapmak için tercih edilen bazı miRNA ve lncRNA kaynaklarını da önerdik.

Anahtar kelimeler: Kodlamayan RNA (ncRNA), microRNA (miRNA), uzun kodlama yapmayan RNA (lncRNA), web tabanlı kaynaklar, bitki

Kodlamayan RNA'lar (ncRNA'lar) genomdan kopyalanır, ancak proteinlere çevrilmez [1]. NcRNA'ların bazıları, bitkilerin büyümesinde ve gelişmesinde, metabolizmasında ve stres toleransında önemli rol oynar. [2, 3]. Şu anda, kodlamayan bitki RNA'sının araştırılması esas olarak iki alana odaklanır: mikroRNA'lar (miRNA'lar) ve küçük enterferans yapan RNA'lar (siRNA'lar dahil) ve uzun kodlayıcı olmayan RNA'lar (siRNA'lar dahil) uzunluğunda 50 nükleotitten (küçük) oluşan küçük RNA'lar ve lncRNA'lar) normal olarak uzun intergenik kodlamayan RNA'lar (lincRNA'lar), uzun intronic kodlamayan RNA'lar, dairesel RNA'lar (circRNA'lar) ve dairesel intronik RNA'lar (ciRNA'lar) dahil olmak üzere 200 nt'den daha uzun uzunluklara sahiptir. [4].

Şimdiye kadar, 60'dan fazla bitki ve birkaç model bitki dahil, 100'den fazla bitki genleri dizildi. [5]. Bunların çoğu gibi genom veritabanları ile sağlanır Arabidopsis [6, 7], buğday [8], pirinç [9, 10]soya fasulyesi [11] ve bunun gibi. Ekin veya model bitkilerin çoğu ncRNA'ları bu veritabanları kullanılarak bulunabilir. Ve genom veritabanları, ncRNA'ların fonksiyonlarını araştırmak ve genomik içerikleri aramak için kullanışlıdır. [12, 13]. Bu nedenle, genom veritabanları ncRNA çalışmalarında referans olarak yaygın şekilde kullanılmaktadır.

MikroRNA'lar (miRNA'lar), bitkilerde transkripsiyon seviyesinden gen ekspresyonunun düzenlenmesine katılan 18 ila 25 nt büyüklüğünde endojen tek zincirli ncRNA sınıfıdır. [14]. Bitki miRNA'ları genellikle genlerin kodlama bölgelerine bağlanır ve spesifik protein kodlama genlerinin bölünmesini veya translasyonal olarak baskılanmasını sağlayan yoğun olarak eşleşen tamamlayıcı bölgeler yoluyla bağlanır. [15]. Hücre döngüsü, farklılaşma ve metabolizma gibi birçok biyolojik süreci etkilerler [2, 3]. Artan kanıtlar, miRNA'ların organların gelişiminde ve stres yanıtlarında önemli rol oynadığını gösteriyor. [16].

Uzun kodlamayan RNA (lncRNA), uzunluğu 200 nt'den fazla olan ancak kodlama potansiyeli olmayan endojen ncRNA sınıfıdır. [17, 18]. Düşük ekspresyon ve sekans korunumlarından bu yana erken çalışmalarda lncRNA'lar göz ardı edilmiş olsa da, ortaya çıkan kanıtlar, çiçeklenme zamanının düzenlenmesi, gen susturma, kök organogenez, fide fotomorfojenezi ve üreme gibi çeşitli biyolojik işlemlerde birçok lncRNA'nın önemli olduğunu göstermektedir. [19-22].

Çalışmanın aşağıdaki bölümlerinde, web tabanlı bazı genom, miRNA ve lncRNA kaynaklarını gözden geçireceğiz. Sonra ncRNA'ların analiz yöntemlerini kısaca açıklıyoruz ve ilgili analizler için tercih edilen kaynakları tavsiye ediyoruz. Sonunda, faydalı bir web tabanlı bitki kapsamlı veritabanı olan Joint Genome Institute (JGI) Genome Portal'ı kısaca açıkladık. [23, 24].

Tablo 1'de listelendiği gibi, ilk önce genomik bilgi için 25 kaynak tanıtacağız.

Arabidopsis Bilgi Kaynağı (TAIR) [6, 7], Uluslararası Buğday Genomu Sıralama Konsorsiyumu (IWGSC) [8], Genomik Araştırma Enstitüsü (TIGR) / Michigan State Üniversitesi (MSU) Pirinç Açıklama Veritabanı [9, 10], MısırGDB [25, 26], SoyBase [27] veritabanları Arabidopsissırasıyla buğday, pirinç, mısır ve soya fasulyesi genomu. Kullanıcılar, genom dizilerini, gen açıklamalarını ve diğer veritabanlarını bu veritabanlarından indirebilir.

FunRiceGenes, yaklaşık 2.800 işlevsel zenginleştirme pirinç genini ve yaklaşık 5.000 farklı gen ailesinin üyesini topladı [28]Bu veritabanı, biyolojik yolak, gen fonksiyonel ek açıklama dahil araştırmacılar için pirinç gen fonksiyonlarına ayarlanmış daha ayrıntılı bir veri sunmaktadır.

Gen Ontolojisi (GO), 1998 yılında inşa edilen gen ürünlerini tanımlamak için bir küme ve korelasyon analiz veritabanıdır. Sıralama çalışmasının geliştirilmesiyle birlikte, birçok yeşil bitkinin de dahil olduğu GO Konsorsiyumuna (GOC) artan sayıda veri tabanı eklenmiştir. hayvan ve mikrobiyal genomları. GO, gen ürünlerini ilişkili biyolojik süreçler, hücresel bileşenler ve moleküler fonksiyonlar açısından tanımlayan üç yapısal kategoriye sahiptir. [29, 30]. NcRNA çalışmasında, GO, ncRNA'ları ve bunların hücresel fonksiyon analizlerini açıklamak için kullanılabilir.

Kyoto Gen ve Genom Ansiklopedisi (KEGG), hücre, organizma ve ekosistem gibi biyolojik sistemdeki proteinlerin ve yardımcı programların işlevlerini anlamak için bir ağ kaynağı veritabanıdır. KEGG veri tabanının özelliklerinden biri, genomdan dizilen ve daha yüksek hücre, tür ve ekosistem seviyelerine bağlı olan genetik katalogdur. [31]. Bu veritabanı her zaman ncRNA'ların hedeflerini açıklamak ve metabolik yol analizi yapmak için kullanılır.

KOBAS, 5 yol veritabanından (KEGG PATHWAY, PID, BioCyc, Reactome ve Panter) ve 5 insan hastalığı veritabanından (OMIM, KEGG HASTALIĞI, FunDO, GAD ve NHGRI GWAS Kataloğu) 1.327 türü içermektedir. [32, 33]. Kodlayıcı olmayan RNA çalışmasında, GO ve KEGG ek açıklaması dahil olmak üzere kodlayıcı olmayan RNA işlevinin hedef genini açıklamak için kullanılabilir. Ayrıca, önemli ölçüde zenginleştirilmiş metabolik yolları tanımlamak için istatistiksel yöntemler kullanarak KOBAS [32, 33].

RiceWiki [34-37] bir topluluk küratörlüğünde pirinç bilgisi kaynağıdır. RiceWiki'de, 1000'den fazla elle küllenen gen, yüksek kalite olarak doğrulanır. Rice için Bilgi Ortaklarından (IC4R) Alınan Gen İfade Profilleri [35, 37] RiceWiki'ye entegre edilmiştir.

Brassica Veritabanı (BRAD) genomik bir veritabanıdır. Brassica rapa ve Arabidopsis thaliana [38]. Ve BRAD v2.0 [39] dahil 11 Brassicaceae genomu entegre etti. Arabidopsis lyrata, Aethionema arabicum, Brassica oleracea, Brassica napus ve bunun gibi. Bu veritabanı Brassicaceae türleri hakkında moleküler seviyeden genomik seviyeye kadar korunmuş bazı genomik bilgiler sağlar. Ve Genel Synteny Tarayıcısı (GBrowse_syn) bir modül, sintenik ve sintenik olmayan ortologlar ve bunların açıklamalarını ve dizilerini aramak için arama ile ilgili işlevler sağlar. [38, 39].

Münih Protein Dizileri Tesisleri Bilgi MerkeziDB (MIPS TesisleriDB) bitki genomlarının biyoinformatik analiz yöntemlerine odaklanır [40, 41]. Her bitki türü için bir miktar kaynak sağlamayı amaçlamaktadır. Bu arada, bu veritabanı bitki genomuyla ilgili araştırmalar için bir arama platformu sağlar. Bitki Genomu ve Sistemleri Biyoloji BitkileriDB (PGSB PlantsDB), karşılaştırmalı bitki genom araştırmalarını kolaylaştırmak için çerçeve için bir veritabanıdır. Anahtar kelime arama seçeneklerinin ve BLAST sıra arama işlevinin hizmetlerini sunar. Temelde karmaşık içerir Triticum aestivum L. özellikle buğday, çavdar ve arpa için genom verileri [41].

SorGSD, sorgum genomu SNP'si için bir veritabanıdır. [42]. SorGSD, 48 farklı sorgum çeşidi grubundan 62 milyon SNP bilgisi içerir. Web arayüzünü kullanarak SNP'yi etkin bir şekilde taramanın, aramanın ve analiz etmenin kolay bir yolunu sunar. SorGSD, kullanıcıların her sorgum genomu SNP'si için SNP bilgilerini ve ilgili ek açıklamalarını almalarını sağlar.

Medicago truncatula Gen İfadesi Atlas (MtGEA) analiz etmeyi amaçlamaktadır Medicago transkriptome ve ayrıca web platformu için arama ve analiz araçları sunar. Medicago transkriptom [43].

tablo 1

Bitki genomları için web tabanlı kaynak

Veritabanı / aracıURLAçıklamaRef.
TAIRhttp://www.arabidopsis.org/İçin bir kaynak Arabidopsis genom bilgisi[6, 7]
Buğdayhttp://www.wheatgenome.org/Buğday genom bilgisi için bir kaynak[8]
Pirinçhttp://rice.plantbiology.msu.edu/Pirinç genom bilgisi için bir kaynak[9, 10]
MaizeGDBhttps://www.maizegdb.org/Mısır genetiği ve genomiği için bir veritabanı[25, 26]
SoyBasehttp://soybase.org/USDA-ARS soya fasulyesi genetiği ve genomiği için bir veri tabanı[27]
funRiceGeneshttps://funricegenes.github.io/İşlevsel olarak karakterize edilmiş pirinç genlerinin kapsamlı bir veritabanı[28]
GİTMEKhttp://geneontology.org/Gene Ontology kaynağı için bir web[29, 30]
KEGGhttp://www.kegg.jp/Kyoto Genler ve Genom Ansiklopedisi için bir Sentez ağı[31]
KOBAShttp://kobas.cbi.pku.edu.cn/Gen / protein fonksiyonel açıklama (Açıklama modülü) ve fonksiyonel gen seti zenginleştirme (Zenginleştirme modülü) için bir çar[32, 33]
RiceWikihttp://ricewiki.big.ac.cn/Pirinçte genlerin toplanması ve Omics Knowledge için pirinç tabanlı, açık düzenlenebilir ve açık içerikli bir platform[34-37]
BRADhttp://brassicadb.org/Genom ölçeği genetik ve genomik veriler için bir veritabanı Brassica bitkileri[38, 39]
MIPS TesisleriDBhttp://mips.helmholtz-muenchen.de/plant/genomes.jsp/Karşılaştırmalı bitki genom araştırması için bir veri tabanı.[40, 41]
SorGSDhttp://sorgsd.big.ac.cn/Bir sorgum genomu SNP veritabanı[42]
MtGEAhttp://bioinfo.noble.org/gene-atlas/Analiz etmek için bir web sunucusu Medicago transkriptom[43]
DsTRDhttp://bi.sky.zstu.edu.cn/DsTRD/home.php/İçin temel ve uygulanan kapsamlı bir kaynak Salvia Miltiorrhiza araştırmacılar[44]
SoyFNhttp://nclab.hit.edu.cn/SoyFN/Soya fonksiyonel gen ağları ve miRNA fonksiyonel ağları için bir veritabanı[11]
gRAPhttp://structuralbiology.cau.edu.cn/GraP/İşlevsel açıklama, gen ailesi sınıflandırmaları, protein-protein etkileşim ağları, birlikte ifade ağları ve mikroRNA-hedef çiftleri için bir veritabanı Gossypium raimondii[45]
STPDhttp://me.lzu.edu.cn/stpd/Tuza toleranslı adaptasyon ve ağacın kavak genomiği için kapsamlı bir veritabanı[12]
TFGDhttp://ted.bti.cornell.edu/Bir veritabanı, büyük ölçekli domates fonksiyonel genomik veri setlerini saklamak, sorgulamak, benimlemek, analiz etmek, görselleştirmek ve entegre etmek için kapsamlı bir kaynak sağlar[13]
LegumeIPhttp://plantgrn.noble.org/LegumeIP/Model baklagillerin karşılaştırmalı genomiği ve transkriptomisi için bütünleştirici bir veri tabanı[46]
Bitki Reactomehttp://plantreactome.gramene.org/Bitki metabolik ve düzenleyici yollarının serbestçe erişilebilir bir veritabanı[47-49]
Bitki-Prashttp://plant-pras.riken.jp/Bitki proteomlarında fizikokimyasal ve yapısal özellikler ile yeni fonksiyonel bölgelerin veritabanı[50, 51]
genler, PlantGDB'dehttp://www.plantgdb.org/Karşılaştırmalı bitki genomiği için bir kaynak[52]
CuGenDBhttp://www.icugi.orgİçin genomik bir veritabanı sukabağı Türler[53]
Topluluk Tesislerihttp://plants.ensembl.orgSıralı bitki türleri için bütünleştirici bir kaynak (şu anda 38)[54]

Danshen Transkripsiyonel Kaynak Veritabanı (DsTRD), transkript dizileri ve protein kodlayan RNA'lar, lncRNA'lar, diğer ncRNA, miRNA'lar ve phasiRNA'lar dahil fonksiyonel ek açıklamalar hakkında bilgi sağlar [44].

SoyFN, soya fasulyesi miRNA fonksiyonel ağları ve fonksiyonel gen ağları hakkında bir kaynaktır [11]. Ayrıca soya fasulyesi miRNA'larının ve KEGG yolakları, GO ek açıklamaları ve 3'-UTR dizileri dahil olmak üzere fonksiyonel genlerin fonksiyonel ağlarını aramak, indirmek ve analiz etmek için kullanılabilir. Ek olarak, SoySearch, promotör motifi taraması, Genom Tarayıcısı, eFP Tarayıcısı ve Kimlik eşlemesi gibi bazı faydalı araçlar sunar. [11].

Fonksiyonel Genomik Analiz Platformu Gossypium raimondii (GraP) için bir genom veritabanıdır Gossypium raimondii Doğal lif ve yağ bitkilerinin en önemlilerinden biridir. [45]. Bu veritabanı, gen ailesi sınıflandırmalarına, fonksiyonel açıklamalara, microRNA-hedef çiftlerine, ko-ifade ağlarına ve protein-protein etkileşim ağlarına hizmet veren görselleştirme araçları, entegrasyon ve çok boyutlu analiz sağlamak için oluşturulmuştur. [45].

Tuzluluk Toleranslı Kavak Veri Tabanı (STPD), genomik dizilerin, genlerin ve bunların fonksiyonel bilgilerinin verilerini, tekli nükleotid polimorfizmleri bilgisini, geçirilebilir elementleri, basit dizilim tekrarlarını ve ncRNA dizilerini içerir. Populus euphratica, arasında gen ifadesi verileri Populus euphratica ve Populus tomentosave bütün genom arasındaki hizalamalar Populus trichocarpa, Populus euphratica ve Salix suchowensis [12]. Ve bu veritabanı veri madenciliği ve genom tarayıcı, BLAST sunucular ve genom hizalama görüntüleyici vb. Gibi faydalı arama araçları sunar. Bu araçlar, benzer dizileri tanımlamak, genom hizalarını görselleştirmek ve genom bölgelerine göz atmak için kullanılabilir [12].

Domates Fonksiyonel Genomik Veri Tabanı (TFGD), RNA-seq verilerini, mikroarrayleri, küçük RNA verilerini, domateslerin metabolitini toplayan ve büyük ölçekli domates fonksiyonel açıklamalarını saklamak, almak, analiz etmek, görselleştirmek ve entegre etmek için kullanılabilen bir domates fonksiyonel genomik veritabanıdır. Genomics veri setlerinin yanı sıra tüm analiz sonuçlarını indirmek [13].

LegumeIP [46] genomun evrimi ve baklagillerde gen fonksiyonlarının araştırılması içindir. Veritabanında üç model bakliyat bulunur: Medicago truncatula, Glisin max, Lotus japonicus ve iki referans bitki türü, Arabidopsis thaliana ve Populus trichocarpa. LegumeIP ayrıca gen açıklamalarına, göreceli gen ifadelerine ve gen ailesine dayalı esnek sorgular sağlayan görselleştirme ve kapsamlı arama araçları sunar. [46].

Bitki Reactome, 1.173 protein, 222 pirinç yolu terimi, 907 küçük molekül ile ilişkili 1.025 reaksiyonu içeren ücretsiz bir açık kaynaklı küratörlü bitki yolu veritabanıdır. [47]. Veri tabanı, genom analizini, genom notunu ve temel araştırmayı desteklemek için yol bilgisinin görselleştirilmesi, analizi ve yorumlanması için biyoinformatik araçlar sunar. [47-49].

Plant Protein Annotation Suite veritabanı (Plant-PrAS) 6 tipik bitki türünü içerir, Arabidopsis thaliana, Glisin max (soya fasulyesi), Populus trichocarpa (kavak), Oryza sativa (pirinç), Physcomitrella patentleri (yosun) ve Cyanidioschyzon merolae (Alg) [50, 51]. Plant-PrAS, bu türler hakkında protein dizilerinin çoklu fizikokimyasal ve ikincil yapısal parametrelerini sağlar [50, 51].

PlantGDB, yeşil bitkiler (Viridiplantae) için dizi verilerini içeren bir genom veritabanıdır. 100'den fazla bitki türü için açıklamalı transkript derlemeleri sağlar [52].

sukabağı Genomik Veri Tabanı (CuGenDB), bazı önemli mahsuller için bir veri tabanıdır. sukabağı salatalık, karpuz, kavun gibi türler [53]. Bu veri tabanı sadece genomik dizileri, EST ve RNA dizisini sağlamamaktadır. sukabağı türler, fakat aynı zamanda gen bilgisi, BLAST, JBrowse, Pathway ve GO zenginleştirme vb. arama araçları sağlar, ayrıca genom ve açıklama, genom yeniden boyutlandırma, marker, EST, unigene ve path yükleme fonksiyonlarını da içerir. [53].

Ensembl Plants sıralı bitki türleri için bütünleyici bir kaynaktır (mevcut sürüm 38) [54]. Bu veritabanı, genom sekansı, fonksiyonel açıklama, gen modelleri ve polimorfik lokuslar hakkında bilgi sağlar. Bu veri tabanında, bireysel genotipler, popülasyon yapısı, fenotip verileri ve bağlantı dahil olmak üzere çeşitli ek bilgiler sağlanmıştır. Ayrıca, tüm genom ve protein dizilerinin karşılaştırmalı analizlerini sağlar; ve genom düzenlemeleri ve gen ağaçları oluşturmak için hizmet. Bu veritabanı, yılda 4-5 kez güncellenir, ayrıca ilave genomlar ve yeni türlerin bilgileri eklenir. [54].

Daha sonra, Tablo 2'de listelenen 34 miRNA kaynağını tanıtacağız.

MiRBase, 4.886 bitki türü de dahil olmak üzere tüm türlerdeki miRNA'ları resmi olarak bildirir [55, 56]. Şimdiye kadar, miRBase 21 yayımlamak için güncellendi [57]. MiRNA'ların ve olgun miRNA'ların dizilerini, pre-miRNA'ların ikincil yapıları ve ilgili literatürü miRBase'den elde edebiliriz. [58].

Rfam, çoklu dizi hizalaması, bir kovaryans modeli (CM) ve bir konsensüs sekonder yapısı toplayan RNA ailelerinin bir veritabanıdır. Rfam, yapılandırılmış dahil olmak üzere üç geniş fonksiyonel sınıf sağlar cis-düzenleyici elemanlar, kodlamayan RNA genleri ve kendiliğinden yapışan RNA'lar. Kullanıcılar, miRNA aileleri de dahil olmak üzere ncRNA ailesini tanımlamak için kullanabilir [59].

MiRTarBase 360,000'den fazla miRNA-hedef etkileşimi (MTI) biriktirdi [60]. MiRNA-hedefi için deneysel olarak onaylanmış etkileşimi sağlayarak, miRTarBase, miRNA'ların farklı koşullarda ve Arabidopsis thaliana dahil olmak üzere farklı türlerde rolünü açıklamayı amaçlar. Oryza sativa [60-63].

MirPub [64] microRNA yayınlarını aramak için kullanılabilir. İnsan yapımı nedenlerden dolayı, miRNA her zaman standart adlandırma kurallarından sapma literatüründe, hatta resmi isimlendirme bile gelişmektedir. Bu veritabanı, kullanıcıların ilgili miRNA literatürünü aramasına yardımcı olmak için güçlü bir arama hizmeti sunar. [64].

PatScan, tamamlayıcı hedef genlerin aranması için kullanılan en eski programlardan biridir. [65]. PatScan, miRNA'lar ve hedef bölgeler arasında GU yalpalama, uyuşmazlık ve şişkin nükleotidi (ekleme / silme) sağlayan tamamlayıcı eşleşme dizilerini aramak için de kullanılabilir [65].

PsRobot, kısmen bitki miRNA'sındaki ve hedef kestirimindeki sorunları çözmek için kullanılabilecek, web tabanlı bir bitki küçük RNA meta-analiz araç kutusudur. [66].

PsRNATarget, bitki miRNA hedef tanıma alanındaki son çalışmayı içeren bitki küçük RNA hedefini analiz etmek için bir sunucudur [67]. PsRNATarget sunucusu, yeni nesil verilerin yüksek verimlilikle analiz edilmesi için tasarlanmış bir Linux kümesinde çalışan verimli bir dağıtılmış bilgi işlem arka uç boru hattıdır [67].

CleaveLand, degradome verilerinden bölünmüş miRNA hedeflerini tespit etmek için tasarlanmıştır. CleaveLand, küçük RNA'ları, degradome sekanslarını ve giriş olarak bir mRNA veritabanını alır ve küçük RNA hedeflerini çıkarır [68].

MiRNApath, miRNA'ları kullanarak miRNA'ları metabolik yollara bağlamak için çevrimiçi bir veritabanıdır: hedef ilişkileri [69]. Kullanıcılar, ilgili hedef genleri ve metabolik yolları aramak için bilgi girebilir [69].

Tablo 2

MiRNA'lar için web tabanlı kaynaklar

Veritabanı / aracıURLAçıklamaRef.
miRBasehttp://www.mirbase.org/Farklı türlerdeki miRNA'ların resmi veri tabanı[55-58]
Rfamhttp://rfam.xfam.org/Kodlamayan RNA genleri, yapısal cis-düzenleyici elementler ve kendinden yapışkan RNA'lar[59]
miRTarBasehttp://miRTarBase.mbc.nctu.edu.tw/Deneysel olarak onaylanmış microRNA hedefi için bir veritabanı[60-63]
mirPubhttp://www.microrna.gr/mirpub/MicroRNA yayınlarını aramak için bir veritabanı[64]
PatScanhttp://www.mcs.anl.gov/home/overbeek/PatScan/HTML/pats~dn.html/Web tabanlı bir sistem, kullanıcıların ikincil yapı (saç tokası, takma diş, çekiç kafaları vb.) Ve bilinen motifler için protein sekansları için nükleotit sekansları aramasını sağlar.[65]
PsRobothttp://omicslab.genetics.ac.cn/psRobot/Kök halka şeklindeki öncüllerle (mikroRNA'lar ve kısa saç tokası RNA'lar gibi) smRNA'ların ve bunların hedef genlerinin / transkriptlerinin tanımlanmasına adanmış web tabanlı, kullanımı kolay bir araç[66]
psRNATargethttp://plantgrn.noble.org/psRNATarget/Bir bitki küçük RNA hedef analiz sunucusu[67]
Cleavelandhttp://www.bio.psu.edu/people/faculty/Axtell/AxtellLab/Software.htm/Bölünmüş küçük RNA hedeflerini bulmak için degradome verilerini kullanmak için bir boru hattı[68]
miRNApathhttp://lgmb.fmrp.usp.br/mirnapath/MiRNA'ların, hedef genlerin ve metabolik yolların veritabanı[69]
TarBasehttp://microrna.gr/tarbase/MikroRNA için bir veri tabanı, merkezi bilimsel ilginin çeşitli hayvan türlerini, bitkileri ve virüsleri hedefler.[70, 71]
PeTMbasehttp://petmbase.org/Bitki Endojen Hedef Mimiklerinin Bir Veri Tabanı (eTM'ler)[72]
AtmiRNEThttp://AtmiRNET.itps.ncku.edu.tw/Düzenleyici ağların yeniden yapılandırılması için bir kaynak Arabidopsis miRNA'lan[73]
PmiRExAthttp://pmirexat.nabi.res.in/Plant miRNA ekspresyonu atlası için bir veritabanı ve web uygulamaları[74]
tasiRNAdbhttp://bioinfo.jit.edu.cn/tasiRNADatabase/Ta-siRNA düzenleyici yola bağlı mikroRNA'lar, TAS'lar, ta-siRNA'lar ve ta-siRNA hedeflerinin sekansları için ve bunlar arasındaki basamaklı ilişkiler için bir kaynak[75]
comTARhttp://rnabiology.ibr-conicet.gov.ar/comtar/Bitkilerde korunmuş miRNA hedeflerinin tahmini ve karakterizasyonu için bir web aracı[76]
miR-tercihhttps://github.com/hangelwen/miRPREFeR/Küçük RNA-Seq verilerini kullanarak bitki miRNA tahmini için bir web aracı[77]
ASRPhttp://asrp.cgrb.oregonstate.edu/MikroRNA'lar ve kısa girişim yapan RNA'lar (siRNA'lar) için bir veri tabanı Arabidopsis[78]
Pmrdhttp://bioinformatics.cau.edu.cn/PMRD/Kamu veritabanlarında depolanan, son literatürden yararlanılan ve kurum içinde üretilen verilerden elde edilen bitki miRNA verilerinin bir veritabanı[79]
Starbasehttp://starbase.sysu.edu.cn/CLIP-Seq ve Degradome-Seq verilerinden miRNA-hedef etkileşim haritalarının kapsamlı bir şekilde araştırılmasını kolaylaştırmak için bir veritabanı[80]
miRNESThttp://mirnest.amu.edu.pl/MicroRNA araştırmasında ve açıklamada bütünleştirici yaklaşım için bir veritabanı[81, 82]
siRNAdbhttp://siRNA.cgb.ki.se/SiRNA dizilerinin bir veritabanı[84]
pssRNAMinerhttp://bioinfo3.noble.org/pssRNAMiner/.Bir bitki kısa küçük RNA düzenleyici kaskad analiz sunucusu[85]
TAPİRhttp://bioinformatics.psb.ugent.be/webtools/tapir/Bitki microRNA hedeflerinin tahmini için bir web sunucusu[86]
RNA hibridhttp://bibiserv.techfak.uni-bielefeld.de/rnahybrid/Büyük hedef RNA'larda miRNA'ların çoklu potansiyel bağlanma sahalarını öngören bir program[87]
PMTEDhttp://pmted.agrinome.org/Temsil edilen miRNA hedeflerinin ifade profillerini almak ve analiz etmek için bir veritabanı[88]
PASmiRhttp://pcsb.ahau.edu.cn:8080/PASmiR/Abiyotik strese bitki yanıtında miRNA moleküler regülasyonu için bir veri tabanı[89]
AHDhttp://ahd.cbi.pku.edu.cn/help.phpModel organizmanın hormona bağlı genlerinin toplandığı bir veri tabanı Arabidopsis thaliana[90, 91]
miRFANshttp://www.cassavagenome.cn/mirfans/İçin entegre bir veritabanı Arabidopsis thaliana microRNA işlev açıklamaları[92]
MPSShttp://mpss.udel.edu/MRNA ve küçük RNA için bir kaynak Arabidopsis, pirinç, üzüm ve Magnaporthe grisea ve pirinç patlama mantarı[93]
plant_snoRNA DBhttp: //www.scri.sari. ac.uk/plant_snoRNA/Dan küçük nükleolar RNA'ların bilgisi için bir veritabanı Arabidopsis ve diğer 18 bitki türü[94]
miSolRNAhttp://www.misolrna.org/Domates meyvesinin metabolizmasının altında yatan düzenleyici işlemlerin fizyolojik etki modlarını tanımlamak için bir veritabanı[95]
PmiRKBhttp://bis.zju.edu.cn/pmirkb/Dört ana fonksiyonel modül içeren bir veritabanı: SNP, Pri-miR, MiR-Tar ve Self-reg modülü.[96]
PlantDARIOhttp://plantdario.bioinf.uni-leipzig.de/Bitkilerdeki küçük RNA-sekans verilerinin kalitatif analizi için bir web sunucusu[98]
OmiRashttp://tools.genxpro.net/omiras/Kodlama yapmayan RNA'ların diferansiyel ifade etkileşim ağlarının açıklamaları, karşılaştırılması ve görselleştirilmesi için bir Web sunucusu[99]

TarBase'de [70] ve TarBase 5.0 [71], sonuçlar, farklı hesaplama yöntemleri ve hedef yer bilgisi ile öngörülen miRNA'ların düzenlenmesi ile birlikte, yol ve GO terimleriyle ilişkilidir. [70, 71].

Bitki Endojen Hedef Taklit (PeTMbase), bitkilerde endojen miRNA hedef taklitleri (eTM) için bir yöntem sağlamayı amaçlamaktadır. Onbir farklı yeşil bitki türünden hesaplamalı olarak tahmin edilen 2,728 eTM sekansına sahip, tespit edilebilir bir veri tabanıdır. [72].

AtmiRNET bir veritabanıdır. Arabidopsis miRNA hedef tanıma, promotör tanımlama, hedef genlerin fonksiyonel zenginleştirilmesi ve tespitine vurgu yapan miRNA'lar cis-– ve trans-elementler [73]. Ayrıca fonksiyonel zenginleştirme analizinin aydınlatılmasının analizini ve miRNA'ların ekspresyon seviyeleri ile hedefleri arasındaki korelasyonları destekler. [73].

Plant miRNA Expression Atlas (PmiRExAt), miRNA ekspresyon profilinden ve 1.859 buğday, 2.330 pirinç ve 283 mısır miRNA'sı için arama aracından oluşan web tabanlı bir kaynaktır. [74]. Veritabanı arayüzü, miRNA ifade profillerine açık ve kolay erişim sağlar ve ifade eden miRNA'ların tanımlanmasına yardımcı olur. [74].

TasiRNAdb, ta-siRNA düzenleyici yola bağlı mikroRNA'ların, ta-siRNA'nın, TAS'lerin ve ta-siRNA hedeflerinin dizilerini depolamak için bir veritabanıdır [75]. Bu veri tabanı, 18 türden ta-siRNA tarafından düzenlenen 583 yolu içermektedir. Bu veritabanındaki TasExpAnalys, gönderilen küçük RNA'ları ve degradome kütüphanelerini girdi veya TasiRNAdb'ın TAS dizilerine eşlemek ve sRNA faz analizi ve TAS bölünme analizi yapmak için kullanılır [75].

Korunan microRNA hedefleri (ComTAR) miRNA hedeflerinin tahmini için bir ağ kaynağı aracıdır [76]. Bu veritabanı, potansiyel miRNA hedeflerinin veri kümelerini oluşturmak için tasarlanmış 33 anjiyopermin transkript verilerini içerir. Bu veritabanı miRNA hedef bilgisinin, fonksiyonlarının ve evrimsel korumanın tanımlanmasını içerir [76].

MiRNA HAZIRLIĞI Küçük RNA-Seq verilerinden (MiR-PREFeR) bir bitki mikroRNA tahmin aracıdır [77]. MiRNA'ların ekspresyon modlarını kullanarak küçük RNA-Seq verilerinden miRNA'ları analiz edebilir. Aynı türdeki küçük RNA-Seq veri örneklerinden bitki miRNA'larını kesin olarak tahmin etmek için bitki microRNA ek açıklama kriterlerini takip eder. [77].

Arabidopsis Küçük RNA Projesi (ASRP) bir arama aracıdır Arabidopsis İçindeki endojen küçük RNA'ların ana sınıflarını tanımlayabilen ve analiz edebilen küçük RNA. Arabidopsis. Çoklu kopyadan klonlanmış küçük RNA dizileri sunar Arabidopsis 1.920 eşsiz miRNA ve siRNA dizisini içeren genotipler [78].

Plant miRNA Veri Tabanı (PMRD), 121 bitki türünden birleştirilmiş 8.433 miRNA içeren ve kamu veritabanlarından bitki miRNA verilerini entegre eden bir bitki miRNA veri tabanıdır. [79]. Bu veritabanı küçük RNA dizi bilgilerini, hedef bölgeleri, ikincil yapıyı, bir genom tarayıcısını ve ifade profillerini içerir. [79].

StarBase, Degradome-Seq ve CLIP-Seq verilerinden miRNA-hedef etkileşim haritalarının kapsamlı bir şekilde toplanan ve 10 organizatör-Seq ve 6 organizmadan elde edilen 21 CLIP-Seq deneyinden elde edilen yüksek verimli sıralama verilerini içeren bir veri tabanıdır. [80]. 2 milyondan fazla bölünmüş hedef bitki kümesi ve 1 Önce den daha fazla bağlayıcı hayvan kümesi tanımlanmıştır. Bu kümelerden sırasıyla Degradome-Seq ve CLIP-Seq verilerinden gelen 400.000 ve 66.000 miRNA-hedef düzenleme ilişkileri tanımlanmaktadır. Bu veri tabanı, Degradome-Seq ve CLIP-Seq verilerinden yeni miRNA hedef siteleri aramak ve hedeflerini GO terimleri ve yolları ile açıklamak için kullanılabilir [80].

MiRNEST, 13 veritabanı ve dış araştırmadan dış miRNA verilerini birleştiren, küçük RNA sıralama verilerini, miRNA dizilerini, polimorfizmleri, ekspresyonu ve hedefleri içeren ve aynı zamanda hayvanlar, bitkiler de dahil olmak üzere 544 türün harici miRNA kaynaklarına bağlanan verileri içeren entegre bir miRNA kaynağıdır. ve virüsler [81]. 202 bitki ve 225 hayvan türünün İfade Edilen Sıra Etiketleri üzerinde yapılan miRNA tahminleri bu veri tabanının çekirdeğidir. [81]. MiRNEST 2.0, derin sıralama kitaplıklarından yeni miRNA tahminleri programı ekledi [82], HuntMi ile miRNA öncesi sınıflandırma sonuçları [83], bitki degradome ve miRNA splice sitelerinin analizleri ve indirme / yükleme seçeneklerinin fonksiyonlarından elde edilen veriler. Ayrıca MiRNEST 2.0, miRNA kayıtlarına göz atmayı daha uygun hale getirmek için kullanıcı arayüzünü geliştirmiştir. [81, 82].

SiRNA Veri Tabanı (SiRNAdb), yüksek etkili olduğu tahmin edilen siRNA'lar ve bir yöntemlerin bir kombinasyonu ile bilinen etkinliğe sahip siRNA'lar dahil olmak üzere, siRNA deneysel verilerinin gen merkezli bir yorumunu sunar. [84]. Veritabanı, bir siRNA'nın spesifik olmayan ve inhibisyon etkileri için potansiyelini değerlendirmek için geliştirilmiştir. [84].

PssRNAMiner, hem faz faz başlatıcısını hem de fazlanmış küçük RNA'ların kümelerini tanımlamak için tasarlanmıştır. [85]. Faz başlatıcıları tanımlamak için, kullanıcı aday faz başlatıcı olarak en az bir küçük RNA dizisi sunmalıdır. PssRNAMiner, fazlı küçük RNA kümelerini ta-siRNA adayları olarak tanımlamak için kullanılabilir. Phipergeometrik dağılım değerleri [85].

TAPIR, bitki microRNA hedeflerinin tahmini için yapılır. [86]. Sunucu, bitki miRNA hedef sitelerini almak için hızlı ve kesin bir algoritma sağlar. Kesin seçenek, daha yavaş olmasına rağmen daha az mükemmel eşleştirilmiş miRNA-hedef dupleksleri bulmayı garanti eder [86].

RNA-hibrid, ncRNA'nın minimum serbest enerji hibridizasyonunu bulmak için kullanılır. [87]. Bu araç öncelikle microRNA hedef tahmini için bir araç olarak kabul edilir. [87].

Plant MiRNA Target Expression Database (PMTED), mevcut literatürlerde miRNA verilerine dayanarak miRNA hedef genlerinin ifadesini almak ve analiz etmek için bir veritabanıdır. [88]. MiRNA'lar ve hedef dizileri için fonksiyon ve diferansiyel ifade profilleri bu veritabanı kullanılarak kolayca elde edilebilir. Ve korunmuş ve yeni miRNA'ları ve hedeflerini karşılık gelen ekspresyon profili alımlarıyla tahmin etmek için kullanılabilir. Ayrıca, Cytoscape Web tabanlı bir grafik arabirim tarafından görüntülenen, iyi tanımlanmış mikroarray deneylerinden toplanan meta terimler olan biyoprosesler, türler, koşullar ve miRNA'lar arasındaki global bir Meta ağda tarama işlevlerine de hizmet vermektedir. [88].

PASmiR, abiyotik stres altında farklı bitkilerde miRNA moleküler düzenleme ağı için bir veritabanıdır [89]. 33 bitki türündeki 35 abiyotik stres ile 682 miRNA arasında binden fazla düzenleyici ilişkiyi temsil eden ikiden fazla yayınlanmış çalışma içermektedir. Users can search the miRNA-stress regulatory entries with keywords of plant species, abiotic stress, and miRNA identifier. In this database, users are provided with detailed regulation information of a specific miRNA, including miRNA expression pattern, the name of species, stress name, miRNA identifier, detection method for miRNA expression, a reference literature, and target gene(s) of the miRNA extracted from the corresponding reference or the miRBase [89].

Arabidopsis Hormone Database (AHD) provides a comprehensive and systematic view of genes participating in plant hormonal regulation, and describes morphological phenotypes controlled by plant hormones [90]. AHD 2.0 adds predicted miRNA complementary site(s) and integrated genes that genetically interact with each Arabidopsis thaliana hormone related genes by literatures mining. This database is useful for studying miRNA mediated hormone regulation in plants [90, 91].

MiRFANs is a database for Arabidopsis thaliana miRNA function annotations, including transcription factor (TF), miRNA-target interactions and their target sites, expression profiles, pathways and genomic annotations [92]. It also can be used to predict miRNA target by its various types of tools. Each miRNA target is related to pathway and GO terms and is associated with regulating miRNAs predicted information [92].

Massively Parallel Signature Sequencing (MPSS) is a signature-based transcriptional resource for mRNA and small RNA of four species (Arabidopsis, rice, grape and Magnaporthe grisea) [93]. It can measure the expression levels of most genes under defined conditions and it provides information about potentially novel transcripts [93].

Plant snoRNA DB provides information on small nucleolar RNAs from Arabidopsis and 18 other plant species, including their polycistronic, intronic and the number of gene variants and many snoRNA genes from alignments of orthologous genes and gene variants from different plant species [94].

MiSolRNA collects data of tomato for integrating genetic map sites of miRNA-targeted genes, their relations with quantitative fruit metabolic loci and their expression profiles and yield associated traits [95]. And it provides a metadata source to facilitate the construction of hypothesis aimed at defining physiological modes of action of regulatory process underlying the metabolism of the tomato fruit [95].

Plant miRNA knowledge base (PmiRKB) is a database mainly for miRNA information of Arabidopsis (Arabidopsis thaliana) and rice (Oryza sativa), including single nucleotide polymorphism (SNP) data to inspect the SNPs within pre-miRNAs (precursor microRNAs) and miRNA—target RNA duplexes, investigating the tissue-specific, transcriptional contexts of pre- and pri-miRNAs (primary microRNAs) and validating miRNA and target pairs [96].

PlantDARIO is a database for processing and analyzing of plant-specific small non-coding RNAs (sncRNAs) [97, 98]. PlantDARIO has diverse functions, such as small RNA-seq quality control, analyses of mapping files, expression analyses of annotated sncRNAs, as well as the prediction of novel miRNAs and snoRNAs from expression analysis of user-defined loci and unknown expressed loci [98].

OmiRas is an online server to analyze differential expression of miRNAs derived from small RNA-Seq data [99]. OmiRas has two main functions. The first function is static annotation, including length distribution, alignments mapping statistics, and quantification tables for each library and analysis on different expression of ncRNAs between treatment and conditions. And the second function is an interactive network of miRNAs and their target genes that are analyzed by the combination of several miRNA-mRNA interaction databases [99].

In this section, we introduce 24 resources for lncRNAs, as listed in Table 3, and a new database for plant circRNAs.

The lncRNAdb is a database of lncRNAs which have or suspected to have biological functions in eukaryotes [100]. There are many referenced information of RNA in each entry, including sequences, structural information, genomic context, expression, subcellular localization, conservation, functional evidence and other relevant information. The lncRNAdb can be searched by keywords, including published RNA names and aliases, sequences, species and associated protein-coding genes and so on. The lncRNAdb v2.0 [101] provides reference database of more than 280 eukaryotic lncRNAs from scientific literature and add new characteristics in lncRNAdb contain a BLAST search tool and easy export of content via direct download or a REST API, the integration of Illumina Body Atlas expression profiles, nucleotide sequence information [100, 101].

NONCODE is an integrated knowledge database dedicated to non-coding RNAs, including non-coding RNAs of plants [102]. This database provides the detailed information of lncRNAs, which strand, exon number, length and sequence. In addition, it also provides advanced information, which include the expression profiles, exosome expression profiles, conservation information, predicted functions and disease relations [102-106].

Coding Potential Calculator (CPC) is an available mobile-friendly web server which can be used to assess the potential protein-coding transcripts by using sequence features and provide vector machine [107]. CPC2 added the function of downloadable standalone package and is much faster and more accurate [107, 108].

NPInter is a database for functional interactions between non-coding RNAs (except tRNAs and rRNAs) and biomolecules (proteins, RNAs and DNAs) [109]. It also provides a convenient search tool option which is allow users seek the interactions, related publications and other information [109, 110].

Coding-Non-Coding Index (CNCI) is a tool for assortment with protein-coding or non-coding transcripts. It can use incomplete transcripts and antisense transcripts to effectively predict non-coding RNA [111].

Coding potential calculator based on multiple evidences (COME) is an accurate and stable tool for identification and characterization of coding potential lncRNAs. And this tool integrates multiple sequence-derived and experiment-based features using a method of decomposition and combination. COME can greatly improve the consistency of predication results from other coding potential calculators. In addition, COME can annotates and characterizes each predicted lncRNA transcripts with multiple lines of supporting evidence, rather than other tools provided. [112].

Coding-Potential Assessment Tool (CPAT) is a high accuracy and fast tool for extracting coding and non-coding transcripts from raw transcriptome sequencing data by using logistic regression model which base on four sequence features: open reading frame size, open reading frame coverage, Fickett TESTCODE statistic and hexamer usage bias. It also can be used online and allows users to submit FASTA or BED formatted data files of sequences [113].

Pfamscan is a tool for protein functional analysis. The possible protein sequences in each transcript will be searched homologous to the database to eliminate the possibilities of being coding genes for putative lncRNAs [114].

PhyloCSF is a tool for differentiate protein coding and non-coding regions. It can help distinguish between protein-coding and non-coding RNA in transcripts obtained by sequencing high-throughput transcriptomes [115].

PLNlncRbase is a database which provides detailed information for identified lncRNA and includes 1,187 plant lncRNAs of more than 40 species from nearly 200 published literatures [116]. Users can seek plant lncRNAs by keywords of plant species or lncRNA identifier. The details of lncRNAs include species name, description of the potential biological function, lncRNA sequences and classification, expression patterns of lncRNAs, the tissue, developmental stage and condition for lncRNA expression, detection method for lncRNA expression, a reference literature, and the potential target genes of the lncRNA taken out from the original reference [116].

Plant Long non-coding RNA Database (PLncDB) includes a comprehensive genomic view of Arabidopsis lncRNAs for the plant research community [117].

Plant ncRNA Database (PNRD) contains 25,739 non-coding RNA records, including lncRNAs, tRNA, rRNA, tasiRNA, snRNA and snoRNA, etc [118]. It also provides many functional search and analysis tools, including search of ncRNA keyword, literature-based function and miRNA-targets [118].

LncReg is a database for regulatory relationships of the lncRNAs, including 1,081 reported lncRNA-associated regulatory entries, 258 non-redundant lncRNAs and 571 non-redundant genes [119]. It can be used to seek regulatory networks of lncRNAs and comprehensive data for bioinformatics studies and beneficial to understand the function of lncRNAs [119].

Table 3

Web-based resources for lncRNAs

Database/toolURLDescriptionRef.
lncRNAdbhttp://www.lncrnadb.org/A database for regulation mRNA and lncRNAs that have or associate with biological functions in eukaryotes[100, 101]
NONCODEhttp://www.noncode.org/A database of expression and biological functions of lncRNAs[102-106]
CPChttp://cpc2.cbi.pku.edu.cn/Calculate protein-coding potential of lncRNAs and other RNAs[107, 108]
NPInterhttp://www.bioinfo.org/NPInter/Functional interactions between ncRNAs and biomolecules[109, 110]
CNCIhttp://www.bioinfo.org/software/cnci/A tool for classify protein-coding or non-coding transcripts[111]
HADİhttps://github.com/lulab/COMEA tool for identification and characterization of coding potential lncRNAs[112]
CPAThttp://code.google.com/p/cpat/A tool for extracting coding and non-coding transcripts from raw transcriptome sequencing data by using logistic regression model[113]
Pfamscanhttps://www.ebi.ac.uk/Tools/pfa/pfamscan/A tool for protein functional analysis[114]
phyloCSFhttps://github.com/mlin/PhyloCSF/wiki/A tool for distinguish protein coding and non-coding regions[115]
PLNlncRbasehttp://bioinformatics.ahau.edu.cn/PLNlncRbase/A database for lncRNAs that collected 1,187 plant lncRNAs in 43 plant species[116]
PLncDBhttp://chualab.rockefeller.edu/gbrowse2/homepage.htmlA database of plant long non-coding[117]
PNRDhttp://structuralbiology.cau.edu.cn/PNRD/A comprehensive integrated web resource for ncRNA searching, browsing, predicting, visualizing and downloading[118]
LncReghttp://bioinformatics.ustc.edu.cn/lncreg/A database developed by collecting 1,081 validated lncRNA-associated regulatory entries[119]
Mfoldweb serverhttp://www.bioinfo.rpi.edu/applications/mfold/A web server for nucleic acid folding and hybridization prediction[120]
RNAsofthttp://www.RNAsoft.ca/A suite of RNA secondary structure prediction and design software tools[121]
RNA shapeshttp://bibiserv.cebitec.uni-bielefeld.de/rnashapesstudio/A tool for RNA structure analysis[122]
RNA Movies 2http://bibiserv.techfak.uni-bielefeld.de/rnamovies/A powerful visualization tool for RNA secondary structure analysis[123]
RNAzhttp://www.rna.tbi.univie.ac.at/RNAz/A web for RNA secondary structure prediction[123, 124]
Infernalhttp://infernal.janelia.org/A tool for search and align homologous RNAs[126]
PlantcircBasehttp://ibi.zju.edu.cn/plantcircbase/A database of plant circRNAs which collect reported and unpublished circRNAs of five model plants and provides services of predicting circRNAs[127]
PlantCircNethttp://bis.zju.edu.cn/plantcircnet/index.phpA visualized web-based database of plant circRNA, miRNA and mRNA regulatory networks in eight model plants[128]
PlantNATsDBhttp://bis.zju.edu.cn/pnatdb/A web database which includes high-throughput small RNA sequencing data investigate the biological function of natural antisense transcripts (NATs)[129].
RNAcentralhttp://rnacentral.orgA database for integrating ncRNA from most organisms and providing text, sequence similarity and genome browsing functionality searching service[130, 131]
ncRNAdbhttp://biobases.ibch.poznan.pl/ncRNA/A database for collecting ncRNA except microRNAs, snoRNAs and housekeeping transcripts in animals, plants, eukaryotes, eubacteria and archaea.[132, 133]

Mfold web server is a tool to predict the secondary structure of single stranded nucleic acids [120]. It provides service for RNA and DNA folding and hybridization software in nucleic acids [120].

RNAsoft is a tool for prediction of the secondary structure of a pair of DNA and RNA molecules, removing unwanted secondary structure and drawing RNA strands that fold to a given input secondary structure [121]. It can be used to analysis of secondary structure of lncRNA.

RNA Shapes allows users to extract several relevant structures from the folding space of RNA sequence with a single structure of minimal free energy [122].

RNA Movies 2, which enables to browse sequential paths through RNA secondary structure landscapes, can be used to visualize structural rearrangement processes of RNA [123].

RNAz is a web database for RNA secondary structure prediction [124, 125]. Infernal is a tool for searching and aligning homologous RNAs [126].

PlantcircBase is a database of plant circRNAs which collect reported and unpublished circRNAs of Oryza sativa, Arabidopsis thaliana, Zea mays, Solanum lycopersicum, ve Hordeum vulgare [127]. And this database also provides services of predicting circRNAs from high throughput sequencing profiles input by users, for visualizing the structures of circRNAs, and analysis of functions and biogenesis mechanisms of circRNAs [127].

PlantCircNet is a visualized web-based database of plant circRNA, miRNA and mRNA regulatory networks, which can show querying detailed information of specific plant circRNAs in a user-friendly interface [128]. It contain identified circRNAs in eight model plants and can find significantly overrepresented Gene Ontology categories of miRNA targets by its enrichment analysis tool. It also provides investigation of genomic annotations, sequences and isoforms of circRNAs [128].

Plant Natural Antisense Transcripts Database (PlantNATsDB) is a database for plant natural antisense transcripts (NATs) which are regulated physiological and pathological processes [129]. In order to investigate the biological function of NATs, 2 million NAT pairs in 69 plant species and GO annotation and high-throughput small RNA sequencing data are integrated in this database. Small RNA can get GO annotation and their NATs function analysis in this database and their NATs regulation network could also be generated [129].

RNAcentral is a database which collects and integrates data and information of ncRNA from international consortium of established RNA sequence databases [130]. The initial release contains more than 8.1 million sequences, including all major representative functional group [130]. New release collects data from specialized ncRNA resources and provides a single entry point for all types of ncRNAs' sequences from most organisms, and created new species-specific identifiers of unique RNA sequences of single species. It also provides searching service of text and sequence similarity as well as genome browsing functionality [131].

Noncoding RNAs database (ncRNAdb) collected currently available sequence data on ncRNAs which have regulatory functions in prokaryotic, animal and plant cells, including regulation of chromatin structure, translational gene expression, modulation of protein function and subcellular distribution of RNAs and proteins [132, 133]. New release added ncRNA sequences from eukaryotes, eubacteria and archaea. This database does not collect microRNAs, snoRNAs and housekeeping transcripts [132, 133].

Up to now, many online resources for ncRNAs have been reported. To make it easier to use these resources, we will introduce a number of related databases and analysis tools in the general bioinformatics analysis processes of miRNAs and lncRNAs, and suggest some preferred resources.

As shown in Figure 1a, is the general process of miRNAs analysis. The first step is to obtain the required data from sequencing companies or public database such as NCBI GEO or SRA databases, and then filter the raw data to get high quality reads. There are some tools for filtering low quality reads and removing adapters in raw reads, such as Fastx-toolkit (http://hannonlab.cshl.edu/fastx_toolkit/), Trimmomatic [134], cutadapt [135]. Fastx-toolkit is developed for short-reads FASTA/FASTQ files preprocessing, primarily including identical reads collapsing, read length trimming, adapter removing and so on. Fastx-toolkit is a preferred tool to filter low quantity reads and remove adapters. The second step is to align reads to mRNA databases to remove sequences from protein-coding genes, known miRNAs, other ncRNAs and repeats. Several databases such as miRBase [56], RepBase [136], and TIGR Plant Repeat Database [137] and Rfam [59] are recommended in this step. The cDNAs of the species under investigation should also be used to remove sRNAs originated from coding genes in this step. After that, in the third step, the remaining reads were aligned to the genome database. Since there could be many reads in the sequencing libraries, Bowtie [138] is suggested in this step. In the fourth step, the secondary structures of the flanking sequences of the matched loci should be predicted. Two RNA secondary structure prediction tools, Mfold [120] and RNAfold [139] are preferred in this step. Next, in the fifth step, the sequenced sRNAs from the hair-pin structures were aligned to the miRBase to examine whether the identified miRNAs were conserved or novel with BLASTN. In the sixth step, to investigate the putative functions of conserved and novel miRNAs, their target genes could be predicted using target prediction tools, such as psRobot [66], psRNATarget [67], CleaveLand [68], SeqTar [140]. SeqTar [140] and PsRNATarget [67] are preferred for predicting plant miRNA target genes with and without degradome profiles, respectively. Finally, the seventh step is to predict potential functions of miRNAs. There are several tools for functional annotations, such as starBase [80], miRTarBase [60], and KOBAS [32]. KOBAS is a preferred for functional annotation [32, 33] since it includes GO enrichment, and KEGG pathway, and provides a temporary storage space for user analysis. The miRTarBase is a preferred tool to search experimentally validated miRNA targets by using miRNA, target gene, pathway, validation method, disease and literature. Normally, the putative targets of miRNAs are used in functional annotation of miRNAs because miRNAs realize their functions through their regulations on target mRNAs.

Figure 1b is the general analysis process of lncRNAs. Similar to miRNA analysis workflow, the first step is to filter low-quality reads from raw data. Fastx-toolkit is a preferred tool in this step. The second step is to construct spliced transcript assembly from filtered high quality reads. TopHat [141], Bowtie [138, 142], STAR [143] are preferred tools for transcript assembling with reference gene annotation and another tool, Trinity [144], is suggested for assembly without reference. In the third step, the assembled transcripts are aligned to known mRNAs to remove transcripts from known coding genes by Bowtie 2 or BWA tools. In the fourth step, the secondary structures of the remaining transcripts were predicted. RNAfold [139] and Mfold [120] are recommended for secondary structure prediction. The fifth step is to use coding potential assessment tools, such as CPC [107], CNCI [111], COME [112], CPAT [113], Pfamscan [114], phyloCSF [115], to further predict coding potentials of putative lncRNAs. CPC2 is preferred tools to predict coding potentials of lncRNAs, since CPC2 is available mobile-friendly web server and as a downloadable standalone package [107, 108]. The sixth step is to examine coding potential for filtered lncRNAs by mapping them to different databases. The NCBI nt and nr database is the preferred mapping database in this step since they include sequences for all kinds of species. The seventh step is to predict potential functions of lncRNAs. NPInter [109], PNRD [118], LncRNAdb [100], PLNlncRbase [116], PLncDB [117] could be used in this step. PLNlncRbase is preferred because it is an easy-to-use database which provides detailed information for experimentally identified plant lncRNAs.

Although we introduced some related databases and tools in the analysis miRNAs and lncRNAs as shown in Figure 1, researchers can choose some other tools based on their own needs.

Şekil 1

The general bioinformatics analysis processes of miRNAs and lncRNAs, and their corresponding computational resources. The arrows indicate the suggested steps when performing miRNAs and lncRNAs bioinformatics analysis. The corresponding computational resources for the analysis steps are shown in the right panels within the dashed-line boxes. Part a and b are the general analysis processes of miRNAs and lncRNAs, respectively. The resources in bold are recommended in the corresponding analysis steps.


Int J Biol Sci Image
(Click on the image to enlarge.)

The Department of Energy (DOE) Joint Genome Institute (JGI) Genome Portal [23, 24] (http://genome.jgi.doe.gov/) is a comprehensive website that stores the high-throughput sequencing information for diverse species, including green plant, microbes, fungi, and some biological information analysis tools. JGI Phytozome (https://phytozome.jgi.doe.gov/pz/portal.html) is its sub website which is a comparative database for genomes of green plant and gene family data and analysis. There are three functional modules where users can choose and set, i.e., Species, Tools, and Download. In the module of Species, the website provides the genome of most plant species, e.g., Arabidopsis thaliana TAIR10 (Thale cress), Oryza sativa (Rice), Medicago truncatula (Barrel medic), Triticum aestivum (Common wheat), Sorghum bicolor (Cereal grass) and so on. The Tools module includes Keyword search, BLAST, BLAT, JBrowse, PhytoMine, and BioMart. Users can download a different version of plant genome sequencing information through the Download module. JGI Phytozome is updated regularly. All genomes in JGI Phytozome have been annotated with KOG, KEGG, ENZYME, Pathway, InterPro [145]. In JBrowse option, users can browse the details of listed genomes, including gene site, length, and annotation.

NcRNAs play important regulatory roles in plants, affecting plant growth and development, disease resistances, stress tolerances, biosynthesis of secondary metabolites and many other aspects [2]. With the development of modern high-throughput sequencing technology, more and more ncRNA has been reported. We summarize the web-based resources of ncRNAs and provide some preferred tools for different analysis tasks.

The research was supported in part by two grants (No. 31460295 and 31760314) of National Natural Science Foundation of China (http://www.nsfc.gov.cn/) and a grant (No. SKLGE-1511) of the Open Research Funds of the State KeyLaboratory of Genetic Engineering, Fudan University, China, to YZ, and grants (No. 2013FA031 and 2014FA003) of the Science and Technology Bureau of Yunnan Province to XC. The funders had no role in study design, data collection and analysis, decision to publish, or preparation of the manuscript.

The authors have declared that no competing interest exists.

1.
Kapranov P, Cheng J, Dike S, Nix DA, Duttagupta R, Willingham AT. et al. RNA maps reveal new RNA classes and a possible function for pervasive transcription. Science. 2007;316:1484-8

2.
Bartel DP. MicroRNAs: genomics, biogenesis, mechanism, and function. Cell. 2004;116:281-97

3.
Bartel DP. MicroRNAs: target recognition and regulatory functions. Cell. 2009;136:215-33

4.
St Laurent G, Wahlestedt C, Kapranov P. The Landscape of long noncoding RNA classification. Trends in genetics: TIG. 2015;31:239-51

5.
Michael TP, VanBuren R. Progress, challenges and the future of crop genomes. Current opinion in plant biology. 2015;24:71-81

6.
Berardini TZ, Reiser L, Li D, Mezheritsky Y, Muller R, Strait E. et al. The Arabidopsis information resource: Making and mining the “gold standard” annotated reference plant genome. Genesis. 2015;53:474-85

7.
Lamesch P, Berardini TZ, Li D, Swarbreck D, Wilks C, Sasidharan R. et al. The Arabidopsis Information Resource (TAIR): improved gene annotation and new tools. Nucleic acids research. 2012;40:D1202-10

8.
International Wheat Genome Sequencing C. A chromosome-based draft sequence of the hexaploid bread wheat (Triticum aestivum) genome. Science. 2014;345:1251788

9.
Ouyang S, Zhu W, Hamilton J, Lin H, Campbell M, Childs K. et al. The TIGR Rice Genome Annotation Resource: improvements and new features. Nucleic acids research. 2007;35:D883-7

10.
Kawahara Y, de la Bastide M, Hamilton JP, Kanamori H, McCombie WR, Ouyang S. et al. Improvement of the Oryza sativa Nipponbare reference genome using next generation sequence and optical map data. Rice. 2013;6:4

11.
Xu Y, Guo M, Liu X, Wang C, Liu Y. SoyFN: a knowledge database of soybean functional networks. Database: the journal of biological databases and curation. 2014;2014:bau019

12.
Ma Y, Xu T, Wan D, Ma T, Shi S, Liu J. et al. The salinity tolerant poplar database (STPD): a comprehensive database for studying tree salt-tolerant adaption and poplar genomics. BMC genomics. 2015;16:205

13.
Fei Z, Joung JG, Tang X, Zheng Y, Huang M, Lee JM. et al. Tomato Functional Genomics Database: a comprehensive resource and analysis package for tomato functional genomics. Nucleic acids research. 2011;39:D1156-63

14.
Iwakawa HO, Tomari Y. The Functions of MicroRNAs: mRNA Decay and Translational Repression. Trends in cell biology. 2015;25:651-65

15.
Ling H, Fabbri M, Calin GA. MicroRNAs and other non-coding RNAs as targets for anticancer drug development. Nature reviews Drug discovery. 2013;12:847-65

16.
Ferdous J, Hussain SS, Shi BJ. Role of microRNAs in plant drought tolerance. Plant biotechnology journal. 2015;13:293-305

17.
Wang H, Chung PJ, Liu J, Jang IC, Kean MJ, Xu J. et al. Genome-wide identification of long noncoding natural antisense transcripts and their responses to light in Arabidopsis. Genome research. 2014;24:444-53

18.
Zhang YC, Liao JY, Li ZY, Yu Y, Zhang JP, Li QF. et al. Genome-wide screening and functional analysis identify a large number of long noncoding RNAs involved in the sexual reproduction of rice. Genome biology. 2014;15:512

19.
Chekanova JA. Long non-coding RNAs and their functions in plants. Current opinion in plant biology. 2015;27:207-16

20.
Bardou F, Ariel F, Simpson CG, Romero-Barrios N, Laporte P, Balzergue S. et al. Long noncoding RNA modulates alternative splicing regulators in Arabidopsis. Developmental cell. 2014;30:166-76

21.
Wang Y, Fan X, Lin F, He G, Terzaghi W, Zhu D. et al. Arabidopsis noncoding RNA mediates control of photomorphogenesis by red light. Proceedings of the National Academy of Sciences of the United States of America. 2014;111:10359-64

22.
Mattick JS, Rinn JL. Discovery and annotation of long noncoding RNAs. Nature structural & molecular biology. 2015;22:5-7

23.
Grigoriev IV, Nordberg H, Shabalov I, Aerts A, Cantor M, Goodstein D. et al. The genome portal of the Department of Energy Joint Genome Institute. Nucleic acids research. 2012;40:D26-32

24.
Nordberg H, Cantor M, Dusheyko S, Hua S, Poliakov A, Shabalov I. et al. The genome portal of the Department of Energy Joint Genome Institute: 2014 updates. Nucleic acids research. 2014;42:D26-31

25.
Lawrence CJ, Harper LC, Schaeffer ML, Sen TZ, Seigfried TE, Campbell DA. MaizeGDB: The maize model organism database for basic, translational, and applied research. International journal of plant genomics. 2008;2008:496957

26.
Andorf CM, Cannon EK, Portwood JL 2nd, Gardiner JM, Harper LC, Schaeffer ML. et al. MaizeGDB update: new tools, data and interface for the maize model organism database. Nucleic acids research. 2016;44:D1195-201

27.
Grant D, Nelson RT, Cannon SB, Shoemaker RC. SoyBase, the USDA-ARS soybean genetics and genomics database. Nucleic acids research. 2010;38:D843-6

28.
Yao W, Li G, Yu Y, Ouyang Y. funRiceGenes dataset for comprehensive understanding and application of rice functional genes.
GigaScience. 2017

29.
Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM. et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature genetics. 2000;25:25-9

30.
The Gene Ontology C. Expansion of the Gene Ontology knowledgebase and resources. Nucleic acids research. 2017;45:D331-D8

31.
Kanehisa M, Goto S, Kawashima S, Okuno Y, Hattori M. The KEGG resource for deciphering the genome. Nucleic acids research. 2004;32:D277-80

32.
Wu J, Mao X, Cai T, Luo J, Wei L. KOBAS server: a web-based platform for automated annotation and pathway identification. Nucleic acids research. 2006;34:W720-4

33.
Xie C, Mao X, Huang J, Ding Y, Wu J, Dong S. et al. KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases. Nucleic acids research. 2011;39:W316-22

34.
Zhang Z, Sang J, Ma L, Wu G, Wu H, Huang D. et al. RiceWiki: a wiki-based database for community curation of rice genes. Nucleic acids research. 2014;42:D1222-8

35.
Xia L, Zou D, Sang J, Xu X, Yin H, Li M. et al. Rice Expression Database (RED): An integrated RNA-Seq-derived gene expression database for rice. Journal of genetics and genomics = Yi chuan xue bao. 2017;44:235-41

36.
Members BIGDC. The BIG Data Center: from deposition to integration to translation. Nucleic acids research. 2017;45:D18-D24

37.
Consortium IRP, Hao L, Zhang H, Zhang Z, Hu S, Xue Y. Information Commons for Rice (IC4R). Nucleic acids research. 2016;44:D1172-80

38.
Cheng F, Liu S, Wu J, Fang L, Sun S, Liu B. et al. BRAD, the genetics and genomics database for Brassica plants. BMC plant biology. 2011;11:136

39.
Wang X, Wu J, Liang J, Cheng F, Wang X. Brassica database (BRAD) version 2.0: integrating and mining Brassicaceae species genomic resources. Database:
 the journal of biological databases and curation. 2015:2015

40.
Nussbaumer T, Martis MM, Roessner SK, Pfeifer M, Bader KC, Sharma S. et al. MIPS PlantsDB: a database framework for comparative plant genome research. Nucleic acids research. 2013;41:D1144-51

41.
Spannagl M, Nussbaumer T, Bader KC, Martis MM, Seidel M, Kugler KG. et al. PGSB PlantsDB: updates to the database framework for comparative plant genome research. Nucleic acids research. 2016;44:D1141-7

42.
Luo H, Zhao W, Wang Y, Xia Y, Wu X, Zhang L. et al. SorGSD: a sorghum genome SNP database. Biotechnology for biofuels. 2016;9:6

43.
He J, Benedito VA, Wang M, Murray JD, Zhao PX, Tang Y. et al. The Medicago truncatula gene expression atlas web server. BMC bioinformatics. 2009;10:441

44.
Shao Y, Wei J, Wu F, Zhang H, Yang D, Liang Z. et al. DsTRD: Danshen Transcriptional Resource Database. PloS one. 2016;11:e0149747

45.
Zhang L, Guo J, You Q, Yi X, Ling Y, Xu W. et al. GraP: platform for functional genomics analysis of Gossypium raimondii. Database: the journal of biological databases and curation. 2015;2015:bav047

46.
Li J, Dai X, Liu T, Zhao PX. LegumeIP: an integrative database for comparative genomics and transcriptomics of model legumes. Nucleic acids research. 2012;40:D1221-9

47.
Naithani S, Preece J, D'Eustachio P, Gupta P, Amarasinghe V, Dharmawardhana PD. et al. Plant Reactome: a resource for plant pathways and comparative analysis. Nucleic acids research. 2017;45:D1029-D39

48.
Tello-Ruiz MK, Stein J, Wei S, Preece J, Olson A, Naithani S. et al. Gramene 2016: comparative plant genomics and pathway resources. Nucleic acids research. 2016;44:D1133-40

49.
Petryszak R, Keays M, Tang YA, Fonseca NA, Barrera E, Burdett T. et al. Expression Atlas update-an integrated database of gene and protein expression in humans, animals and plants. Nucleic acids research. 2016;44:D746-52

50.
Kurotani A, Yamada Y, Shinozaki K, Kuroda Y, Sakurai T. Plant-PrAS: a database of physicochemical and structural properties and novel functional regions in plant proteomes. Plant & cell physiology. 2015;56:e11

51.
Kurotani A, Yamada Y, Sakurai T. Alga-PrAS (Algal Protein Annotation Suite): A Database of Comprehensive Annotation in Algal Proteomes. Plant & cell physiology. 2017;58:e6

52.
Duvick J, Fu A, Muppirala U, Sabharwal M, Wilkerson MD, Lawrence CJ. et al. PlantGDB: a resource for comparative plant genomics. Nucleic acids research. 2008;36:D959-65

53.
Bai Y, Zhang Z, Fei Z. Databases and Bioinformatics for Cucurbit Species; 2016.

54.
Bolser D, Staines DM, Pritchard E, Kersey P. Ensembl Plants: Integrating Tools for Visualizing, Mining, and Analyzing Plant Genomics Data. Methods in molecular biology. 2016;1374:115-40

55.
Griffiths-Jones S, Grocock RJ, van Dongen S, Bateman A, Enright AJ. miRBase: microRNA sequences, targets and gene nomenclature. Nucleic acids research. 2006;34:D140-4

56.
Griffiths-Jones S, Saini HK, van Dongen S, Enright AJ. miRBase: tools for microRNA genomics. Nucleic acids research. 2008;36:D154-8

57.
Kozomara A, Griffiths-Jones S. miRBase: annotating high confidence microRNAs using deep sequencing data. Nucleic acids research. 2014;42:D68-73

58.
Kozomara A, Griffiths-Jones S. miRBase: integrating microRNA annotation and deep-sequencing data. Nucleic acids research. 2011;39:D152-7

59.
Kalvari I, Argasinska J, Quinones-Olvera N, Nawrocki EP, Rivas E, Eddy SR. et al. Rfam 13.0: shifting to a genome-centric resource for non-coding RNA families.
Nucleic acids research. 2017

60.
Hsu SD, Lin FM, Wu WY, Liang C, Huang WC, Chan WL. et al. miRTarBase: a database curates experimentally validated microRNA-target interactions. Nucleic acids research. 2011;39:D163-9

61.
Hsu SD, Tseng YT, Shrestha S, Lin YL, Khaleel A, Chou CH. et al. miRTarBase update 2014: an information resource for experimentally validated miRNA-target interactions. Nucleic acids research. 2014;42:D78-85

62.
Chou CH, Chang NW, Shrestha S, Hsu SD, Lin YL, Lee WH. et al. miRTarBase 2016: updates to the experimentally validated miRNA-target interactions database. Nucleic acids research. 2016;44:D239-47

63.
Chou CH, Shrestha S, Yang CD, Chang NW, Lin YL, Liao KW. et al. miRTarBase update 2018: a resource for experimentally validated microRNA-target interactions.
Nucleic acids research. 2017

64.
Vergoulis T, Kanellos I, Kostoulas N, Georgakilas G, Sellis T, Hatzigeorgiou A. et al. mirPub: a database for searching microRNA publications. Bioinformatics. 2015;31:1502-4

65.
Dsouza M, Larsen N, Overbeek R. Searching for patterns in genomic data. Trends in Genetics. 1997;13:497-8

66.
Wu HJ, Ma YK, Chen T, Wang M, Wang XJ. PsRobot: a web-based plant small RNA meta-analysis toolbox. Nucleic acids research. 2012;40:W22-8

67.
Dai X, Zhao PX. psRNATarget: a plant small RNA target analysis server. Nucleic acids research. 2011;39:W155-9

68.
Addo-Quaye C, Miller W, Axtell MJ. CleaveLand: a pipeline for using degradome data to find cleaved small RNA targets. Bioinformatics. 2009;25:130-1

69.
Chiromatzo AO, Oliveira TY, Pereira G, Costa AY, Montesco CA, Gras DE. et al. miRNApath: a database of miRNAs, target genes and metabolic pathways. Genetics and molecular research: GMR. 2007;6:859-65

70.
Sethupathy P, Corda B, Hatzigeorgiou AG. TarBase: A comprehensive database of experimentally supported animal microRNA targets. Rna. 2006;12:192-7

71.
Papadopoulos GL, Reczko M, Simossis VA, Sethupathy P, Hatzigeorgiou AG. The database of experimentally supported targets: a functional update of TarBase. Nucleic acids research. 2009;37:D155-8

72.
Karakulah G, Yucebilgili Kurtoglu K, Unver T. PeTMbase: A Database of Plant Endogenous Target Mimics (eTMs). PloS one. 2016;11:e0167698

73.
Chien CH, Chiang-Hsieh YF, Chen YA, Chow CN, Wu NY, Hou PF. et al. AtmiRNET: a web-based resource for reconstructing regulatory networks of Arabidopsis microRNAs. Database: the journal of biological databases and curation. 2015;2015:bav042

74.
Gurjar AK, Panwar AS, Gupta R, Mantri SS. PmiRExAt: plant miRNA expression atlas database and web applications. Database:
 the journal of biological databases and curation. 2016:2016

75.
Zhang C, Li G, Zhu S, Zhang S, Fang J. tasiRNAdb: a database of ta-siRNA regulatory pathways. Bioinformatics. 2014;30:1045-6

76.
Chorostecki U, Palatnik JF. comTAR: a web tool for the prediction and characterization of conserved microRNA targets in plants. Bioinformatics. 2014;30:2066-7

77.
Lei J, Sun Y. miR-PREFeR: an accurate, fast and easy-to-use plant miRNA prediction tool using small RNA-Seq data. Bioinformatics. 2014;30:2837-9

78.
Gustafson AM, Allen E, Givan S, Smith D, Carrington JC, Kasschau KD. ASRP: the Arabidopsis Small RNA Project Database. Nucleic acids research. 2005;33:D637-40

79.
Zhang Z, Yu J, Li D, Zhang Z, Liu F, Zhou X. et al. PMRD: plant microRNA database. Nucleic acids research. 2010;38:D806-13

80.
Yang JH, Li JH, Shao P, Zhou H, Chen YQ, Qu LH. starBase: a database for exploring microRNA-mRNA interaction maps from Argonaute CLIP-Seq and Degradome-Seq data. Nucleic acids research. 2011;39:D202-9

81.
Szczesniak MW, Deorowicz S, Gapski J, Kaczynski L, Makalowska I. miRNEST database: an integrative approach in microRNA search and annotation. Nucleic acids research. 2012;40:D198-204

82.
Szczesniak MW, Makalowska I. miRNEST 2.0: a database of plant and animal microRNAs. Nucleic acids research. 2014;42:D74-7

83.
Gudys A, Szczesniak MW, Sikora M, Makalowska I. HuntMi: an efficient and taxon-specific approach in pre-miRNA identification. BMC bioinformatics. 2013;14:83

84.
Chalk AM, Warfinge RE, Georgii-Hemming P, Sonnhammer EL. siRNAdb: a database of siRNA sequences. Nucleic acids research. 2005;33:D131-4

85.
Dai X, Zhao PX. pssRNAMiner: a plant short small RNA regulatory cascade analysis server. Nucleic acids research. 2008;36:W114-8

86.
Bonnet E, He Y, Billiau K, Van de Peer Y. TAPIR, a web server for the prediction of plant microRNA targets, including target mimics. Bioinformatics. 2010;26:1566-8

87.
Rehmsmeier M, Steffen P, Hochsmann M, Giegerich R. Fast and effective prediction of microRNA/target duplexes. Rna. 2004;10:1507-17

88.
Sun X, Dong B, Yin L, Zhang R, Du W, Liu D. et al. PMTED: a plant microRNA target expression database. BMC bioinformatics. 2013;14:174

89.
Zhang S, Yue Y, Sheng L, Wu Y, Fan G, Li A. et al. PASmiR: a literature-curated database for miRNA molecular regulation in plant response to abiotic stress. BMC plant biology. 2013;13:33

90.
Peng ZY, Zhou X, Li L, Yu X, Li H, Jiang Z. et al. Arabidopsis Hormone Database: a comprehensive genetic and phenotypic information database for plant hormone research in Arabidopsis. Nucleic acids research. 2009;37:D975-82

91.
Jiang Z, Liu X, Peng Z, Wan Y, Ji Y, He W. et al. AHD2.0: an update version of Arabidopsis Hormone Database for plant systematic studies. Nucleic acids research. 2011;39:D1123-9

92.
Liu H, Jin T, Liao R, Wan L, Xu B, Zhou S. et al. miRFANs: an integrated database for Arabidopsis thaliana microRNA function annotations. BMC plant biology. 2012;12:68

93.
Nakano M, Nobuta K, Vemaraju K, Tej SS, Skogen JW, Meyers BC. Plant MPSS databases: signature-based transcriptional resources for analyses of mRNA and small RNA. Nucleic acids research. 2006;34:D731-5

94.
Brown JW, Echeverria M, Qu LH, Lowe TM, Bachellerie JP, Huttenhofer A. et al. Plant snoRNA database. Nucleic acids research. 2003;31:432-5

95.
Bazzini AA, Asis R, Gonzalez V, Bassi S, Conte M, Soria M. et al. miSolRNA: A tomato micro RNA relational database. BMC plant biology. 2010;10:240

96.
Meng Y, Gou L, Chen D, Mao C, Jin Y, Wu P. et al. PmiRKB: a plant microRNA knowledge base. Nucleic acids research. 2011;39:D181-7

97.
Fasold M, Langenberger D, Binder H, Stadler PF, Hoffmann S. DARIO: a ncRNA detection and analysis tool for next-generation sequencing experiments. Nucleic acids research. 2011;39:W112-7

98.
Patra D, Fasold M, Langenberger D, Steger G, Grosse I, Stadler PF. plantDARIO: web based quantitative and qualitative analysis of small RNA-seq data in plants. Frontiers in plant science. 2014;5:708

99.
Muller S, Rycak L, Winter P, Kahl G, Koch I, Rotter B. omiRas: a Web server for differential expression analysis of miRNAs derived from small RNA-Seq data. Bioinformatics. 2013;29:2651-2

100.
Amaral PP, Clark MB, Gascoigne DK, Dinger ME, Mattick JS. lncRNAdb: a reference database for long noncoding RNAs. Nucleic acids research. 2011;39:D146-51

101.
Quek XC, Thomson DW, Maag JL, Bartonicek N, Signal B, Clark MB. et al. lncRNAdb v2.0: expanding the reference database for functional long noncoding RNAs. Nucleic acids research. 2015;43:D168-73

102.
Liu C, Bai B, Skogerbo G, Cai L, Deng W, Zhang Y. et al. NONCODE: an integrated knowledge database of non-coding RNAs. Nucleic acids research. 2005;33:D112-5

103.
He S, Liu C, Skogerbo G, Zhao H, Wang J, Liu T. et al. NONCODE v2.0: decoding the non-coding. Nucleic acids research. 2008;36:D170-2

104.
Bu D, Yu K, Sun S, Xie C, Skogerbo G, Miao R. et al. NONCODE v3.0: integrative annotation of long noncoding RNAs. Nucleic acids research. 2012;40:D210-5

105.
Xie C, Yuan J, Li H, Li M, Zhao G, Bu D. et al. NONCODEv4: exploring the world of long non-coding RNA genes. Nucleic acids research. 2014;42:D98-103

106.
Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y. et al. NONCODE 2016: an informative and valuable data source of long non-coding RNAs. Nucleic acids research. 2016;44:D203-8

107.
Kong L, Zhang Y, Ye ZQ, Liu XQ, Zhao SQ, Wei L. et al. CPC: assess the protein-coding potential of transcripts using sequence features and support vector machine. Nucleic acids research. 2007;35:W345-9

108.
Kang YJ, Yang DC, Kong L, Hou M, Meng YQ, Wei L. et al. CPC2: a fast and accurate coding potential calculator based on sequence intrinsic features.
Nucleic acids research. 2017

109.
Yuan J, Wu W, Xie C, Zhao G, Zhao Y, Chen R. NPInter v2.0: an updated database of ncRNA interactions. Nucleic acids research. 2014;42:D104-8

110.
Hao Y, Wu W, Li H, Yuan J, Luo J, Zhao Y. et al. NPInter v3.0: an upgraded database of noncoding RNA-associated interactions. Database:
 the journal of biological databases and curation. 2016:2016

111.
Sun L, Luo H, Bu D, Zhao G, Yu K, Zhang C. et al. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts. Nucleic acids research. 2013;41:e166

112.
Hu L, Xu Z, Hu B, Lu ZJ. COME: a robust coding potential calculation tool for lncRNA identification and characterization based on multiple features. Nucleic acids research. 2017;45:e2

113.
Wang L, Park HJ, Dasari S, Wang S, Kocher JP, Li W. CPAT: Coding-Potential Assessment Tool using an alignment-free logistic regression model. Nucleic acids research. 2013;41:e74

114.
Mistry J, Bateman A, Finn RD. Predicting active site residue annotations in the Pfam database. BMC bioinformatics. 2007;8:298

115.
Lin MF, Jungreis I, Kellis M. PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions. Bioinformatics. 2011;27:i275-82

116.
Xuan H, Zhang L, Liu X, Han G, Li J, Li X. et al. PLNlncRbase: A resource for experimentally identified lncRNAs in plants. Gene. 2015;573:328-32

117.
Jin J, Liu J, Wang H, Wong L, Chua NH. PLncDB: plant long non-coding RNA database. Bioinformatics. 2013;29:1068-71

118.
Yi X, Zhang Z, Ling Y, Xu W, Su Z. PNRD: a plant non-coding RNA database. Nucleic acids research. 2015;43:D982-9

119.
Zhou Z, Shen Y, Khan MR, Li A. LncReg: a reference resource for lncRNA-associated regulatory networks. Database:
 the journal of biological databases and curation. 2015:2015

120.
Zuker M. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic acids research. 2003;31:3406-15

121.
Andronescu M, Aguirre-Hernandez R, Condon A, Hoos HH. RNAsoft: A suite of RNA secondary structure prediction and design software tools. Nucleic acids research. 2003;31:3416-22

122.
Janssen S, Giegerich R. The RNA shapes studio. Bioinformatics. 2015;31:423-5

123.
Kaiser A, Kruger J, Evers DJ. RNA Movies 2: sequential animation of RNA secondary structures. Nucleic acids research. 2007;35:W330-4

124.
Washietl S, Hofacker IL, Stadler PF. Fast and reliable prediction of noncoding RNAs. Proceedings of the National Academy of Sciences of the United States of America. 2005;102:2454-9

125.
Gruber AR, Neubock R, Hofacker IL, Washietl S. The RNAz web server: prediction of thermodynamically stable and evolutionarily conserved RNA structures. Nucleic acids research. 2007;35:W335-8

126.
Nawrocki EP, Eddy SR. Infernal 1.1: 100-fold faster RNA homology searches. Bioinformatics. 2013;29:2933-5

127.
Chu Q, Zhang X, Zhu X, Liu C, Mao L, Ye C. et al. PlantcircBase: A Database for Plant Circular RNAs. Molecular plant. 2017;10:1126-8

128.
Zhang P, Meng X, Chen H, Liu Y, Xue J, Zhou Y. et al. PlantCircNet: a database for plant circRNA-miRNA-mRNA regulatory networks. Database:
 The Journal of Biological Databases and Curation. 2017:2017

129.
Chen D, Yuan C, Zhang J, Zhang Z, Bai L, Meng Y. et al. PlantNATsDB: a comprehensive database of plant natural antisense transcripts. Nucleic acids research. 2012;40:D1187-93

130.
Consortium RN. RNAcentral: an international database of ncRNA sequences. Nucleic acids research. 2015;43:D123-9

131.
The RC. RNAcentral: a comprehensive database of non-coding RNA sequences. Nucleic acids research. 2017;45:D128-D34

132.
Szymanski M, Erdmann VA, Barciszewski J. Noncoding regulatory RNAs database. Nucleic acids research. 2003;31:429-31

133.
Szymanski M, Erdmann VA, Barciszewski J. Noncoding RNAs database (ncRNAdb). Nucleic acids research. 2007;35:D162-4

134.
Bolger AM, Lohse M, Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 2014;30:2114-20

135.
Martin M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet journal. 2011;17:pp. 10-2

136.
Bao W, Kojima KK, Kohany O. Repbase Update, a database of repetitive elements in eukaryotic genomes. Mobile DNA. 2015;6:11

137.
Ouyang S, Buell CR. The TIGR Plant Repeat Databases: a collective resource for the identification of repetitive sequences in plants. Nucleic acids research. 2004;32:D360-3

138.
Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 2009;10:R25

139.
Lorenz R, Bernhart SH, Honer Zu Siederdissen C, Tafer H, Flamm C, Stadler PF. et al. ViennaRNA Package 2.0. Algorithms for molecular biology: AMB. 2011;6:26

140.
Zheng Y, Li YF, Sunkar R, Zhang W. SeqTar: an effective method for identifying microRNA guided cleavage sites from degradome of polyadenylated transcripts in plants. Nucleic acids research. 2012;40:e28

141.
Brueffer C, Saal LH. TopHat-Recondition: a post-processor for TopHat unmapped reads. BMC bioinformatics. 2016;17:199

142.
Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2. Nature methods. 2012;9:357-9

143.
Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013;29:15-21

144.
Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I. et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nature biotechnology. 2011;29:644-52

145.
Finn RD, Attwood TK, Babbitt PC, Bateman A, Bork P, Bridge AJ. et al. InterPro in 2017-beyond protein family and domain annotations. Nucleic acids research. 2017;45:D190-D9

Corresponding address Corresponding author: YZ (zhengyun5488com)


Received 2017-12-27
Accepted 2018-3-14
Published 2018-5-22

.



Kaynak

admin

Talebemektebi bir sevdanın hikayesi

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir