TGICL, büyük Ekspres Sıra Etiketleri (EST) ve mRNA veritabanları dizileri ikili olarak kümelenir. Dizi benzerliğinden yola çıkarak okumaları birleştirir. Daha uzun okumalar elde etmek için kümeler (isteğe bağlı olarak kalite değerleri ile) ve eksiksiz konsensüs dizileri oluşturur. Sistem, SMP ve PVM dahil çoklu CPU mimarilerinde çalışır.

TGICL Aracıyla De Novo Transkriptom Assembly

RNA Transkirptom çalışmalarında referans genomu olmayan bir projede, temiz okumalar elde etmek için sekans okumaları birleştirilmelidir. Bunun için filtreleme yapıldıktan sonra Trinity aracı kullanılır. Eğer birden fazla örnek varsa, TGICL aracından da destek alınabilir. Trinity, sekans verilerini, her biri belirli bir gendeki transkripsiyonel karmaşıklığı temsil eden birçok ayrı de Bruijn grafiğine böler. Daha sonra tam uzunlukta  izoformlarını çıkarmak ve tease etmek için her grafiği bağımsız olarak işler.

Inchworm: Okumaları, genellikle baskın bir izoform için tam uzunlukta transkriptler oluşturan benzersiz transkript dizileri halinde birleştirir. Daha sonra alternatif olarak yalnızca benzersiz bölümlerini belirtir.

Chrysalis: Inchworm’u kümeler halinde birleştirir ve de Bruijn grafikleri oluşturur. Her küme, belirli bir genin (veya gen kümelerinin) tam transkriptonal karmaşıklığını temsil eder. Chrysalis daha sonra tam okuma kümesini ayrık olarak gruplandırır.

Butterfly: Daha sonra bireysel grafikleri paralel olarak işler, okuyan ve okuma çiftlerinin grafiğin içine aldığı yolları izler, sonuçta alternatif olarak eklenmiş izoformlar için tam uzunluktaki transkriptleri rapor eder ve paralog genlere karşılık gelen transkriptleri birbirinden ayırır.

De Novo Assembly Prosesi

Kaynak:

  1. https://academic.oup.com/bioinformatics/article/19/5/651/239299

Leave A Comment

All fields marked with an asterisk (*) are required