DNA dizilemesi tamamlandıktan sonra, makineden çıkan DNA parçaları karmakarışık olur. Yapboz yapar gibi bu parçaları alıp birleştirmek gerekir.

Ne Yapmaya Çalışıyoruz?

DNA dizileme teknolojisi %100 doğruluklu bir işlem değildir. Bu yüzden, üretilen DNA diziliminde hataların olma olasılığı vardır.

Olası hataları telafi etmek için genomdaki her baz çok sayıda kez dizilenir; buna “teminat” (İng. coverage) denir. Örneğin “30 katlı teminat”ın anlamı her bazın 30 kez dizilenmiş olduğudur.

Aslında bir DNA bölümünü ne kadar çok kez dizilerseniz, yani “okursanız”, sonuçta elde edeceğiniz dizilimin doğruluğuna güveniniz o kadar yüksek olur.

Yüksek düzeyde doğruluk ile insan genomu dizilenirken, 30 ilâ 50 katlı teminat, genelde kullanılan standart aralıktır.

İnsan Genomu Projesi sırasında teminat sadece 5 ilâ 10 kat arasındaydı ve bugün kullanılandan farklı bir dizileme teknolojisi kullanılıyordu. Teminat birkaç nedenden ötürü arttı: Şu anki dizileme tekniklerinin çoğu artık İnsan Genomu Projesi sırasında olduklarından daha hızlı olsalar da, kimi dizileme teknolojilerinin hata oranı daha yüksek. Kimi dizileme teknolojileri daha kısa DNA okumaları ile çalışıyor, ki bu da genom birleştirilirken daha fazla boşluk olması anlamına geliyor. Teminatı yükseltmek, sonuçta elde edilecek birleştirilmiş dizilimde boşluk olma olasılığını azaltıyor. Ayrıca yüksek teminatlı dizilim yapmak, şu anda İnsan Genomu Projesi sırasında olduğundan çok daha ucuza mâloluyor.

Yüksek teminatın anlamı şu: DNA’yı diziledikten sonra, bir sürü DNA dizilim (okuma) parçamız olacak demektir.

Bunu gözümüzde canlandırabilmek için bir insan genomu tümüyle dizilendiğinde, 100 gigabazlık (100,000,000,000 bazlık) veri dizisi elde edeceğimizi düşünebiliriz.

Tıpkı bir yapbozun parçaları gibi bu DNA okumaları karışmış durumdadır. Parçaları birleştirmemiz, onları doğru şekilde düzenlememiz gerekir.

Nasıl Yapıyoruz?

Tüm genom dizilimini yapılandırmak için parçaları doğru sırada birleştirmemiz ve ilgilendiğimiz alanları belirlememiz gerekiyor.

Bu, hizalama ve birleştirme işlemleri ile yapılıyor: Hizalama işleminde, yeni DNA dizilimi varolan DNA dizilimleri karşılaştırılır ve aradaki benzerliklere ya da uyuşmazlıklara bakılır. Buna göre düzenleme yapılır. Hizalama, çok önemli bir işlemdir. Birleştirme işleminde, çok sayıda DNA okuması alınır ve birbirleri ile uyuşan alanları aranır. Ardından dereceli olarak yapboz birleştirilir. Bu, başlangıçtaki genomu yeniden yapılandırmak için bir girişimdir. Ağırlıklı olarak de novo dizilimler için kullanılır.



— De novo Dizileme

De novo dizileme, bir organizmanın genomunun ilk kez dizilenmesini ifade eder.

Böyle de novo birleştirmelerde, eldeki tür için şablon olarak kullanılabilecek herhangi bir referans genom dizilimi bulunmaz.

Eğer elinizdeki türe çok benzediğini bildiğiniz başka bir tür varsa ve o türün referans genomu varsa, dizilimi bu benzer genomu rehber olarak kullanarak birleştirebilirsiniz.

Bir de novo dizilimin birleştirilmesine yardımcı olması için dizilemeden önce fiziksel bir gen haritası hazırlanabilir. Böylece belli başlı yerler vurgulanabilir ve araştırmacılar DNA bölümlerinin birbirlerine göre konumlarını anlayabilir.

Gen haritası üretmek pahalı bir işlem olabilir. O nedenle kimi birleştirme programları, tekil uçlu okumalar ile çiftlenmiş uçlu okumaların karışımında oluşan veriye güvenir (aşağıdaki çizime bakınız): Tekil okumalarda bir DNA parçasının bir ucu veya bütünü dizilenmiştir. Bu dizilimler, dizilimde birbirlerine uyan bölgeler bulunarak birleştirilebilir ve böylece eksiksiz DNA dizilimi ortaya konabilir. Çiftlenmiş uçlu okumalarda bir DNA parçasının iki ucu dizilenmiştir. Çiftlenmiş uçlu okumalar arası uzaklık, 200 baz çifti ile birkaç bin baz çifti arasında değişir. Çiftlenmiş uçlu okumaların en iyi yanı, bilimcilerin iki uç arasındaki uzaklığı bilebilmesidir. Bu da onları sürekli bir DNA dizilimi biçiminde birleştirirken büyük kolaylık sağlar. Çiftlenmiş uçlu okumalar, özellikle de novo dizilimleri birleştirirken kullanışlı olur. Çünkü bir gen haritasının yokluğunda başka türlü elde edemeyeceğiniz bilgiler sağlarlar.



Bir de novo dizilimin birleştirilme işlemi, çok sayıda kısa bölümle (DNA okuması ile) başlar.

Bu okumalar birbirleri ile karşılaştırılır ve aynı DNA dizilimini paylaşanlar gruplanır.

Ardından, bitişik dizilimler (İng. contig ) giderek genişleyen bölümler şeklinde birleştirilmeye başlanır.

Bu bitişik dizilimler, onların nasıl bitiştirileceğine ve aralarındaki dizilim henüz bilinmese bile birbirlerinden ne uzaklıkta olduklarına ilişkin ipuçları sağlayan başka teknolojilerden alınan bilgilerle daha sonra gruplanabilir. Bu işleme “omurga oluşturma” (İng. scaffolding ) denir.

Her omurganın kromozomlara yerleştirilmesi ile birleştirme ilerletilebilir. Bunu yaparken fiziksel bir gen haritası, kullanışlı bir alet olur.

Birleştirmeden elde edilen sonuç, işlemin bir sonraki evresi olan “notlamaya” gönderilir; genlerin ve diğer özelliklerin nerede olduğu tanımlanır.

Bir genomun birleştirilmesi büyük ölçüde bilgisayarın işidir. Dizileme makinesinden çıkan parçaların, genom birleştirme programları tarafından bir gigabazlık diziliminin bitiştirilmesi genellikle 20 saat alır.

Dolayısıyla bir insan genomunu diziledikten sonra elimize geçen 100 gigabazlık dizilim verisinin, bir bütün dizilim halinde birleştirilmesi yaklaşık 2.000 saat yani 83 gün alır.

— Yeniden Dizileme

Daha önce genomu dizilenmiş bir türe ait genom dizilemesi yapılması işlemidir. Hazırda bir referans genom bulunur.

Yeniden dizileme, iki ayrı işlemi tanımlamak için kullanılabilen bir terimdir: Yeniden dizileme sözcüğünün kullanıldığı durumlardan biri, söz konusu organizmanın varolan DNA diziliminin kalitesini arttırmaktır. Örneğin 2003 yılında tamamlanan İnsan Genomu Projesi, insan genomuna için ilk birleştirilmiş eksiksiz dizilimi sağlamıştır. O zamandan beri bilimciler daha yüksek kaliteli ve doğruluklu bir referans genom üretmek için çalışıyor. Sonuç olarak, insan referans genomu 2003’ten bu yana çok gelişti. Hatalar düzeltildi, bitişik dizilimlerden yeniden düzenlenenler oldu ve kalan boşluklar dolduruldu. Yeniden dizilemenin diğer bir kullanım durumu ise daha önce başka bir örneğinin genomu dizilenmiş olan bir türün üyesinin genomunun dizilenmesidir. Bu durumda yeni dizilimi, referans dizilim ile karşılaştırabiliriz. Örneğin, eğer yeni genomda varolan bir baz çifti referans genoma uymuyorsa, bir hastalığın genetik orijini hakkında ipucu verebilir. 2003’ten beri bir referans insan genomunun varolması, 1000 Genom Projesi ve UK10K gibi projelerin gerçekleşmesini sağladı. 2008’de hazırlanan 1.000 Genom Projesi, insan genetik varyasyonlarına ilişkin kapsamlı bir kaynak sağlamak için çok sayıda insanın (en az 1000 kişinin) genomunun dizilendiği ilk projeydi. UK10K ise Wellcome Trust tarafından 2010’da hazırlandı ve ender genetik varyantların açığa çıkarılması için Birleşik Krallık’taki her 6000 kişiden birinin DNA analizinin yapılmasını amaçlıyordu. Genomik İngiltere 100.000 Genom Projesi, 2012’nin sonlarında hazırlandı ve ender rastlanan hastalıkları olan kişilere odaklandı.

Referans genom ile karşılaştırmak için yeniden dizileme yapmak, genellikle birleştirme gerektirmez. Çünkü bu işlem zaten referans genom için yapılmış durumda olur. Onun yerine hizalama yapılır ve yeterli olur.

Tüm bölümler hizalandıktan sonra dizilimler arasındaki olası farklar incelenir.

(Önceki aşamalar için bkz. DNA Dizileme Nedir?)

