Yaşamın Şifresini Bulmak Biyoinformatik Nedir?

Merhaba sevgili okurlar, bugün sizlerle yaşamımıza anlam katan, bizi oluşturan, canlıların veri tabanı DNA’yı inceleyen Biyoinformatik bilim dalına giriş yapacağız. Biyoloji, matematik gibi temel bilimlerinin yanı sıra bilgisayar bilimlerini de içeren bu multidisipliner bilim dalına “Biyoinformatik nedir?” sorusuna cevap arayarak giriş yapacağız.

İçindekiler

Biyoinformatik Nedir?

Biyoinformatik, anlaşılması zor ve karmaşık biyolojik verinin insanların anlayabilecek düzeye bilgisayarlar sayesinde indirgenmesi ve analiz edilmesini sağlayan yöntemler diyebiliriz. Sadece yöntemlerle kısıtlı olmayan bu alan ilginç algoritma tasarımları ve değişik uygulamalar da içermektedir. Daha sonraki kısımlarda bu algoritmalardan ve uygulamalardan kısaca bahsedeceğim.

Biyoinformatiğin sağladığı faydalar:
İnsan X kromozomunun haritası

Biyoinformatik, genç bir bilim dalıdır. 4 harfli bir alfabe ile kodlanan genetik bilginin, 20 harfli bir alfabeyi kullanan proteinlere çevrilmesini inceler. Bu kodlanan proteinler, tek hücreli ve çok hücreli canlılara göre önemli işlevlerinin gerçekleşmesini sağlayan üç boyutlu katlanmaları da mercek altına alır. Biyoinformatik‘in amacı, biyoloji alanındaki veri ve bilginin toplanıp, temsil ve analizinin yapılmasının sağlanması sonucu ortaya çıkan problemleri çözümlemeye yönelik en son teknoloji yöntemler ve tasarımlar geliştirmektir.

Biyoinformatik’in Kısa Tarihçesi

Biyoinformatik nedir?

Yeni yeni ortaya çıkmaya başlamış olsa bile birden fazla bilime katkı sağlamaya ve önem kazanmaya devam etmektedir. 1980’lerin sonlarına doğru, bilgisayar bilimindeki başarılardan sonra bu yeteneklerin biyoloji alanına uygulanmasından sonra ortaya çıkmıştır. Ayrıca, genom dizileme, mikrodüzenler ve proteomik gibi alanlarda tanık olunan biyoteknolojik gelişmeler biyoinformatiğin daha da hızlı bir şekilde gelişmesine sebep olmuştur. İnternetin gelişmesi ve yaygınlaşmasıyla birlikte bu yöntemler ve gelişmeler herkese yayılmış, Dünya çapında bu bilim dalının ünlendiğini söyleyebiliriz.

Günümüzde, BLAST (Basic Local Alignment Search Tool) algoritması, ikili ve çoklu dizi karşılaştırmalarında, biyolojik veri tabanlarının sorgulanmasında ve filogenetik analizlerinde doğa bilimciler tarafından çokça kullanılmaktadır. Protein ve DNA dizilerini karşılaştırmak için kullanılan ilk algoritma ise Needleman ve Wunsch tarafından 1970 yılında geliştirilmiştir. 1970 yılında ilk algoritma geliştirilmesine rağmen, biyoinformatik kavramı 1978 yılında literatüre geçmiştir. “Biyotik sistemlerde bilgi süreçlerinin çalışılması” olarak tanımlanmıştır. Biyoinformatik kelimesinin üretilmesinden yaklaşık 20 yıl sonra kemoinformatik yayınlanmıştır. Bu da biyoinformatik gibi biyoloji alanında değil kimya alanında işlevsellik göstermektedir. Kimya çalışmalarında kullanılmaktadır. Bu alandaki en önemli gelişme, 1990 yılında başlayan İnsan Genom Projesi’dir. Bu sayede Dünya’da daha da tanınmış ve 2000’li yıllarda bilim dalı olarak tanınmıştır.

Kısa bir tarihçeden sonra biyoinformatik alanının ne gibi işler yaptığına bir göz atmak konuya hem açıklık getirecek hem de daha anlaşılır olmasını sağlayacağını düşünüyorum.

Biyoinformatik’in Çalışma Alanları

  1. DNA dizileme
  2. Protein dizileme
  3. DNA, RNA, Protein gibi yapıların 2 boyutlu ve 3 boyutlu yapı araştırmaları
  4. Biyolojik veri tabanlarının oluşturulması, entegrasyonu
  5. Bilgisayar ile veri analizi
  6. Proteinlerin yapılarının ve fonksiyonlarının belirlenmesi
  7. Genetik faktörlerin hastalık yatkınlığının etkilerinin incelenmesi
  8. Tıbbi amaçlı yeni makro moleküllerinin üretilmesi
  9. Protein yapı temelli akılcı ilaç tasarımı
  10. Ökaryotik genomların çözümlenmesi
Proteinin PyMol gibi uygulamalarla 3D modellenmesi

gibi örnekler Biyoinformatik‘in çalışma alanları olarak bahsedilebilir. Ayrıca, Biyoinformatik için kullanılan, internette ücretsiz veya ücretli bir şekilde kullanılan veri tabanlarından bazılarına örnek vermek isterim.

Biyolojik Veri Tabanları

  • GenBank: En iyi bilinen nükleotid dizi veri tabanıdır. Herkesin kullanımına açıktır.
  • EBI: Avrupa Biyoinformatik Enstitüsü. GenBank’ın Avrupa’daki karşılığıdır.
  • ENA: Avrupa Nükleotid Arşivi.
  • UniProt: Protein dizi veri tabanıdır.
  • NCBI: En tanınmış protein veri tabanlarından biridir. Birden fazla başka veri tabanlarından girdi alarak çalışır.
  • Prosite: İsveç Biyoinformatik Enstitüsü bünyesinde bulunan bir ikincil veri tabanıdır.
  • PDB: Protein Veri Bankası. 121.000 makromolekül yapısı PDB veri tabanında depolanmaktadır. Bunların çoğu proteinlere ait yapılardır. Ayrıca, DNA ve RNA gibi yapılar da bulunmaktadır.

Biyoinformatik alanında geliştirilen bazı algoritmalardan da bahsetmek isterim. Bunlardan da kısaca bahsettikten sonra “Biyoinformatik nedir?” adlı yazımıza son verebiliriz.

Temel Algoritmalar

  • Hamming Distance Problem: 2 DNA dizisinin karşılaştırılırken aralarında farklara bakılmasını temel alır. Python ile kolayca kodlanabilen küçük fonksiyon parçası diyebiliriz. Fakat çoğu karşılaştırma algoritmasının temel yapı taşıdır.
  • Skew Diagram: DNA’nın nereden eşlenmesinin bulunması probleminde DNA origin’inin bulunmasına yardımcı olan algoritmadır. C-G çiftlerine bakılarak yapılıyor. Genellikle minimum noktaları DNA eşlenme noktasını gösterir.
  • Approximate Pattern Count: DNA karşılaştırmalarında kullanılan, DNA içinde bulunan k-mer çiftlerinin sayılarının bulunmasını sağlar. Hamming distance burada önemli rol oynar. İşlemleri temel dizi işlemleri gibi düşünebilirsiniz. Yani, TCGATA gibi bir dizimiz olduğunu düşünün. Eğer bize 2-mer soruluyorsa, TC- CG- GA- AT- TA gibi nükleotit dizilerinin toplam sayılarına bakılacak. Şu an size az görünmüş olsa da DNA milyonlarca nükleotit içerdiğinden bu elde edilen sonuç çok önemli olabilmektedir.
  • Approximate Pattern Matching: Üsttekine benzer bir mantıkla çalışır. Sadece 2 DNA karşılaştırılması sırasında içerisindeki farklılıkların da işin içine dahil edilmesini sağlar. Yani, ATCGAT ve ATAGTT örneklerinde görüldüğü üzere, ikisi arasındaki farklılık 2’dir. Bu kısımda ise bunlara bakılarak anlamlı bir sonuç elde edilmektedir.
  • Motifs: DNA dizilerinin alt alta farklılıkların görülebilmesi için sıralanmasını sağlar.
  • Score: Motifler kullanılarak her DNA zinciri için bir score elde edilmektedir. Bu score’lar DNA zincirleri arasındaki farklılıkları temsil eder.
  • Count: A-T-C-G’lerinin her DNA zinciri için nerede bulunabileceği olasılığı hesaplanır.
  • Profile: Count’un sağladığı sonuçlar burada gösterilmektedir.
  • Consensus: DNA’nın eşlenmesinin başladığı en mantıklı motif yazdırılmaktadır.

Aslında, hepsi birbirine bağlı algoritmalar diyebiliriz. Greedy Motif Search, Randomized Motif Search, GibbsSampler gibi birbirinden farklı gibi gözüken, fakat ortak noktaları bulunan bu algoritmalar da kullanılmaktadır. Daha nice problemleri çözen algoritmalar var. Benim burada bahsettiklerim genellikle DNA’nın nereden eşlenmeye başlayacağı problemine cevap aramaktadır. Siz de internetten araştırarak ya da Course üzerinden değişik üniversitelerin sunduğu kursları edinerek bu alanda bilgilerinizi arttırabilirsiniz.

Biyoinformatik Nedir: Son Bakış

Bu bilim dalı sayesinde, gelecekte çoğu hastalığa tedavi bulunabilir, hatta bulunacak. Bilim insanları bunun ümidini taşımaktadır. Ben de buna inanmaktayım. DNA’nın sırlarının açığa çıkması ile bunun sağlanabileceği apaçık görünmektedir. Teknolojinin gelişmesi de bunu sağlayacak. Filmlerde gördüğümüz çoğu tedavi belki de gelecekte mevcut olacak, yaşam süremiz daha da artabilecektir. Fakat, bu işler göründüğü gibi bence kolay olmayacak. Çok fazla zaman ve para gerekebilir. Kişinin DNA’sına özel ilaç tasarımı çok maliyetli olabilir ve geliri düşük insanlar bunlara ulaşamayabilir. Bunları yaşayıp birlikte deneyimleyeceğiz. Umarım her şeyin güzeli olur. Bu konu hakkında daha nice kaynak bulunmaktadır. Bulduğunuz ilginç ve güzel bilgileri benle paylaşmaktan çekinmeyin. Bilim paylaştıkça güzeldir. “Biyoinformatik nedir?” yazımızın da sonuna geldik. Bilimle kalın.

REFERANSLAR: Vikipedi, Biyoinformatik, Uygulamalı Biyoinformatik Kitabı

Sitemizde yer alan diğer yazılarımıza buradan ulaşabilirsiniz.

Bilimlerarası Köprü: Biyofizik Nedir?

El-Harezmi Kimdir?

Feynman Tekniği Nedir?

tarafından yazıldı Volkan Mazlum

Endüstri Mühendislerinin Bilmesi Gereken Programlar

Google AdWords İle Akıllı Teklif Stratejileri