Araştırma Makalesi

Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi

Cilt: 64 Sayı: 1 12 Mart 2025
PDF İndir
TR EN

Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi

Öz

Amaç: Kopya sayısı varyasyonları, insan genomunun yaklaşık yüzde ikisinde bulunan belirli DNA bölgelerinin kayıp veya kazançlarıdır. Yapısal varyasyonlar arasında yer alan bu grup, sağlıklı popülasyonda bulunabileceği gibi ilgili bölgenin kayıp veya kazançları klinik tablolarla da ilişkilendirilebilir. Tespit edilen kopya sayısı varyasyonunun klinik olarak yorumlanması, aile çalışmasını da gerektiren karmaşık bir süreçtir. Klinik ve genetik verilerin yorumlanması sürecinde her zaman doğru bilgiye ulaşılamamaktadır. Kullanımı artan makine öğrenme algoritmaları giderek tıp alanında da kullanılmakta ve özellikle büyük veri setlerinin bulunduğu genetik gibi alanlarda giderek önem kazanmaktadır. Bu çalışma ile kopya sayısı varyasyonlarının klinik değerlendirilmesinde makine öğrenme algoritmalarının kullanımı amaçlanmıştır. Gereç ve Yöntem: Araştırmada öncelikle 11989 varyant bulunan ISCA konsorsiyumu verileri ile pilot analiz gerçekleştirilmiş, sonrasında ClinVar veri tabanından elde edilen 63156 varyantlı veri seti kullanılmıştır. Beş ana sınıfta (Benign, Muhtemel Benign, VUS, Muhtemel Patojenik ve Patojenik) bulunan varyantlar, Microsoft Azure Machine Learning Studio platformunda, %70 eğitim ve %30 test verisi olarak ayrılmış ve çeşitli makine öğrenmesi algoritmaları (Çok Sınıflı Karar Ağaçları, Lojistik Regresyon ve Sinir Ağı) kullanılarak analiz gerçekleştirilmiştir. Bulgular: ISCA veri seti ile yapılan modelde çok sınıflı karar ağacı ile ortalamada 0,96 doğruluğa ulaşılırken, ClinVar veri setinde yine çok sınıflı karar ağacı ile 0,86 doğruluğa ulaşılmıştır. Bu modelde patojenikler %74.8, benignler %77.6 ve önemi bilinmeyen varyantlar %62.6 oranında doğru tahmin edilmiştir. Çalışmada sık karşılaşılan varyantlar daha yüksek başarı ile tanımlanmış ve örneklemin benign ve patojenik olarak iki sınıflı haline getirilmesi durumunda ise ortalama ve toplamda 0.90 doğruluğa ulaşılmıştır. Sonuç: Bu çalışma, kopya sayısı varyantlarının klinik değerlendirilmesinde kullanılabilecek ve tanıyı otomatikleştirebilecek öncül bir makine öğrenme modeli oluşturulabileceğini göstermiştir.

Anahtar Kelimeler

Kaynakça

  1. Sebat J, Lakshmi B, Troge J, Alexander J, Young J, Lundin P, et al. Large-scale copy number polymorphism in the human genome. Science. 2004 Jul 23;305(5683):525–8.
  2. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, et al. Global variation in copy number in the human genome. Nature. 2006 Nov;444(7118):444–54.
  3. Albertson DG, Pinkel D. Genomic microarrays in human genetic disease and cancer. Hum Mol Genet. 2003 Oct 15;12(suppl 2):R145–52.
  4. Slavotinek AM. Novel microdeletion syndromes detected by chromosome microarrays. Hum Genet [Internet]. 2008 Aug 30 [cited 2019 Nov 3];124(1):1–17. Available from: http://link.springer.com/10.1007/s00439-008- 0513-9
  5. Freeman JL, Perry GH, Feuk L, Redon R, McCarroll SA, Altshuler DM, et al. Copy number variation: new insights in genome diversity. Genome Res [Internet]. 2006 Aug 1 [cited 2019 Jul 9];16(8):949–61. Available from: http://www.ncbi.nlm.nih.gov/pubmed/16809666
  6. Database of Genomic Variants [Internet]. [cited 2019 Nov 3]. Available from: http://dgv.tcag.ca/dgv/app/home
  7. Firth H V., Richards SM, Bevan AP, Clayton S, Corpas M, Rajan D, et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. The American Journal of Human Genetics [Internet]. 2009 Apr [cited 2019 Nov 3];84(4):524–33. Available from: https://linkinghub.elsevier.com/retrieve/pii/S0002929709001074
  8. Kearney HM, Thorland EC, Brown KK, Quintero-Rivera F, South ST. American College of Medical Genetics standards and guidelines for interpretation and reporting of postnatal constitutional copy number variants. Genetics in Medicine. 2011 Jul 15;13(7):680–5.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Tıbbi Genetik (Kanser Genetiği hariç)

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

12 Mart 2025

Gönderilme Tarihi

17 Aralık 2024

Kabul Tarihi

4 Şubat 2025

Yayımlandığı Sayı

Yıl 1970 Cilt: 64 Sayı: 1

Kaynak Göster

Vancouver
1.Erhan Parıltay, Buket Kosova. Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. ETD. 01 Mart 2025;64(1):143-52. doi:10.19161/etd.1602958

Ege Tıp Dergisi, makalelerin Atıf-Gayri Ticari-Aynı Lisansla Paylaş 4.0 Uluslararası (CC BY-NC-SA 4.0) lisansına uygun bir şekilde paylaşılmasına izin verir.