Research Article

Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi

Volume: 64 Number: 1 March 12, 2025
TR EN

Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi

Öz

Amaç: Kopya sayısı varyasyonları, insan genomunun yaklaşık yüzde ikisinde bulunan belirli DNA bölgelerinin kayıp veya kazançlarıdır. Yapısal varyasyonlar arasında yer alan bu grup, sağlıklı popülasyonda bulunabileceği gibi ilgili bölgenin kayıp veya kazançları klinik tablolarla da ilişkilendirilebilir. Tespit edilen kopya sayısı varyasyonunun klinik olarak yorumlanması, aile çalışmasını da gerektiren karmaşık bir süreçtir. Klinik ve genetik verilerin yorumlanması sürecinde her zaman doğru bilgiye ulaşılamamaktadır. Kullanımı artan makine öğrenme algoritmaları giderek tıp alanında da kullanılmakta ve özellikle büyük veri setlerinin bulunduğu genetik gibi alanlarda giderek önem kazanmaktadır. Bu çalışma ile kopya sayısı varyasyonlarının klinik değerlendirilmesinde makine öğrenme algoritmalarının kullanımı amaçlanmıştır. Gereç ve Yöntem: Araştırmada öncelikle 11989 varyant bulunan ISCA konsorsiyumu verileri ile pilot analiz gerçekleştirilmiş, sonrasında ClinVar veri tabanından elde edilen 63156 varyantlı veri seti kullanılmıştır. Beş ana sınıfta (Benign, Muhtemel Benign, VUS, Muhtemel Patojenik ve Patojenik) bulunan varyantlar, Microsoft Azure Machine Learning Studio platformunda, %70 eğitim ve %30 test verisi olarak ayrılmış ve çeşitli makine öğrenmesi algoritmaları (Çok Sınıflı Karar Ağaçları, Lojistik Regresyon ve Sinir Ağı) kullanılarak analiz gerçekleştirilmiştir. Bulgular: ISCA veri seti ile yapılan modelde çok sınıflı karar ağacı ile ortalamada 0,96 doğruluğa ulaşılırken, ClinVar veri setinde yine çok sınıflı karar ağacı ile 0,86 doğruluğa ulaşılmıştır. Bu modelde patojenikler %74.8, benignler %77.6 ve önemi bilinmeyen varyantlar %62.6 oranında doğru tahmin edilmiştir. Çalışmada sık karşılaşılan varyantlar daha yüksek başarı ile tanımlanmış ve örneklemin benign ve patojenik olarak iki sınıflı haline getirilmesi durumunda ise ortalama ve toplamda 0.90 doğruluğa ulaşılmıştır. Sonuç: Bu çalışma, kopya sayısı varyantlarının klinik değerlendirilmesinde kullanılabilecek ve tanıyı otomatikleştirebilecek öncül bir makine öğrenme modeli oluşturulabileceğini göstermiştir.

Anahtar Kelimeler

References

  1. Sebat J, Lakshmi B, Troge J, Alexander J, Young J, Lundin P, et al. Large-scale copy number polymorphism in the human genome. Science. 2004 Jul 23;305(5683):525–8.
  2. Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, et al. Global variation in copy number in the human genome. Nature. 2006 Nov;444(7118):444–54.
  3. Albertson DG, Pinkel D. Genomic microarrays in human genetic disease and cancer. Hum Mol Genet. 2003 Oct 15;12(suppl 2):R145–52.
  4. Slavotinek AM. Novel microdeletion syndromes detected by chromosome microarrays. Hum Genet [Internet]. 2008 Aug 30 [cited 2019 Nov 3];124(1):1–17. Available from: http://link.springer.com/10.1007/s00439-008- 0513-9
  5. Freeman JL, Perry GH, Feuk L, Redon R, McCarroll SA, Altshuler DM, et al. Copy number variation: new insights in genome diversity. Genome Res [Internet]. 2006 Aug 1 [cited 2019 Jul 9];16(8):949–61. Available from: http://www.ncbi.nlm.nih.gov/pubmed/16809666
  6. Database of Genomic Variants [Internet]. [cited 2019 Nov 3]. Available from: http://dgv.tcag.ca/dgv/app/home
  7. Firth H V., Richards SM, Bevan AP, Clayton S, Corpas M, Rajan D, et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. The American Journal of Human Genetics [Internet]. 2009 Apr [cited 2019 Nov 3];84(4):524–33. Available from: https://linkinghub.elsevier.com/retrieve/pii/S0002929709001074
  8. Kearney HM, Thorland EC, Brown KK, Quintero-Rivera F, South ST. American College of Medical Genetics standards and guidelines for interpretation and reporting of postnatal constitutional copy number variants. Genetics in Medicine. 2011 Jul 15;13(7):680–5.

Details

Primary Language

Turkish

Subjects

Medical Genetics (Excl. Cancer Genetics)

Journal Section

Research Article

Publication Date

March 12, 2025

Submission Date

December 17, 2024

Acceptance Date

February 4, 2025

Published in Issue

Year 2025 Volume: 64 Number: 1

Vancouver
1.Erhan Parıltay, Buket Kosova. Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. EJM. 2025 Mar. 1;64(1):143-52. doi:10.19161/etd.1602958

Ege Journal of Medicine enables the sharing of articles according to the Attribution-Non-Commercial-Share Alike 4.0 International (CC BY-NC-SA 4.0) license.