TR
EN
Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi
Abstract
Amaç: Kopya sayısı varyasyonları, insan genomunun yaklaşık yüzde ikisinde bulunan belirli DNA bölgelerinin kayıp veya kazançlarıdır. Yapısal varyasyonlar arasında yer alan bu grup, sağlıklı popülasyonda bulunabileceği gibi ilgili bölgenin kayıp veya kazançları klinik tablolarla da ilişkilendirilebilir. Tespit edilen kopya sayısı varyasyonunun klinik olarak yorumlanması, aile çalışmasını da gerektiren karmaşık bir süreçtir. Klinik ve genetik verilerin yorumlanması sürecinde her zaman doğru bilgiye ulaşılamamaktadır. Kullanımı artan makine öğrenme algoritmaları giderek tıp alanında da kullanılmakta ve özellikle büyük veri setlerinin bulunduğu genetik gibi alanlarda giderek önem kazanmaktadır. Bu çalışma ile kopya sayısı varyasyonlarının klinik değerlendirilmesinde makine öğrenme algoritmalarının kullanımı amaçlanmıştır.
Gereç ve Yöntem: Araştırmada öncelikle 11989 varyant bulunan ISCA konsorsiyumu verileri ile pilot analiz gerçekleştirilmiş, sonrasında ClinVar veri tabanından elde edilen 63156 varyantlı veri seti kullanılmıştır. Beş ana sınıfta (Benign, Muhtemel Benign, VUS, Muhtemel Patojenik ve Patojenik) bulunan varyantlar, Microsoft Azure Machine Learning Studio platformunda, %70 eğitim ve %30 test verisi olarak ayrılmış ve çeşitli makine öğrenmesi algoritmaları (Çok Sınıflı Karar Ağaçları, Lojistik Regresyon ve Sinir Ağı) kullanılarak analiz gerçekleştirilmiştir.
Bulgular: ISCA veri seti ile yapılan modelde çok sınıflı karar ağacı ile ortalamada 0,96 doğruluğa ulaşılırken, ClinVar veri setinde yine çok sınıflı karar ağacı ile 0,86 doğruluğa ulaşılmıştır. Bu modelde patojenikler %74.8, benignler %77.6 ve önemi bilinmeyen varyantlar %62.6 oranında doğru tahmin edilmiştir. Çalışmada sık karşılaşılan varyantlar daha yüksek başarı ile tanımlanmış ve örneklemin benign ve patojenik olarak iki sınıflı haline getirilmesi durumunda ise ortalama ve toplamda 0.90 doğruluğa ulaşılmıştır.
Sonuç: Bu çalışma, kopya sayısı varyantlarının klinik değerlendirilmesinde kullanılabilecek ve tanıyı otomatikleştirebilecek öncül bir makine öğrenme modeli oluşturulabileceğini göstermiştir.
Keywords
References
- Sebat J, Lakshmi B, Troge J, Alexander J, Young J, Lundin P, et al. Large-scale copy number polymorphism in the human genome. Science. 2004 Jul 23;305(5683):525–8.
- Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD, et al. Global variation in copy number in the human genome. Nature. 2006 Nov;444(7118):444–54.
- Albertson DG, Pinkel D. Genomic microarrays in human genetic disease and cancer. Hum Mol Genet. 2003 Oct 15;12(suppl 2):R145–52.
- Slavotinek AM. Novel microdeletion syndromes detected by chromosome microarrays. Hum Genet [Internet]. 2008 Aug 30 [cited 2019 Nov 3];124(1):1–17. Available from: http://link.springer.com/10.1007/s00439-008- 0513-9
- Freeman JL, Perry GH, Feuk L, Redon R, McCarroll SA, Altshuler DM, et al. Copy number variation: new insights in genome diversity. Genome Res [Internet]. 2006 Aug 1 [cited 2019 Jul 9];16(8):949–61. Available from: http://www.ncbi.nlm.nih.gov/pubmed/16809666
- Database of Genomic Variants [Internet]. [cited 2019 Nov 3]. Available from: http://dgv.tcag.ca/dgv/app/home
- Firth H V., Richards SM, Bevan AP, Clayton S, Corpas M, Rajan D, et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. The American Journal of Human Genetics [Internet]. 2009 Apr [cited 2019 Nov 3];84(4):524–33. Available from: https://linkinghub.elsevier.com/retrieve/pii/S0002929709001074
- Kearney HM, Thorland EC, Brown KK, Quintero-Rivera F, South ST. American College of Medical Genetics standards and guidelines for interpretation and reporting of postnatal constitutional copy number variants. Genetics in Medicine. 2011 Jul 15;13(7):680–5.
Details
Primary Language
Turkish
Subjects
Medical Genetics (Excl. Cancer Genetics)
Journal Section
Research Article
Publication Date
March 12, 2025
Submission Date
December 17, 2024
Acceptance Date
February 4, 2025
Published in Issue
Year 2025 Volume: 64 Number: 1
APA
Parıltay, E., & Kosova, B. (2025). Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. Ege Tıp Dergisi, 64(1), 143-152. https://doi.org/10.19161/etd.1602958
AMA
1.Parıltay E, Kosova B. Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. EJM. 2025;64(1):143-152. doi:10.19161/etd.1602958
Chicago
Parıltay, Erhan, and Buket Kosova. 2025. “Kopya Sayısı Varyasyonlarının Makine öğrenmesi Algoritmaları Kullanılarak Biyoinformatik Analizi”. Ege Tıp Dergisi 64 (1): 143-52. https://doi.org/10.19161/etd.1602958.
EndNote
Parıltay E, Kosova B (March 1, 2025) Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. Ege Tıp Dergisi 64 1 143–152.
IEEE
[1]E. Parıltay and B. Kosova, “Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi”, EJM, vol. 64, no. 1, pp. 143–152, Mar. 2025, doi: 10.19161/etd.1602958.
ISNAD
Parıltay, Erhan - Kosova, Buket. “Kopya Sayısı Varyasyonlarının Makine öğrenmesi Algoritmaları Kullanılarak Biyoinformatik Analizi”. Ege Tıp Dergisi 64/1 (March 1, 2025): 143-152. https://doi.org/10.19161/etd.1602958.
JAMA
1.Parıltay E, Kosova B. Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. EJM. 2025;64:143–152.
MLA
Parıltay, Erhan, and Buket Kosova. “Kopya Sayısı Varyasyonlarının Makine öğrenmesi Algoritmaları Kullanılarak Biyoinformatik Analizi”. Ege Tıp Dergisi, vol. 64, no. 1, Mar. 2025, pp. 143-52, doi:10.19161/etd.1602958.
Vancouver
1.Erhan Parıltay, Buket Kosova. Kopya sayısı varyasyonlarının makine öğrenmesi algoritmaları kullanılarak biyoinformatik analizi. EJM. 2025 Mar. 1;64(1):143-52. doi:10.19161/etd.1602958