TR
EN
Eğitim Sektöründe Öğrenci Terkinin Tahmini: Makine Öğrenmesi Tabanlı Karşılaştırmalı Bir Analiz
Öz
Yükseköğretimde öğrencilerin akademik başarısızlık yaşamaları ve okuldan ayrılmaları, bireysel eğitim süreçlerinin yanı sıra kurumların akademik etkinliği ve ekonomik sürdürülebilirliği üzerinde etkili olan küresel sorunlar arasında yer almaktadır. Bu çalışma, öğrencilerin akademik başarı durumları ile okul terk etme eğilimlerinin tahmin edilmesinde kullanılan farklı makine öğrenmesi algoritmalarının performanslarını karşılaştırmalı olarak incelemeyi amaçlamaktadır. Araştırmada Kaggle platformundan temin edilen açık kaynaklı bir veri seti kullanılmış olup veri seti 4.424 gözlem ve 36 değişkenden oluşmaktadır. Lojistik regresyon, karar ağacı, rastgele orman ve XGBoost algoritmaları kullanılarak sınıflandırma modelleri geliştirilmiştir. Modellerin performansı doğruluk, kesinlik, duyarlılık ve F1-skoru ölçütleri temelinde değerlendirilmiştir. Bulgular, lojistik regresyon modelinin %91 doğruluk ve %90 F1-skoru ile güçlü bir temel performans sunduğunu göstermektedir. Karar ağacı modeli %90,63 doğruluk ve %89,37 F1-skoru ile yorumlanabilir olmakla birlikte görece daha sınırlı bir başarı sergilemiştir. Buna karşılık, topluluk öğrenmesine dayalı rastgele orman ve XGBoost modelleri %92 doğruluk ve %92 düzeyinde ağırlıklı F1-skoru değerlerine ulaşarak daha dengeli sonuçlar ortaya koymuştur. Özellikle bu modellerin yüksek duyarlılık değerleri, akademik risk altındaki öğrencilerin erken aşamada belirlenmesine olanak sağlamaktadır. Çalışma sonuçları, makine öğrenmesine dayalı karşılaştırmalı yaklaşımların yükseköğretimde erken uyarı sistemleri ve veri temelli karar destek mekanizmalarının geliştirilmesine katkı sağlayabileceğini göstermektedir.
Anahtar Kelimeler
Ethical Statement
This study was conducted using publicly available and anonymized secondary data obtained from the Kaggle platform. Since the dataset does not contain any personal or identifiable information and does not involve direct data collection from human participants, ethical committee approval was not required. All stages of the research were carried out in accordance with the principles of scientific research and publication ethics.
References
- Aina, C., Baici, E., Casalone, G., & Pastore, F. (2022). The determinants of university dropout: A review of the socio-economic literature. Socio-Economic Planning Sciences, 79, 101102
- Albreiki, B., Zaki, N., & Alashwal, H. (2021). A systematic literature review of student’performance prediction using machine learning techniques. Education Sciences, 11(9), 552.
- Andrade-Girón, D., Sandivar-Rosas, J., Marín-Rodriguez, W., Susanibar-Ramirez, E., Toro-Dextre, E., Ausejo-Sanchez, J., ... & Angeles-Morales, J. (2023). Predicting student dropout based on machine learning and deep learning: A systematic review. EAI Endorsed Transactions on Scalable Information Systems, 10(5).
- Bargmann, C., Thiele, L., & Kauffeld, S. (2022). Motivation matters: predicting students’ career decidedness and intention to drop out after the first year in higher education. Higher Education, 83(4), 845-861.
- Bean, J. P., & Metzner, B. S. (1985). A conceptual model of nontraditional undergraduate student attrition. Review of educational Research, 55(4), 485-540.
- Braxton, J. M., Doyle, W. R., Hartley III, H. V., Hirschy, A. S., Jones, W. A., & McLendon, M. K. (2013). Rethinking college student retention. John Wiley & Sons.
- Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.
- Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (s. 785–794). ACM. https://doi.org/10.1145/2939672.2939785
Details
Primary Language
Turkish
Subjects
Information Systems (Other)
Journal Section
Research Article
Authors
Publication Date
March 26, 2026
Submission Date
January 26, 2026
Acceptance Date
March 1, 2026
Published in Issue
Year 2026 Volume: 18 Number: 1