Yükseköğretimde öğrencilerin akademik başarısızlık yaşamaları ve okuldan ayrılmaları, bireysel eğitim süreçlerinin yanı sıra kurumların akademik etkinliği ve ekonomik sürdürülebilirliği üzerinde etkili olan küresel sorunlar arasında yer almaktadır. Bu çalışma, öğrencilerin akademik başarı durumları ile okul terk etme eğilimlerinin tahmin edilmesinde kullanılan farklı makine öğrenmesi algoritmalarının performanslarını karşılaştırmalı olarak incelemeyi amaçlamaktadır. Araştırmada Kaggle platformundan temin edilen açık kaynaklı bir veri seti kullanılmış olup veri seti 4.424 gözlem ve 36 değişkenden oluşmaktadır. Lojistik regresyon, karar ağacı, rastgele orman ve XGBoost algoritmaları kullanılarak sınıflandırma modelleri geliştirilmiştir. Modellerin performansı doğruluk, kesinlik, duyarlılık ve F1-skoru ölçütleri temelinde değerlendirilmiştir. Bulgular, lojistik regresyon modelinin %91 doğruluk ve %90 F1-skoru ile güçlü bir temel performans sunduğunu göstermektedir. Karar ağacı modeli %90,63 doğruluk ve %89,37 F1-skoru ile yorumlanabilir olmakla birlikte görece daha sınırlı bir başarı sergilemiştir. Buna karşılık, topluluk öğrenmesine dayalı rastgele orman ve XGBoost modelleri %92 doğruluk ve %92 düzeyinde ağırlıklı F1-skoru değerlerine ulaşarak daha dengeli sonuçlar ortaya koymuştur. Özellikle bu modellerin yüksek duyarlılık değerleri, akademik risk altındaki öğrencilerin erken aşamada belirlenmesine olanak sağlamaktadır. Çalışma sonuçları, makine öğrenmesine dayalı karşılaştırmalı yaklaşımların yükseköğretimde erken uyarı sistemleri ve veri temelli karar destek mekanizmalarının geliştirilmesine katkı sağlayabileceğini göstermektedir.
Bu çalışma, kamuya açık ve anonimleştirilmiş ikincil veriler kullanılarak gerçekleştirilmiştir. Araştırmada kullanılan veri seti, Kaggle platformu üzerinden açık erişim olarak temin edilmiş olup, bireylere ait herhangi bir kişisel veya tanımlayıcı bilgi içermemektedir. Bu nedenle çalışma, insan katılımcılar üzerinde doğrudan veri toplama süreci içermemekte ve etik kurul onayı gerektirmemektedir. Araştırma sürecinin tüm aşamaları, bilimsel araştırma ve yayın etiği ilkelerine uygun olarak yürütülmüştür.
In higher education, student academic failure and dropout are global challenges that affect individual educational trajectories as well as the academic effectiveness and economic sustainability of institutions. This study aims to comparatively examine the performance of different machine learning algorithms used to predict students’ academic achievement and dropout tendencies. An open-access dataset obtained from the Kaggle platform was used, consisting of 4,424 observations and 36 variables. Classification models were developed using logistic regression, decision tree, random forest, and XGBoost algorithms. Model performance was evaluated based on accuracy, precision, recall, and F1-score metrics. The results indicate that the logistic regression model provides a strong baseline with 91% accuracy and a 90% F1-score. The decision tree model achieved 90.63% accuracy and an 89.37% F1-score, offering interpretability but relatively limited performance. In contrast, ensemble learning–based random forest and XGBoost models demonstrated superior and more balanced results, each achieving 92% accuracy and a weighted F1-score of 92%. Notably, the high recall values of these models provide a clear advantage in identifying students at academic risk early. Overall, the findings suggest that machine learning–based comparative approaches can contribute to the development of early warning systems and data-driven decision support mechanisms in higher education.
This study was conducted using publicly available and anonymized secondary data obtained from the Kaggle platform. Since the dataset does not contain any personal or identifiable information and does not involve direct data collection from human participants, ethical committee approval was not required. All stages of the research were carried out in accordance with the principles of scientific research and publication ethics.
| Birincil Dil | Türkçe |
|---|---|
| Konular | Bilgi Sistemleri (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 26 Ocak 2026 |
| Kabul Tarihi | 1 Mart 2026 |
| Yayımlanma Tarihi | 26 Mart 2026 |
| DOI | https://doi.org/10.52791/aksarayiibd.1872176 |
| IZ | https://izlik.org/JA78RH53YC |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 18 Sayı: 1 |