Flaş Haber

1. Karmaşıklık Matrisi (Confussion Matrix)

Bir karmaşıklık matrisi, gerçek değerlerin bilinmekte olduğu bir dizi test verisi üzerinde, bir sınıflandırma modelinin performansını ölçmek için kullanılan bir tablodur. Tüm veri seti eğitim seti ve test seti olarak rastgele iki bölüme ayrılmıştır. Eğitim seti, çapraz doğrulama kullanarak en uygun model parametrelerini seçmek için kullanılır ve test seti yalnızca en uygun modelin performansını (doğruluğunu) ölçmek için kullanılır. Sınıflandırma doğruluğu, algoritma tarafından doğru olarak sınıflandırılan veri örneklerinin yüzdesi ile değerlendirilir

Karmaşıklık Matrisi

Gerçek Pozitifler (True Positive-TP): Gerçek veri değeri 1 ve tahmin ettiğimiz değerin de 1 olduğu örneklerdir. Yani bir hastanedeki hastaya bir rahatsızlığı için hasta demişsek TP (gerçekte var olan bir şeye biz de var demişsek).

● Gerçek Negatifler (True Negative-TN): Gerçek değeri 0 ve tahmin ettiğimiz değerin de 0 olduğu örneklerdir. Hasta olmayanlara hasta değil demişsek TN (gerçekte var olmayan bir şeye biz de yok demişsek).

● Yanlış Pozitifler (False Positive-FP): Gerçek değeri 0 ve tahmin ettiğimiz değerin 1 olduğu örneklerdir. Hasta olmayana hasta demişsek FP (gerçekte olmayan bir şeye biz var demişsek).

● Yanlış Negatifler (False Negative-FN): Gerçek değeri 1 ve tahmin ettiğimiz değerin de 0 olduğu örneklerdir. Yani gerçek değeri doğru tahmin ettiğimiz değerin çıktısı yanlış ise FN. Hasta olana hasta değil demişsek FN (gerçekte var olan bir şeye biz yok demişsek).

Doğruluk Oranı (Accuracy Rate): Sınıflandırıcı metodunun ne sıklıkla doğru tahminlerde bulunduğunun bir ölçümüdür. Doğru tahmin edilen değerler, toplama bölünerek bulunur.

Doğruluk = TN + TP / Toplam

Hata Oranı (Error Rate / Misclassification Rate): Yanlışların toplama oranıdır. Bu değer, 1’den doğruluk oranını çıkararak da elde edilir.

Hata Oranı = FN + FP / Toplam

Hata Oranı = 1 – Doğruluk

Hassasiyet (Precision): Doğru olarak tahmin edilenlerin, toplama oranıdır. Doğru ne kadar tahmin edildiğinin bir ölçüsüdür. 0 ile 1 arasında değer alır, mümkün olduğunca yüksek olmalıdır.

Hassasiyet = TP / TP + FP

Recall (Geri çağırma): Pozitif durumların ne kadar başarılı tahmin edildiğini gösterir. En iyi değer 1, en kötü değer 0’dır.

Geri çağırma= TP / (TP + FN)


F1 Score (F1 Değerlendirme): Test edilen verilerin doğruluğunun ölçümüdür. Hassasiyet ve geri çağırma metriklerinin harmonik ortalamasıdır. Normal ortalama yerine harmonik ortalamasının alınmasının sebebi, uç durumların göz ardı edilmesinden kaynaklanmaktadır.


F1 Değerlendirme = 2 * (Precision*Recall) / (Precision+Recall)

İlk yazımı yazmamda büyük emeği geçen takım arkadaşım Burcu Sevinç ‘e de teşekkürlerimi sunarım:)

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir