Weka Dersleri 3 – Sınıflandırma Çeşitleri

Bugün WEKA ile kullanabileceğiniz sınıflandırıcıları beraber inceleyeceğiz.Öncelikle WEKA ve veri madenciliğine ilginiz varsa bu seriyi takip etmenizi tavsiye ederim.Hadi gelin beraber veri madenciliği yapalım.

WEKA’yı kullanarak bir çok sınıflandırıcıyı kullanabilirsiniz; Karar Ağaçları, SVM, Multi-layer Perceptrons vs. Veri setinizi yükledikten sonra Classify bölümüne tıklayarak sınıflandırma sayfasına erişebilirsiniz. Ön tanımlı ayarlara göre ZeroR algoritması gelmektedir.

Şekil 1. Ön Tanımlı Ayar

Choose butonuna tıklayarak başka bir sınıflandırıcı seçebilirsiniz. J48 en verimli sınıflandırıcılardandır.

Şekil 2. Yeni Sınıflandırma Ayarı Seçme

Sınıflandırma algoritmasını çalıştırmadan önce test seçenekleri ayarlanmalı. Test Options Box içerisinde test seçeneklerini bulabilirsiniz:

1. Use Training Set: Üzerinde eğitildiği örneklerin ne kadar iyi sınıflandırıldığını kontrol eder.

2. Supplied Test Set: Bir dosyadan yüklenen örnek setinin ne kadar iyi sınıflandırıldığını kontrol eder. ‘Set …’ butonuna tıklayarak test için bir dosya seçebilirsiniz.

3. Cross-validation: Cross-validation ill sınıflandırıcıyı test eder, bunun için de Folds metin bölgesinden girilen sayıyı fold sayısı olarak kabul eder. Yazdığınız değere göre ayırdığı veri setinin %90’ıyla eğitim %10’u ile de test yapar.

4. Percentage Split: Belli bir yüzdeye göre sınıflandırıcının ne kadar iyi olduğunu test eder. % Bölgesine girilen değere göre bu işlemi gerçekleştirir.

Şekil 3. Classifier Output Ekranı

“Classifier Output” ekranındaki “Run Information” bölümü size kullandığınız algoritmayı, veri setinizin ismini, kaç veriniz ve özellik bilgiliniz olduğunu verir. Ağaç yapısında ‘:’ sınıf etiketini temsil eder. Seçtiğimiz yöntem başlık olarak ekranda bulunur. Detailed Accuracy By Class başlığı altına bakacak olursak her sınıf için True Positive, False PCositive, Recall ve F-Measure ve ROC Alanı karşılıklarını görebiliriz. Confusion Matrix kısmında sınıflarımız için de kaç tane örnek doğru sınıflandırılmış kaç tanesi yanlış sınıflandırılmış ve hangi sınıf olarak sınıflandırılmış gibi soruların cevaplarını bulabiliriz. Sonuçları Görselleştirme Sınıflandırma sonuçlarımızı daha görsel bir şekilde görmek istersek, WEKA’nın bize sağladığı grafiksel seçeneklerden yararlanabiliriz.

Şekil 4. Grafiksel Gösterim Seçenekleri

Sağ tıklayarak “Visualize tree”yi seçtikten sonra Classifier Output’ta incelediğimiz ağacın grafiksel gösterimini görebiliriz.

Şekil 5. Ağaç Gösterimi

Ayrıca sınıflandırma hatalarını da görebilirsiniz bunun için aynı menüden “Visualize Classifier Errors” seçeneğini seçin.

Şekil 6. Sınıflandırma Hataları

Eğer daha geniş açıdan görmek isterseniz kırmızı okla gösterile jitter’ı sağa doğru iterseniz tüm veri örneklerinin sınıflandırılmış hallerini görebilirsiniz, yanlış sınıflandırılmış olanlar kare ile doğru sınıflandırılmış olanlar da x ile gösteriliyor.

Şekil 7. Verilerin Sınıflandırılmış Hali

Eğer karelerden bir tanesinin üzerine çift tıklarsanız, daha ayrıntılı bilgi görebilirsiniz.

Şekil 8. Sınıflandırılmış Verinin Detaylı Bilgisi

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s