Please cite us if you use the software

Example-1 (Comparison of three different classifiers)¶

A comparison of a 3 classifiers in scikit-learn on iris dataset. The iris dataset is a classic and very easy multi-class classification dataset.

Environment check¶

Checking that the notebook is running on Google Colab or not.

In [1]:

import sys
try:
  import google.colab
  !{sys.executable} -m pip -q -q install pycm
except:
  pass

Install scikit-learn¶

In [2]:

import os
!{sys.executable} -m pip -q -q install scikit-learn
if "Example1_files" not in os.listdir():
    os.mkdir("Example1_files")

Load dataset¶

In [3]:

from sklearn import datasets
from sklearn.model_selection import train_test_split
from pycm import ConfusionMatrix
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

Classifier 1 (C-Support vector)¶

In [4]:

from sklearn import svm
classifier_1 = svm.SVC(kernel='linear', C=0.01)

In [5]:

y_pred_1 = classifier_1.fit(X_train, y_train).predict(X_test)

In [6]:

cm1=ConfusionMatrix(y_test, y_pred_1)
cm1.print_matrix()

Predict  0        1        2        
Actual
0        13       0        0        

1        0        10       6        

2        0        0        9

In [7]:

cm1.print_normalized_matrix()

Predict     0           1           2           
Actual
0           1.0         0.0         0.0         

1           0.0         0.625       0.375       

2           0.0         0.0         1.0

In [8]:

cm1.Kappa 

Out[8]:

0.7673469387755101

In [9]:

cm1.Overall_ACC

Out[9]:

0.8421052631578947

In [10]:

cm1.SOA1  # Landis and Koch benchmark

Out[10]:

'Substantial'

In [11]:

cm1.SOA2  # Fleiss’ benchmark

Out[11]:

'Excellent'

In [12]:

cm1.SOA3  # Altman’s benchmark

Out[12]:

'Good'

In [13]:

cm1.SOA4  # Cicchetti’s benchmark

Out[13]:

'Excellent'

In [14]:

cm1.save_html(os.path.join("Example1_files", "cm1"))

Out[14]:

{'Message': 'D:\\For Asus Laptop\\projects\\pycm\\Document\\Example1_files\\cm1.html',
 'Status': True}

Open File

Classifier 2 (Decision tree)¶

In [15]:

from sklearn.tree import DecisionTreeClassifier
classifier_2 = DecisionTreeClassifier(max_depth=5)

In [16]:

y_pred_2 = classifier_2.fit(X_train, y_train).predict(X_test)

In [17]:

cm2=ConfusionMatrix(y_test, y_pred_2)
cm2.print_matrix()

Predict  0        1        2        
Actual
0        13       0        0        

1        0        15       1        

2        0        0        9

In [18]:

cm2.print_normalized_matrix()

Predict      0            1            2            
Actual
0            1.0          0.0          0.0          

1            0.0          0.9375       0.0625       

2            0.0          0.0          1.0

In [19]:

cm2.Kappa 

Out[19]:

0.95978835978836

In [20]:

cm2.Overall_ACC

Out[20]:

0.9736842105263158

In [21]:

cm2.SOA1  # Landis and Koch benchmark

Out[21]:

'Almost Perfect'

In [22]:

cm2.SOA2  # Fleiss’ benchmark

Out[22]:

'Excellent'

In [23]:

cm2.SOA3  # Altman’s benchmark

Out[23]:

'Very Good'

In [24]:

cm2.SOA4  # Cicchetti’s benchmark

Out[24]:

'Excellent'

In [25]:

cm2.save_html(os.path.join("Example1_files","cm2"))

Out[25]:

{'Message': 'D:\\For Asus Laptop\\projects\\pycm\\Document\\Example1_files\\cm2.html',
 'Status': True}

Open File

Classifier 3 (AdaBoost)¶

In [26]:

from sklearn.ensemble import AdaBoostClassifier
classifier_3 = AdaBoostClassifier()

In [27]:

y_pred_3 = classifier_3.fit(X_train, y_train).predict(X_test)

In [28]:

cm3=ConfusionMatrix(y_test, y_pred_3)
cm3.print_matrix()

Predict  0        1        2        
Actual
0        13       0        0        

1        0        15       1        

2        0        3        6

In [29]:

cm3.print_normalized_matrix()

Predict       0             1             2             
Actual
0             1.0           0.0           0.0           

1             0.0           0.9375        0.0625        

2             0.0           0.33333       0.66667

In [30]:

cm3.Kappa 

Out[30]:

0.8354978354978355

In [31]:

cm3.Overall_ACC

Out[31]:

0.8947368421052632

In [32]:

cm3.SOA1  # Landis and Koch benchmark

Out[32]:

'Almost Perfect'

In [33]:

cm3.SOA2  # Fleiss’ benchmark

Out[33]:

'Excellent'

In [34]:

cm3.SOA3  # Altman’s benchmark

Out[34]:

'Very Good'

In [35]:

cm3.SOA4  # Cicchetti’s benchmark

Out[35]:

'Excellent'

In [36]:

cm3.save_html(os.path.join("Example1_files", "cm3"))

Out[36]:

{'Message': 'D:\\For Asus Laptop\\projects\\pycm\\Document\\Example1_files\\cm3.html',
 'Status': True}

Open File

How to compare classifiers?¶

In [37]:

from pycm import Compare

cp = Compare({"C-Support vector": cm1, "Decision tree": cm2, "AdaBoost": cm3})
print(cp)

Best : Decision tree

Rank   Name                Class-Score       Overall-Score
1      Decision tree       0.55556           0.95238
2      AdaBoost            0.48333           0.92381
3      C-Support vector    0.44444           0.80476

In [38]:

cp.save_report(os.path.join("Example1_files", "cp"))

Out[38]:

{'Message': 'D:\\For Asus Laptop\\projects\\pycm\\Document\\Example1_files\\cp.comp',
 'Status': True}

Open File