In [ ]:

from datascience import *
import numpy as np

%matplotlib inline
import matplotlib.pyplot as plots
plots.style.use('fivethirtyeight')

Lecture 18¶

Student's lament¶

In [ ]:

scores = Table.read_table('scores_by_section.csv')
scores

In [ ]:

scores.group('Section')

In [ ]:

scores.group('Section', np.average).show()

In [ ]:

random_sample = scores.sample(27, with_replacement = False)
random_sample

In [ ]:

np.average(random_sample.column('Midterm'))

In [ ]:

random_sample = scores.sample(27, with_replacement = False)
np.average(random_sample.column('Midterm'))

In [ ]:

averages = make_array()

for i in np.arange(50000):
    random_sample = scores.sample(27, with_replacement = False)
    new_average = np.average(random_sample.column('Midterm'))
    averages = np.append(averages, new_average)    

In [ ]:

observed_average = 13.6667

In [ ]:

Table().with_column('Random Sample Average', averages).hist(bins = 25)
plots.scatter(observed_average, 0, color = 'red', s=40);

In [ ]:

#################

In [ ]:

np.count_nonzero(averages <= observed_average) / 50000

In [ ]:

np.count_nonzero(averages <= 13.6) / 50000

In [ ]:

Table().with_column('Random Sample Average', averages).hist(bins = 25)
plots.scatter(observed_average, 0, color='red', s=30)
plots.plot([13.6, 13.6], [0, 0.35], color='gold', lw=2);

In [ ]: