ハンバーガー統計学にようこそ! のページを読み進めながら、以下の課題を Python を使って解いてください。
# URL によるリソースへのアクセスを提供するライブラリをインポートする。
import urllib # Python 2 の場合
# import urllib.request # Python 3 の場合
# ウェブ上のリソースを指定する
url = 'https://raw.githubusercontent.com/maskot1977/ipython_notebook/master/toydata/wakuwaku_potato.txt'
# 指定したURLからリソースをダウンロードし、名前をつける。
urllib.urlretrieve(url, 'wakuwaku_potato.txt') # Python 2 の場合
# urllib.request.urlretrieve(url, 'wakuwaku_potato.txt') # Python 3 の場合
('wakuwaku_potato.txt', <httplib.HTTPMessage instance at 0x104126368>)
# ファイルをオープンし長さのデータを読み込み、wakuwakuという名のリストに格納する。
wakuwaku = []
for line in open('wakuwaku_potato.txt'):
wakuwaku.append(float(line))
# 格納したデータの確認
print (wakuwaku)
[3.5, 3.8, 5.8, 6.4, 4.2, 4.2, 4.0, 3.6, 3.8, 5.2, 4.9, 5.2, 6.0, 3.9, 5.3, 4.6, 3.9, 4.2, 4.2, 6.4, 2.8, 5.6, 5.7, 5.1, 4.4, 5.6, 5.3, 3.9, 5.1, 3.6, 4.2, 5.0, 4.7, 4.1, 3.7, 4.9, 4.7, 5.3, 3.6, 4.2, 4.4, 4.0, 5.5, 4.2, 4.8, 3.7, 3.1, 4.7, 5.0]
# 平均長を求める
sum = 0
num = 0
for length in wakuwaku:
sum += length
num += 1
print (sum / num)
4.57142857143
__課題1.1__:モグモグポテトの長さのデータをダウンロードし、モグモグポテトの平均長を求めてください。
# 図やグラフを図示するためのライブラリをインポートする。
import matplotlib.pyplot as plt
%matplotlib inline
# ヒストグラム(度数分布)を描く
plt.hist(wakuwaku)
plt.show()
__課題1.2__:モグモグポテトの長さのデータをダウンロードし、モグモグポテトの長さのヒストグラムを描いてください。
本文を読んで概念を学んでください。
フライドチキンの重さ のデータをダウンロードして、その後のコードを実行してください。
# ウェブ上のリソースを指定する
# 指定したURLからリソースをダウンロードし、名前をつける。
# ダウンロードしたデータから、列ごとに数字を読み込んでリストに格納する。
col1 = [] # 0列目の数字を格納する予定のリスト
col2 = [] # 1列目の数字を格納する予定のリスト
col3 = [] # 2列目の数字を格納する予定のリスト
for i, line in enumerate(open('fried_chicken.txt')): # ファイルを開いて一行一行読み込む
if i == 0: # 0番目の行の場合
continue # 次の行に行く
c = line.split() # 行を空白文字で分割したものをcというリストに入れる
col1.append(int(c[0])) # 0列目の単語を整数に変換してcol1に入れる
col2.append(int(c[1])) # 1列目の単語を整数に変換してcol2に入れる
col3.append(int(c[2])) # 2列目の単語を整数に変換してcol3に入れる
__課題1.5__:ワクワクチキンとモグモグチキンについて、重さの平均と分散と標準偏差を、それぞれ求めてください。またその結果について考察してください。
ある3つのクラスの算数の成績を用いて以下の問いに答えてください。
__課題2.1__:ワクワクポテトの本数のデータから、ポテトの本数の平均、分散、標準偏差を求めてください。
__課題2.2__:ワクワクポテトの本数のデータから、ポテトの本数の不偏分散を求めてください。
__課題2.4__:ワクワクチキンのグラム数のデータを用いて、以下の問いに答えてください。ただし、t分布表は下表のとおりとします。
自由度 |
確率95% |
確率99% |
1 |
12.706 |
63.657 |
2 |
4.303 |
9.925 |
3 |
3.182 |
5.841 |
4 |
2.776 |
4.604 |
5 |
2.571 |
4.032 |
6 |
2.447 |
3.707 |
7 |
2.365 |
3.499 |
8 |
2.306 |
3.355 |
9 |
2.262 |
3.250 |
10 |
2.226 |
3.169 |
__今日の課題提出__:計算結果を.ipynb ファイル(または.jsonファイル)として保存し、指定したアドレスまでメールしてください。メールタイトルは「__ハンバーガー統計学12__」とし、メール本文に学籍番号と氏名を明記のこと。また、感想も書いてくれると喜びます。今後の講義の改善につながるかも知れません。