Tilastolliset tunnusluvut ja korrelaatiot Exceliin

In [4]:
import pandas as pd

# Avaan datan dataframeen
df = pd.read_excel('http://taanila.fi/data1.xlsx')
In [6]:
# Alustan ExcelWriterin kirjoittamaan uuteen tiedostoon tunnusluvut.xlsx
writer = pd.ExcelWriter('tunnusluvut.xlsx', engine = 'xlsxwriter')

# Lasken tunnusluvut dataframen muuttujille ja kirjoitan ne Tunnusluvut-taulukkovälilehdelle
df.describe().to_excel(writer, sheet_name = 'Tunnusluvut')

# Lasken korrelaatiot ja kirjoitan ne Korrelaatiot-taulukkovälilehdelle
df.corr().to_excel(writer, sheet_name = 'Korrelaatiot')

# Tallennan Excel-tiedoston
writer.save()

Tämän jälkeen voin avata tunnusluvut.xlsx -tiedoston Exceliin ja katsoa mitä sain aikaan.