#!/usr/bin/env python # coding: utf-8 # In[1]: from datetime import datetime print(f'Päivitetty {datetime.now().date()} / Aki Taanila') # # Excel-datan avaaminen # # * Pandas-kirjaston **read_excel** avaa Excel-muotoisesta tiedostosta datan dataframeen. # # * Pelkällä tiedostonimellä avaat datan koodin kanssa samaan kansioon tallennetusta Excel-tiedostosta. # # * Jos tiedosto on muussa kansiossa tai netissä, niin lisää tiedostopolku tai nettiosoite, esimerkiksi *'https://taanila.fi/data1.xlsx'* # # * Datan alkuosan ja loppuosan voit avaamisen jälkeen katsoa antamalla komentona dataframen nimen, esimerkiksi **df**. # # * Jos data ei ala ensimmäisen taulukkovälilehden ensimmäisestä solusta, niin voit käyttää parametreja **sheet_name**, **usecols** ja **skiprows**. Esimerkiksi seuraava avaisi datan Sheet2-taulukkovälilehden sarakkeista B ja C hypäten ensimmäisen rivin yli: `df = pd.read_excel('data1.xlsx', sheet_name='Sheet2', usecols='B, C', skiprows=1)` # # * Hankalammissa tapauksissa kannattaa harkita datan siivoamista Excelissä ennen **read_excel**-funktion käyttämistä. # In[2]: import pandas as pd df = pd.read_excel('https://taanila.fi/data1.xlsx') df # ## Lisätietoa # # Kannattaa tutustua **read_excel**-funktion mahdollisiin parametreihin: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html # # Data-analytiikka Pythonilla https://tilastoapu.wordpress.com/python/