Basic Python for Seismology 2

Tujuan: Mengaplikasikan dasar Python dalam kasus sederhana
Keluaran: Peserta mengaplikasikan pengetahuan dasar Python untuk pengolahan katalog sederhana
Sesi: Praktek
Waktu/Tempat: Sabtu, 18 September 2021/ Zoom Meeting

# ## Membaca Data Tabular Menggunakan Pandas # # Pada pertemuan di sesi kedua ini kita akan mulai bermain data dan mengaplikasikan beberapa-beberapa algoritma sederhana di Python untuk data tersebut. Data yang kita gunakan adalah katalog gempa Badan Meteorologi dan Geofisika (BMKG) pada kejadian gempa Mw 6.2 di Mamuju pada Januari lalu. Katalog gempa yang digunakan adalah dalam jangka waktu 11 Januari sampai 30 Januari 2021. Format data katalog berbentuk *Comma Separated Values* (CSV) dan sudah disesuaikan agar lebih mudah dibaca menggunakan Python. Peserta dapat mengunduh data ini dengan menekan [download data](data/demo_data_BMKG_Mamuju.csv) atau melalui [github](https://github.com/anangsahroni/geoscope-geohazard-workshop/blob/main/data/demo_data_BMKG_Mamuju.csv) kemudian taruh di dalam folder `data`. Format dari data ini adalah seperti berikut ini: # # # ``` # time,latitude,longitude,depth,magnitude # 2021-01-27T18:43:24.965Z,-2.97,118.83,11,3.7 # 2021-01-25T16:04:16.363Z,-3.01,118.80,47,2.8 # 2021-01-24T20:52:08.070Z,-2.94,118.61,10,2.6 # 2021-01-24T16:52:55.221Z,-3.00,118.80,35,2.4 # 2021-01-24T02:38:50.171Z,-2.95,118.88,14,3.1 # 2021-01-21T11:55:35.955Z,-2.90,118.91,10,4.0 # ``` # # Pembacaan data untuk format CSV seperti di atas dapat dilakukan dengan berbagai macam cara seperti menggunakan fungsi bawaan seperti `open`, `numpy.genfromtxt`, atau menggunakan fungsi yang lebih *high level* atau mudah seperti `pandas.read_csv`. Pada praktik ini kita akan menggunakan cara yang paling mudah dan paling pendek yaitu menggunakan `pandas.read_csv` yang berada dalam modul `pandas`. Modul `pandas` memiliki spesialiasi manipulasi data dalam berbagai format, salah satunya yaitu format tabular seperti yang akan kita olah. # ### Mengimpor Modul `pandas` # # Seperti pada pertemuan pertama dimana kita harus mengimpor modul yang akan kita gunakan (`math`), kita juga akan mengimpor `pandas` dan kemudian memberikan alias panggilan `pd` agar untuk penulisan kode lebih mudah. # In[1]: import pandas as pd # Cara pengimporan modul atau paket seperti di atas akan lazim kita temui dalam penulisan kode di Python, selain cara tersebut kita juga dapat langsung mengimpor fungsi yang akan kita gunakan, alih-alih mengimpor modul secara umum. Contoh yang terakhir akan kita berikan di pembahasan di bagian belakang. # ### Membaca Data Menggunakan Fungsi `pandas.read_csv` # Fungsi dari `pandas` yang berguna untuk membaca data tabular dalam bentuk CSV adalah `pandas.read_csv` tetapi karena `pandas` sudah kita berikan alias `pd` maka kita cukup mengetikkan `pd.read_csv`. Sebelum kita menggunakan fungsi tersebut kita terlebih dahulu akan membaca petunjuk penggunaan fungsinya dengan menggunakan fungsi `help`: # In[ ]: help(pd.read_csv) # Terdapat banyak sekali parameter yang harus kita isikan (atau kita biasa sebut sebagai argumen). Argumen-argumen yang diikuti tanda `=` dan isi parameternya (contoh `delimiter=None`) merupakan argumen yang sudah memiliki nilai *default*, dalam contoh ini untuk argumen `delimiter` apabila tidak kita isi maka secara otomatis akan terisi dengan nilai `None`. Dengan demikian, tidak semua argumen dalam sebuah fungsi harus kita isikan. Pada `pd.read_csv` ini sebenarnya fungsi akan mendeteksi secara otomatis delimiter (tanda pemisah kolom, dalam contoh kita yaitu koma (,)) yang ada di dalam data yang akan dibaca. Saatnya kita membaca data: # In[3]: data = pd.read_csv("data/demo_data_BMKG_Mamuju.csv") # Pada contoh kode pembacaan di atas ini kita hanya mengisikan satu argumen yaitu data yang akan kita gunakan (dalam bentuk `String` karena merupakan kumpulan karakter non angka). Argumen-argumen lain kita tidak isikan karena fungsi ini secara otomatis akan mendeteksi format data yang kita gunakan, dengan catatan data kita sudah rapi dan bersih. Untuk melihat data yang sudah kita baca kita dapat memanggilnya dengan menulis `data` seperti pada kode di bawah ini. # In[4]: data.head() # Seperti yang sudah kita bahas diawal, `pd.read_csv` akan secara otomatis mendeteksi format data yang kita baca. Saat data kita panggil dengan perintah `data` maka akan muncul tabel seperti di atas. Kita dapat mengecek apakah data sudah terbaca dengan baik, pada contoh di atas data terbaca dengan baik karena masing-masing kolom terpisahkan dengan benar. Bagaimana dengan contoh pembacaan yang masih salah? # In[5]: data_salah = pd.read_csv("./demo_data_BMKG_MamujuEQ.csv", delimiter=".") data_salah.head() # Pada contoh pembacaan yang salah pada kode diatas, kita memasukkan nilai untuk argumen `delimiter` yaitu berupa tanda titik `.`, padahal pemisah antar kolom pada file CSV kita berupa tanda koma (,). Hal tersebut membuat pemisahan antar kolom tidak benar. # ## Membedakan Jenis Data pada Kolom Data Katalog # # Setelah berhasil membaca data, langkah selanjutnya adalah melihat beberapa tipe-tipe data pada masing-masing kolom untuk mengingatkan kembali pengetahuan kita tentang `String`, `Float`, dan `Integer`. Pada data yang dibaca menggunakan `pd.read_csv`, tabel secara umum memiliki format tersendiri yaitu `DataFrame`, format yang dibuat oleh `pandas`. # In[ ]: help(data) # Masing-masing kolom sendiri memiliki jenis data yang beragam tergantung dengan isi dari setiap kolom tersebut. Pada contoh yang pertama kita akan melihat jenis data yang ada dalam kolom `longitude`. Memanggil salah satu kolom dalam pandas cukup mudah yaitu kita hanya perlu menuliskan `data` kemudian diikuti dengan `[namakolom]`, maka untuk kolom `longitude` kita dapat melihat tipe datanya dengan: # In[7]: data['longitude'].dtype # Kolom `longitude` ternyata data di dalamnya memiliki format data `Float` karena merupakan bilangan yang tidak bulat atau desimal. Apabila ingin melihat data dalam kolom ini kita dapat menuliskan kode: # In[8]: data['longitude'] # Format data yang berbeda kita temui pada kolom `depth` dimana semua data pada kolom ini berupa bilangan bulat sehingga tipe datanya seharusnya `Integer`. # In[9]: data['depth'].dtype # Bagaimana dengan kolom `time`? Apakah tipe data pada kolom ini akan berupa `String`? # In[10]: data['time'].dtype # Ternyata pada kolom `time` tipe datanya adalah `Object` yang disingkat `O`, tipe ini merupakan kita yang lebih lanjut karena dapat berupa jenis data apapun, terkecuali `Integer` dan `Float`, dalam contoh ini. # ## Mempelajari Data Bertipe `list` dan `tuple` # # ### List # Apabila kita sudah dapat membedakan jenis data untuk nilai yang berupa satuan (tidak berupa kumpulan nilai) yaitu seperti `String`, `Float`, dan `Integer`. Bagaimana dengan jenis atau tipe data yang merupakan kumpulan-kumpulan angka atau huruf? Seperti contoh pada data di bawah ini: # # ```python # deret = [1,2,3,4,5] # alamat = ["Yogyakarta", "Semarang", "Ambon", "Padang"] # ``` # # Pada `deret` kita tahu bahwa isinya merupakan kumpulan dari `Integer` dan pada `alamat` isinya merupakan kumpulan `String` tetapi untuk `deret` dan `alamat` secara utuh sendiri dapat kita dapat sebut sebagai apa? Kumpulan-kumpulan data dalam bentuk daftar satu dimensi seperti pada contoh `deret` dan `alamat` tersebut biasa kita sebut sebagai data berjenis `List`, atau secara matematika, fisika, ataupun ilmu komputer juga dapat kita sebut sebagai sebuah vektor, karena vektor pun bentuknya biasanya diwakili dari kumpulan angka-angka dalam satu baris seperti di atas. # # Setiap kolom dari data yang sebelumnya kita baca menggunakan `pd.read_csv` merupakan salah satu bentuk `List` karena berupa deretan angka dalam 1 dimensi saja atau 1 baris saja. Untuk membaca kolom kedalam bentuk `List` kita dapat menggunakan fungsi bawaan dari Python yaitu `list`: # In[11]: longitude = list(data['longitude']) longitude # Ada metode yang dapat diaplikasikan untuk data berjenis`List` ini, yang paling sederhana adalah fungsi `len` untuk mengetahui panjang dari `List`: # In[12]: len(longitude) # #### Indeks pada `List` # Data berjenis `List` diindeks dengan indeks awalan adalah 0 sehingga apabila akan memanggil data pertama dalam `List` longitude kita dapat menggunakan: # In[13]: longitude[0] # Sehingga untuk data terakhir pada `List` `longitude` kita dapat memanggilnya dengan # In[14]: longitude[41] # Karena diindeks dari 0 sehingga data terakhir berada pada indeks 41. Agar tidak bingung, Python memberikan alternatif apabila kita ingin memanggil data dari bagian belakang, yaitu dengan menambahakan simbol negatif (-) seperti pada contoh ini: # In[15]: longitude[-1] # Berbeda dengan indeks dari bagian awal yang dimulai dari 0, pada indeks dari akhir kita mulai dengan -1. Untuk mengecek apakah `longitude[41]` dan `longitude[-1]` sama kita dapat menggunakan: # In[16]: longitude[41] == longitude[-1] # Hasilnya akan `True` karena nilai keduanya sama, contoh yang lain: # In[17]: longitude[40] == longitude[-2] # Hasilnya juga akan `True`. # #### *Slicing* pada `List` # Bagaimana bila yang akan kita panggil datanya berjumlah lebih dari satu? Misalkan kita akan mengambil 4 data pertama: # In[18]: longitude_empat_awal = longitude[0:4] longitude_empat_awal # Metode di atas sering kita kenal nanti sebagai metode `slicing`, metode ini juga berlaku untuk indeks yang dari belakang: # In[19]: longitude_tiga_akhir = longitude[-4:-1] longitude_tiga_akhir # #### Mengedit `List` # Kita dapat menghapus, menambah, atau mengedit isi dari `List` yang kita punya, pada contoh mengedit `List` ini kita akan menggunakan `List` baru yang lebih pendek dan sederhana jadi untuk `List` dan data gempa kita simpan dan tidak ubah-ubah. Kasus ini adalah pendaftaran peserta untuk mengikuti workshop: # In[20]: daftar_peserta = ["Budi", "Joni", "Putri", "Indah", "Ade", "Rahma"] # Ternyata ada peserta yang mendaftar terlambat yaitu Ari, untuk memasukkan Ari ke daftar peserta kita dapat menggunakan metode `append`. # In[21]: daftar_peserta.append("Ari") daftar_peserta # Ari sudah masuk menjadi peserta, walaupun datangnya terlambat sehingga dia duduk di indeks paling terakhir karena metode `append`. Ternyata ada lagi peserta yang belum tercatat yaitu Dina, karena Dina ternyata sudah mendaftar pertama kali tetapi lupa tercatat, panitia kemudian memasukkan Dina ke bangku nomor satu dengan metode `insert` pada indeks 0: # In[22]: daftar_peserta.insert(0,"Dina") daftar_peserta # Workshop kemudian selesai dan dilanjutkan dengan ujian, Joni ternyata yang paling cepat sehingga dia keluar kelas workshop terlebih dahulu. Untuk menghapus Joni dari daftar peserta: # In[23]: daftar_peserta.remove("Joni") daftar_peserta # Bagaimana apabila mengganti langsung menggunakan indeks? Karena ternyata nama Budi bukan Budi tetapi Rudi: # In[24]: daftar_peserta[1] = "Rudi" daftar_peserta # Masih banyak metode `List` lain yang dapat kita gunakan, secara lebih lengkap dapat dibuka di `help(list)` # In[25]: help(list) # ### Tuple # # `Tuple` secara sederhana mirip sekali dengan `List` hanya saja penulisan menggunakan `()`, bukan `[]`, metode-metodenya hampir sama, hanya saja untuk `Tuple` ini data di dalamnya tidak dapat kita edit: # In[26]: daftar_nilai = (10,9,10,8,7,8) # Kita tidak bisa menambahkan nilai ke dalam sebuah `Tuple`: # In[27]: daftar_nilai.append(10) # Begitupula mengedit nilai yang ada dalam `Tuple` tersebut: # In[28]: daftar_nilai[1]=10 # Fun fact: `String` memiliki sifat `Tuple` # In[29]: nama = "Rudi" nama[0] # In[30]: nama.append("s") # In[31]: nama[0] = "B" # ## *Looping* # Proses *looping* merupakan proses mengulang-ngulang sebuah proses sampai kondisi tertentu tercapai. Pada Python terdapat dua jenis *looping* yaitu `for` dan `while`. `for` akan melakukan *looping* dengan sampai pada batas jumlah *looping* atau sampai pada syarat tertentu yang sudah tercapai sedangkan `while` akan terus berjalan saat syaratnya masih terpenuhi. Sebelum kita menggunakan `for` untuk mengkonversi `String` pada kolom `time` menjadi data berjenis `datetime.datetime`, kita bermain dengan `list` yang lebih sederhana dahulu: # In[32]: for peserta in daftar_peserta: print("Nama: ", peserta) # Pada contoh di atas, kita dapat membaca kode seperti ini: untuk setiap peserta di daftar peserta, kita cetak nama peserta didahului dengan tulisan "Nama: ", looping akan berjalan mulai dari Dina, sehingga tulisan "Nama: Dina" akan tercetak pertama kali, dilanjutkan dengan Rudi, dan yang terakhir adalah Ari. # In[33]: for peserta in daftar_peserta: print(peserta, " lulus") # Kita juga dapat bermain dengan `List` yang berisi angka, misalnya pada contoh ini kita akan menambahkan setiap nilai pada daftar nilai dengan 1: # In[34]: print("Nilai= ", daftar_nilai) for nilai in daftar_nilai: print("nilai+1= ",nilai+1) # Contoh di bawah ini kita memanfaatkan metode `append` untuk membuat daftar nilai baru yang sudah ditambah dengan 1. Karena `for` loop mengevaluasi setiap `nilai` dalam `daftar_nilai` maka untuk setiap `nilai`, `daftar_nilai_tambah_satu` akan di`append` dengan `nilai+1`, sehingga hasilnya adalah `List` baru yang isinya nilai awal ditambah satu: # In[35]: daftar_nilai_tambah_satu = [] for nilai in daftar_nilai: daftar_nilai_tambah_satu.append(nilai+1) print("Nilai asli= ", daftar_nilai) print("Nilai+1 = ", daftar_nilai_tambah_satu) # Kita kembali ke data katalog gempabumi yang sudah kita baca menggunakan `pd.read_csv` tadi. Pada `data` kita mendapatkan satu kolom yang menunjukkan waktu yaitu kolom `time`, saat kita lihat tipe datanya tadi kolom ini masih berupa `Object` secara umum, dan mengarah ke jenis data `String`. Python memiliki jenis data khusus untuk menunjukkan waktu yaitu salah satunya adalah `datetime.datetime`. Dengan demikian kolom `time` harus kita konversi ke dalam tipe `datetime.datetime`. Proses konversi ini dapat dilakukan menggunakan modul `datetime` yang merupakan bawaan dari Python. # In[36]: list_time = list(data['time']) time_pertama = list_time[0] print("time_pertama", time_pertama) print("tipe data",type(time_pertama)) # Kita dapatkan hasil bahwa untuk waktu pertama tipe datanya adalah masih berupa `String` yang ditunjukkan dengan tulisan `String`. Agar data waktu dapat diolah kita dapat mengubah ke format `datetime.datetime` dengan: # # ```python # datetime.datetime.strptime() # ``` # # Sebelumnya kita lihat dulu fungsi `help` untuk `datetime.datetime.strptime()`: # In[37]: import datetime help(datetime.datetime.strptime) # Ternyata fungsi ini merupakan turunan dari `time.strptime` sehingga untuk melihat petunjukanya kita dapat menggunakan: # In[38]: import time help(time.strptime) # Berdasarkan petunjuk di atas kita harus memasukkan `String` kita yaitu `time_pertama` sebagai argumen pertama kemudian diikuti format dari penulisan waktu kita. Waktu kita ditulis dengan menggunakan `2021-01-27T18:43:24.965Z` sehingga menurut pentujuk di atas kita akan menuliskan format `'%Y-%m-%dT%H:%M:%S.%fZ'` sehingga kode untuk konversi menjadi: # In[39]: time_pertama_dt = datetime.datetime.strptime(time_pertama, '%Y-%m-%dT%H:%M:%S.%fZ') # In[40]: print("time_pertama", time_pertama) print("time_pertama_dt", time_pertama_dt) # Dari hasil di atas sekilas nampak sama, mari kita lihat tipe masing-masing, baik yang sebelum dikonversi dengan yang sudah dikonversi: # In[41]: print("tipe data time_pertama", type(time_pertama)) print("tipe data time_pertama_dt", type(time_pertama_dt)) # Dengan fungsi `type` dapat dilihat dengan jelas bahwa untuk format yang sudah dikonversi berubah menjadi `datetime.datetime` sesuai dengan salah satu standar format data berjenis waktu pada Python. # Selanjutnya kita akan mengaplikasikan `for` loop untuk mengonversi semua data dalam `List` `list_time` agar tidak perlu melakukannya satu per satu. # In[42]: list_time_dalam_datetime = [] for time in list_time: time_terkonversi = datetime.datetime.strptime(time, '%Y-%m-%dT%H:%M:%S.%fZ') list_time_dalam_datetime.append(time_terkonversi) # **Looping** di atas di awali dengan membuat `List` kosong yang nantinya akan diisi dengan waktu yang sudah dikonversi menjadi format `datetime.datetime`. Proses looping pertama yaitu untuk data pertama pada `list_time`, data ini kemudian akan dikonversi menggunakan fungsi `datetime.datetime.strptime` yang tadi sudah kita coba untuk waktu pertama. Setelah dikonversi, waktu terkonversi akan dimasukkan ke dalam `List` `list_time_dalam_datetime` menggunakan metode `append`. Proses konversi dan `append` ini diulang sampai semua data pada `list_time` terkonversi dan masuk dalam `list_time_dalam_datetime`. Pengecekean kita lakukan dengan memanggil `list_time_dalam_datetime`. # In[43]: list_time_dalam_datetime[:5] # List di atas semua anggotanya sudah dalam bentuk `datetime.datetime`. # Setelah terkonversi kita sudah dapat menggunakan kolom waktu ini untuk analisisnya, contohnya untuk mengeplot setiap waktu kejadiandan berapa magnitudonya, plot ini hanya preview dan akan dijelaskan di bagian belakang secara lebih mendetail: # In[44]: import matplotlib.pyplot as plt import matplotlib.dates as mdates # mendefinisikan list waktu dan magnitudo waktu = list_time_dalam_datetime magnitudo = list(data['magnitude']) # membuat plot fig, ax = plt.subplots() ax.scatter(waktu, magnitudo, color="blue") ax.set_title("Grafik Magnitudo terhadap Waktu Kejadian \nGempa Mamuju") ax.set_xlabel("Waktu") ax.set_ylabel("Magnitudo (M)") ax.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d")) plt.xticks(rotation=65) plt.grid() # Bandingkan dengan plot **SALAH** di bawah ini, karena `String` pada waktu belum dikonversi ke dalam `datetime.datetime`. # In[45]: import matplotlib.pyplot as plt import matplotlib.dates as mdates waktu = list_time magnitudo = list(data['magnitude']) fig, ax = plt.subplots() ax.scatter(waktu, magnitudo, color="blue") ax.set_title("Plot SALAH karena waktu masih String") ax.set_xlabel("Waktu") ax.set_ylabel("Magnitudo (M)") ax.xaxis.set_major_formatter(mdates.DateFormatter("%Y-%m-%d")) plt.xticks(rotation=65) plt.grid() # ## *Conditional* # # *Conditional* merupakan susunan dari pernyataan-pernyataan jika yang digunakan untuk menentukan keputusan/*decision making*. Pada Python algoritma *conditional* biasanya dituliskan menggunakan `if` untuk level pertama, dilanjutkan `elif` untuk level berikutnya, dan untuk level terakhir menggunakankan pernyataan `else`. Mungkin akan lebih mudah apabila dijelaskan dalam bentuk kode: # In[49]: nilai = float(input("Masukkan angka nilai anda: ")) if nilai < 50: print("Nilai anda", "D") elif nilai <60: print("Nilai anda", "C") elif nilai <70: print("Nilai anda", "B") else: print("Nilai anda", "A") # Pada contoh di atas apabila kita memasukkan nilai 55 maka yang pertama kali dicek adalah kondisional paling atas yaitu `if nilai <50`, karena nilai lebih besar daripada 50 maka ekspresi akan dilanjutkan ke kondisional kedua yaitu `elif nilai <60`, dimana pada fase kedua ini sudah cocok karena nilai 55 berada di bawah 60 sehingga akan keluar `Nilai anda C`. Contoh dibawah ini adalah untuk kasus nilai 45: # In[50]: nilai = float(input("Masukkan angka nilai anda: ")) if nilai < 50: print("Nilai anda", "D") elif nilai <60: print("Nilai anda", "C") elif nilai <70: print("Nilai anda", "B") else: print("Nilai anda", "A") # Pada nilai 45 proses sudah langsung terhenti di level 1 (`if nilai < 50`) sehingga proses akan selesai dan keluar hasil cetakan berupa `Nilai anda D`. Kondisional ini dapat berlevel dan dapat pula menggunakan ekspresi `and` untuk "dan" dan `or` untuk `atau`. Seperti contoh di bawah ini: # In[51]: nilai = float(input("Masukkan angka nilai anda: ")) if nilai>50 and nilai <70: print("Nilai anda berada di antara 50 dan 70") elif nilai<50 or nilai>70: print("Nilai anda bisa jadi lebih rendah dari 50\ atau lebih tinggi dari 70") # Pada contoh di atas apabila kita memasukkan nilai 60, Python akan mencetak `Nilai anda berada di antara 50 dan 70` karena angka 60 lebih besar dari 50 (`nilai>50`) dan (`and`) lebih rendah dari 70 (`nilai<70`). Berbeda apabila kita memasukkan angka 45, apa yang akan terjadi? # # ### Memfilter data Katalog Menggunakan *Conditional* # # *Conditional* akan kita gunakan untuk memfilter katalog berdasarkan beberapa syarat, seperti syarat waktu kejadian, syarat kedalaman, syarat magnitudo, ataupun syarat lokasi horizontal. Sebelum melakukan filter data katalog, kita akan mengumpulkan terlebih dahulu kolom-kolom data katalog kita. # In[52]: kolom_waktu = list_time_dalam_datetime kolom_latitude = list(data['latitude']) kolom_longitude = list(data['longitude']) kolom_kedalaman = list(data['depth']) kolom_magnitudo = list(data['magnitude']) # Kolom-kolom yang sudah kitakumpulkan akan kita satukan dalam bentuk data baru yaitu `dictionary`. `dictionary` merupakan kumpulan data dengan masing-masing pasangan `key` dan `value`, jika diibaratkan dengan sebuah tabel maka `key` adalah judul kolom dan `value` adalah isi dari kolom tersebut. `dictionary` ini akan kita gunakan untuk menggabungkan kembali kolom-kolom yang sudah terpisah. Pembuatan `dictionary` dalam Python ada beberap cara, pada cara ini kita akan menggunakan fungsi `dict`. # In[53]: katalog_dict = dict(waktu=kolom_waktu, latitude=kolom_latitude, longitude=kolom_longitude, kedalaman=kolom_kedalaman, magnitudo=kolom_magnitudo) katalog_dict # Pada fungsi `dict` di atas kita memberikan masing-masing judul kolom yang kemudian diikuti nilai-nilai untuk kolom tersebut. Salah satu contohnya yaitu untuk judul `waktu` diikuti dengan `kolom_waktu`. Kolom-kolom yang sebelumnya terpisah dan dalam bentuk struktur data `List` kini sudah tergabung dalam satu kesatuan berbentuk `dictionary`. Untuk mengakses kolom pada `dictionary` kita dapat menggunakan cara yang sama ketika mengakses kolom pada `DataFrame` hasil pembacaan `pandas`. Hanya saja pada `dictionary` ini hasil pembacaan kolom akan langsung berbentuk `List`, tanpa dikonversi dengan fungsi `list`. # In[54]: katalog_dict['waktu'][:5] # In[55]: katalog_dict.keys() # Pada contoh di bawah ini kita akan memisahkan lagi `dictionary` menjadi kolom-kolom kemudian memanfaatkan `zip` untuk melakukan *looping* for secara paralel untuk semua kolom data katalog kita. # In[56]: tanggal_awal = datetime.datetime(2021,1,14) # 12 Januari 2021 tanggal_akhir = datetime.datetime(2021,1,15) # 14 Januari 2021 #katalog hasil_filter waktu_hasil_filter = [] longitude_hasil_filter = [] latitude_hasil_filter = [] kedalaman_hasil_filter = [] magnitudo_hasil_filter = [] # memisah masing-masing kolom lagi waktu = katalog_dict['waktu'] latitude = katalog_dict['latitude'] longitude = katalog_dict['longitude'] kedalaman = katalog_dict['kedalaman'] magnitudo = katalog_dict['magnitudo'] # mengumpulkan kolom menjadi satu `zip` katalog = zip(waktu, latitude, longitude, kedalaman, magnitudo) for t,lat,lon,ked,mag in katalog: # jika waktu lebih dari tanggal awal dan kurang dari tanggal akhir if t>tanggal_awal and twaktu_awal and t