Mengolah Data Excel dengan Pandas dan Jupyter Notebook

Subscribe Dengan Account Google Untuk Membaca Artikel Tanpa Iklan
Mengolah Data Excel dengan Pandas dan Jupyter Notebook

XLSX merupakan format file microsoft excel, pengolahan data dengan microsoft excel cukup popular.

Beragam fungsi bisa kita ciptakan dengan excel macro untuk melakukan bebagai macam penyajian data, baik untuk tujuan statistik dan lain sebagainya.

Pandas merupakan library python yang menyediakan struktur data dan analisis data berkinerja tinggi untuk bahasa python. Untuk pandas kamu bisa mempelajari manual booknya di sini.

Pandas membantu Anda menyederhakan proses pengolahan data, salah satunya data dalam format .XLSX.

Sebelum menggunakan pandas buat terlebih dahulu python environment untuk meng-enkapsulasi project yang akan kita buat, baca tutorial tentang konfigurasi python virtualenvironment di sini.

Setelah membuat environment, sekarang install pandas dengan pip

pip install pandas

Kemudian install library xlrd dan openpyxl untuk melengkapi pandas mengolah file .XLSX dengan pip
pip install xlrd, openpyxl

Selanjutnya buat buat sebuah file dengan nama excels.xlsx, sebagai bahan pembelajaran kamu bisa mendapatkanya di sini. perhatikan sample data di bawah ini

 

sample data excel sample data excel

Dari gambar diatas terdapat sample data kota, jumlah penduduk dan pendapatan harian. pada tutorial kali ini kita akan memparse file .xlsx dengan python.

import pandas as pd

df = pd.read_excel('excels.xlsx', sheet_name='Sheet1')

for i in df.index:
print("Kota: "+df['Kota'][i])
print("Jumlah Penduduk: "+df['Jumlah_Penduduk'][i])
print("Pendapatan Harian: "+df['Pendapatan_Harian'][i])

Perhatikan kode diatas, di dalam file excel terdapat kolom header ( kota, jumlah penduduk, pendapatan harian) dan juga file xlsx tersebut terdapat sheet name dengan nama Sheet1.  

Untuk memparse kolom pada xlsx diatas kita gunakan for . kenapa menggunakan for ?, hal ini karena hasil parse dalam bentuk list data.

Mengubah format Excel ke bentuk Dictionary


Selanjutnya kita akan mengubah data excel di atas kedalam bentuk dictionary.
Perhatikan kode di bawah ini

import pandas as pd

df = pd.read_excel('excels.xlsx', sheet_name='Sheet1')

lst=[]
for i in df.index:
data = {}
data['kota'] = df['Kota'][i]
data['jumlah_penduduk'] = df['Jumlah_Penduduk'][i]
data['pendapatan_harian'] = df['Pendapatan_Harian'][i]
lst.append(data)
print(lst)

Output :

[{'kota': 'jakarta', 'jumlah_penduduk': '15 juta', 'pendapatan_harian': '500 ribu'}, {'kota': 'tangerang', 'jumlah_penduduk': '10 juta', 'pendapatan_harian': '300 ribu'}, {'kota': 'serang', 'jumlah_penduduk': '7 juta', 'pendapatan_harian': '200 ribu'}, {'kota': 'pandegelang', 'jumlah_penduduk': '3 juta', 'pendapatan_harian':'100 ribu'}]

Video Tutorial



Baca artikel lainya:


  1. Tutorial bassic Mysql bagian 1 - Create Read Update Delete

  2. Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join

  3. Tutorial bassic Mysql bagian 3 - Filtering Data

  4. Tutorial bassic Mysql bagian 4 - Grouping Data 

  5. Tutorial bassic Mysql bagian 5 - Operator dan Clausa

  6. Tutorial bassic Mysql bagian 6 - Replace Statement

  7. Tutorial bassic Mysql bagian 7 - Constraint Data

  8. Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel

  9. Tutorial bassic Mysql bagian 9 - Subquery

  10. Tutorial bassic Mysql bagian 10 - Virtual Tabel

  11. Tutorial bassic Mysql bagian 11 - Control Flow Function

  12. Membuat service OTP bagian 1 - OTP dan PIN

  13. Membuat service OTP bagian 2 - Sequence Diagram

  14. Membuat service OTP bagian 3 - Model dan Serializer

  15. Membuat  service OTP bagian 4 - Validate OTP

  16. Membuat  service OTP bagian 5 - Api Client Service

  17. Membuat service user login bagian 1 - Konfigurasi Database

  18. Membuat service user login bagian 2 - Serializer dan JWT

  19. Membuat CRUD service product bagian 1 - Models Product

  20. Membuat CRUD service product bagian 2 - Function Serializer

  21. Membuat CRUD service product bagian 3 - Api Client Service

  22. Membaut CRUD service product bagian 4 - Auth User

  23. Membuat CRUD service product bagian 5 - TDR File Log

  24. Membuat CRUD service product bagian 6 - Unit Test

  25. Membuat service user register bagian 1 - Django

  26. Membuat Service user register bagian 2 - Django

  27. Membuat service filter dan download file CSV di django

  28. Django upload file menggunakan FileSystemStorage