Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.
Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.
Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.
Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.
Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.
Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.
pip install pandas Kemudian buka Visual Studio Code lalu tekan cmd+shift+p (mac)
A) Membuat DataFrame Dari Dictionary Buat DataFrame dari sebuah dictionary, yang berisi dua kolom: angka dan warna. Setiap key mewakili nama kolom dan nilainya adalah rangkaian data, isi kolom:
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']}) print(df) Selanjutnya column pertama yang akan kita print adalah colors
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']}, columns=['colors','number'])
print(df)
B) Membuat DataFrame Menggunaka Numpy Install terlebih dahulu library numpy
pip install numpy 1) Buat DataFrame Dengan Random Number np.random.seed(0) df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC')) print(df) 2) Buat DataFrame Dengan Integer df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC')) print(df) 3) Buat DataFrame dan sertakan nans (NaT, NaN, 'nan', None) di seluruh kolom dan baris df.iloc[::2,0] = np.nan df.iloc[::4,1] = pd.NaT df.iloc[:3,2] = 'nan' df.iloc[:,5] = None df.iloc[5,:] = None df.iloc[7,:] = np.nan print(df) C) Membuat Data Frame Dari List Data Tuple Anda dapat membuat DataFrame dari daftar tupel, dan bahkan dapat memilih elemen tertentu dari tupel yang ingin Anda gunakan.
import pandas as pd
data = [ ('p1', 't1', 1, 2), ('p1', 't2', 3, 4), ('p2', 't1', 5, 6), ('p2', 't2', 7, 8), ('p2', 't3', 2, 8) ]
df = pd.DataFrame(data) print(df)
D) Membuat Data Fame Dari Data Dictionary Buat DataFrame dari beberapa data dengan mengirimkan dict yang memilik bentuk list yang sama. Key Dictionary digunakan sebagai label kolom.
List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.
import pandas as pd
df = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]}) print(df)
Jika array tidak memiliki panjang yang sama, maka akan error.
df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]}) E) Membuat Data Frame Dengan Datetime import pandas as pd import numpy as np np.random.seed(0) #create an array of 5 dates starting at '2024-02-24', one per minute
rng = pd.date_range('2024-02-24', periods=5, freq='T') df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) }) print (df) #create an array of 5 dates starting at '2024-02-24', one per day
rng = pd.date_range('2024-02-24', periods=5, freq='D') df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))}) print(df) DataFrame Dengan DateTimeIndex
import pandas as pd import numpy as np np.random.seed(0)
rng = pd.date_range('2024-02-24', periods=5, freq='T') df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng) print (df)
Berikut ini Offset-aliases untuk parameter freq di date_range:
B: business day frequency C :custom business day frequency (experimental) D: calendar day frequency W: weekly frequency M: month end frequency BM: business month end frequency CBM: custom business month end frequency MS: month start frequency BMS: business month start frequency CBMS: custom business month start frequency Q: quarter end frequency BQ: business quarter endfrequency QS: quarter start frequency BQS: business quarter start frequency A: year end frequency BA: business year end frequency AS: year start frequency BAS: business year start frequency BH: business hour frequency H: hourly frequency T, min: minutely frequency S: secondly frequency L, ms: milliseconds U, us: microseconds N: nanoseconds F) Membuat Data Frame Dengan MultiIndex import pandas as pd import numpy as np 1) Menggunakan from_tuples np.random.seed(0) tuples = list(zip(*[['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]))
idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) print(idx)
2) Menggunakan from_product idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']]) print(idx) 3) Kemudian Gabungkan kedalam Index df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B']) print(df) G) Membuat DataFrame dari List Dictionary DataFrame dapat dibuat dari list dictionary. Key digunakan sebagai nama kolom.
import pandas as pd L = [{'Name': 'John', 'Last Name': 'Smith'}, {'Name': 'Mary', 'Last Name': 'Wood'}]
pd.DataFrame(L)
Nilai yang hilang di isi dengan NaNs
L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37}, {'Name': 'Mary', 'Last Name': 'Wood'}]
pd.DataFrame(L)
H) Video Tutorial VIDEO Baca artikel lainya: Tutorial bassic Mysql bagian 1 - Create Read Update Delete Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join Tutorial bassic Mysql bagian 3 - Filtering Data Tutorial bassic Mysql bagian 4 - Grouping Data Tutorial bassic Mysql bagian 5 - Operator dan Clausa Tutorial bassic Mysql bagian 6 - Replace Statement Tutorial bassic Mysql bagian 7 - Constraint Data Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel Tutorial bassic Mysql bagian 9 - Subquery Tutorial bassic Mysql bagian 10 - Virtual Tabel Tutorial bassic Mysql bagian 11 - Control Flow Function Membuat service OTP bagian 1 - OTP dan PIN Membuat service OTP bagian 2 - Sequence Diagram Membuat service OTP bagian 3 - Model dan Serializer Membuat service OTP bagian 4 - Validate OTP Membuat service OTP bagian 5 - Api Client Service Membuat service user login bagian 1 - Konfigurasi Database Membuat service user login bagian 2 - Serializer dan JWT Membuat CRUD service product bagian 1 - Models Product Membuat CRUD service product bagian 2 - Function Serializer Membuat CRUD service product bagian 3 - Api Client Service Membaut CRUD service product bagian 4 - Auth User Membuat CRUD service product bagian 5 - TDR File Log Membuat CRUD service product bagian 6 - Unit Test Membuat service user register bagian 1 - Django Membuat Service user register bagian 2 - Django Membuat service filter dan download file CSV di django Django upload file menggunakan FileSystemStorage