Membuat Data Frame dengan Pandas dan Jupyter Notebook

Publish on Jan 24, 2023 by Alfin F

Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.

Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.

Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.

Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.

Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.

Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.

pip install pandas

Kemudian buka Visual Studio Code lalu tekan cmd+shift+p (mac)

A) Membuat DataFrame Dari Dictionary

Buat DataFrame dari sebuah dictionary, yang berisi dua kolom: angka dan warna. Setiap key mewakili nama kolom dan nilainya adalah rangkaian data, isi kolom:

df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)

Selanjutnya column pertama yang akan kita print adalah colors

df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])

print(df)

B) Membuat DataFrame Menggunaka Numpy

Install terlebih dahulu library numpy

pip install numpy

1) Buat DataFrame Dengan Random Number

np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)

2) Buat DataFrame Dengan Integer

df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)

3) Buat DataFrame dan sertakan nans (NaT, NaN, 'nan', None) di seluruh kolom dan baris

df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)

C) Membuat Data Frame Dari List Data Tuple

Anda dapat membuat DataFrame dari daftar tupel, dan bahkan dapat memilih elemen tertentu dari tupel yang ingin Anda gunakan.

import pandas as pd

data = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]

df = pd.DataFrame(data)
print(df)

D) Membuat Data Fame Dari Data Dictionary

Buat DataFrame dari beberapa data dengan mengirimkan dict yang memilik bentuk list yang sama. Key Dictionary digunakan sebagai label kolom.

List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.

import pandas as pd

df = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)

Jika array tidak memiliki panjang yang sama, maka akan error.

df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})

E) Membuat Data Frame Dengan Datetime

import pandas as pd
import numpy as np
np.random.seed(0)

#create an array of 5 dates starting at '2024-02-24', one per minute

rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)

#create an array of 5 dates starting at '2024-02-24', one per day

rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)

DataFrame Dengan DateTimeIndex

import pandas as pd
import numpy as np
np.random.seed(0)

rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)

Berikut ini Offset-aliases untuk parameter freq di date_range:

B: business day frequency

C :custom business day frequency (experimental)

D: calendar day frequency

W: weekly frequency

M: month end frequency

BM: business month end frequency

CBM: custom business month end frequency

MS: month start frequency

BMS: business month start frequency

CBMS: custom business month start frequency

Q: quarter end frequency

BQ: business quarter endfrequency

QS: quarter start frequency

BQS: business quarter start frequency

A: year end frequency

BA: business year end frequency

AS: year start frequency

BAS: business year start frequency

BH: business hour frequency

H: hourly frequency

T, min: minutely frequency

S: secondly frequency

L, ms: milliseconds

U, us: microseconds

N: nanoseconds

F) Membuat Data Frame Dengan MultiIndex

import pandas as pd
import numpy as np

1) Menggunakan from_tuples

np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))

idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)

2) Menggunakan from_product

idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)

3) Kemudian Gabungkan kedalam Index

df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)

G) Membuat DataFrame dari List Dictionary

DataFrame dapat dibuat dari list dictionary. Key digunakan sebagai nama kolom.

import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]

pd.DataFrame(L)

Nilai yang hilang di isi dengan NaNs

L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]

pd.DataFrame(L)

H) Video Tutorial

Baca artikel lainya:

Tutorial bassic Mysql bagian 1 - Create Read Update Delete

Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join

Tutorial bassic Mysql bagian 3 - Filtering Data

Tutorial bassic Mysql bagian 4 - Grouping Data

Tutorial bassic Mysql bagian 5 - Operator dan Clausa

Tutorial bassic Mysql bagian 6 - Replace Statement

Tutorial bassic Mysql bagian 7 - Constraint Data

Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel

Tutorial bassic Mysql bagian 9 - Subquery

Tutorial bassic Mysql bagian 10 - Virtual Tabel

Tutorial bassic Mysql bagian 11 - Control Flow Function

Membuat service OTP bagian 1 - OTP dan PIN

Membuat service OTP bagian 2 - Sequence Diagram

Membuat service OTP bagian 3 - Model dan Serializer

Membuat service OTP bagian 4 - Validate OTP

Membuat service OTP bagian 5 - Api Client Service

Membuat service user login bagian 1 - Konfigurasi Database

Membuat service user login bagian 2 - Serializer dan JWT

Membuat CRUD service product bagian 1 - Models Product

Membuat CRUD service product bagian 2 - Function Serializer

Membuat CRUD service product bagian 3 - Api Client Service

Membaut CRUD service product bagian 4 - Auth User

Membuat CRUD service product bagian 5 - TDR File Log

Membuat CRUD service product bagian 6 - Unit Test

Membuat service user register bagian 1 - Django

Membuat Service user register bagian 2 - Django

Membuat service filter dan download file CSV di django

Django upload file menggunakan FileSystemStorage