Membuat Data Frame dengan Pandas dan Jupyter Notebook

Subscribe Dengan Account Google Untuk Membaca Artikel Tanpa Iklan
Membuat Data Frame dengan Pandas dan Jupyter Notebook

Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.

Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.

Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.

Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.

Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.

Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.

pip install pandas

Kemudian buka Visual Studio Code lalu tekan cmd+shift+p (mac)

A) Membuat DataFrame Dari Dictionary


Buat DataFrame dari sebuah dictionary, yang berisi dua kolom: angka dan warna. Setiap key mewakili nama kolom dan nilainya adalah rangkaian data, isi kolom:

df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)


Selanjutnya column pertama yang akan kita print adalah colors

df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])

print(df)



B) Membuat DataFrame Menggunaka Numpy


Install terlebih dahulu library numpy
pip install numpy

1) Buat DataFrame Dengan Random Number


np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)


2) Buat DataFrame Dengan Integer


df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)


3) Buat DataFrame dan sertakan nans (NaT, NaN, 'nan', None) di seluruh kolom dan baris


df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)


C) Membuat Data Frame Dari List Data Tuple


Anda dapat membuat DataFrame dari daftar tupel, dan bahkan dapat memilih elemen tertentu dari tupel yang ingin Anda gunakan.

import pandas as pd

data = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]

df = pd.DataFrame(data)
print(df)



D) Membuat Data Fame Dari Data Dictionary


Buat DataFrame dari beberapa data dengan mengirimkan dict yang memilik bentuk list yang sama. Key Dictionary digunakan sebagai label kolom.

List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.


import pandas as pd

df = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)



Jika array tidak memiliki panjang yang sama, maka akan error.

df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})


E) Membuat Data Frame Dengan Datetime



import pandas as pd
import numpy as np
np.random.seed(0)


#create an array of 5 dates starting at '2024-02-24', one per minute

rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)



#create an array of 5 dates starting at '2024-02-24', one per day



rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)




DataFrame Dengan DateTimeIndex

import pandas as pd
import numpy as np
np.random.seed(0)

rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)

Berikut ini Offset-aliases untuk parameter freq di date_range:



  1. B: business day frequency

  2. C :custom business day frequency (experimental)

  3. D: calendar day frequency

  4. W: weekly frequency

  5. M: month end frequency

  6. BM: business month end frequency

  7. CBM: custom business month end frequency

  8. MS: month start frequency

  9. BMS: business month start frequency

  10. CBMS: custom business month start frequency

  11. Q: quarter end frequency

  12. BQ: business quarter endfrequency

  13. QS: quarter start frequency

  14. BQS: business quarter start frequency

  15. A: year end frequency

  16. BA: business year end frequency

  17. AS: year start frequency

  18. BAS: business year start frequency

  19. BH: business hour frequency

  20. H: hourly frequency

  21. T, min: minutely frequency

  22. S: secondly frequency

  23. L, ms: milliseconds

  24. U, us: microseconds

  25. N: nanoseconds



F) Membuat Data Frame Dengan MultiIndex



import pandas as pd
import numpy as np





1) Menggunakan from_tuples


np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))

idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)



2) Menggunakan from_product


idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)


3) Kemudian Gabungkan kedalam Index


df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)


 G) Membuat DataFrame dari List Dictionary


DataFrame dapat dibuat dari list dictionary. Key digunakan sebagai nama kolom.

import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]

pd.DataFrame(L)








Nilai yang hilang di isi dengan NaNs


L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]

pd.DataFrame(L)






H) Video Tutorial



Baca artikel lainya:


  1. Tutorial bassic Mysql bagian 1 - Create Read Update Delete

  2. Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join

  3. Tutorial bassic Mysql bagian 3 - Filtering Data

  4. Tutorial bassic Mysql bagian 4 - Grouping Data 

  5. Tutorial bassic Mysql bagian 5 - Operator dan Clausa

  6. Tutorial bassic Mysql bagian 6 - Replace Statement

  7. Tutorial bassic Mysql bagian 7 - Constraint Data

  8. Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel

  9. Tutorial bassic Mysql bagian 9 - Subquery

  10. Tutorial bassic Mysql bagian 10 - Virtual Tabel

  11. Tutorial bassic Mysql bagian 11 - Control Flow Function

  12. Membuat service OTP bagian 1 - OTP dan PIN

  13. Membuat service OTP bagian 2 - Sequence Diagram

  14. Membuat service OTP bagian 3 - Model dan Serializer

  15. Membuat  service OTP bagian 4 - Validate OTP

  16. Membuat  service OTP bagian 5 - Api Client Service

  17. Membuat service user login bagian 1 - Konfigurasi Database

  18. Membuat service user login bagian 2 - Serializer dan JWT

  19. Membuat CRUD service product bagian 1 - Models Product

  20. Membuat CRUD service product bagian 2 - Function Serializer

  21. Membuat CRUD service product bagian 3 - Api Client Service

  22. Membaut CRUD service product bagian 4 - Auth User

  23. Membuat CRUD service product bagian 5 - TDR File Log

  24. Membuat CRUD service product bagian 6 - Unit Test

  25. Membuat service user register bagian 1 - Django

  26. Membuat Service user register bagian 2 - Django

  27. Membuat service filter dan download file CSV di django

  28. Django upload file menggunakan FileSystemStorage