![]() | |
ADVAN Laptop Workplus AMD Ryzen 5 14 incLaptop / notebook Advan Workplus menggunakan processor AMD ryzen 5 6600H ditujukan untuk professional, sangat nyaman digunakan untuk bekerja, programing, content creator, IT, main game, serta mendukung semua kegiatan Anda. Laptop / notebook Advan Workplus dapat di buka 180° sehingga dapat digunakan untuk berbagai aktifitas seperti presentasi dengan mudah dengan rekan kerja anda di dalam 1 meja. Free Klik Disini ! |
Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.
Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.
Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.
Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.
Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.
Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.
pip install pandas
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])print(df)
pip install numpy
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)
df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)
df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)
import pandas as pddata = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]df = pd.DataFrame(data)
print(df)
List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.
import pandas as pddf = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)
df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})
import pandas as pd
import numpy as np
np.random.seed(0)
rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)
rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)
import pandas as pd
import numpy as np
np.random.seed(0)rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)
Berikut ini Offset-aliases untuk parameter freq di date_range:
import pandas as pd
import numpy as np
np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)
idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)
df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)
import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)
Nilai yang hilang di isi dengan NaNs
L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)