![]() | |
Informa Harmon Bangku - PutihHadirkan bangku ottoman Harmon persembahan dari Informa ini untuk membuat tampilan ruangan di hunian Anda lebih menawan. Selain untuk duduk, bangku ini juga dapat digunakan sebagai meja dengan tempat penyimpanan (jika dibalik). Hadir dalam warna putih yang netral sehingga dapat dipadupadankan dengan ragam perabotan di ruangan Anda. Free Klik Disini ! |
Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.
Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.
Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.
Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.
Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.
Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.
pip install pandas
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])print(df)
pip install numpy
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)
df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)
df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)
import pandas as pddata = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]df = pd.DataFrame(data)
print(df)
List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.
import pandas as pddf = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)
df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})
import pandas as pd
import numpy as np
np.random.seed(0)
rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)
rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)
import pandas as pd
import numpy as np
np.random.seed(0)rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)
Berikut ini Offset-aliases untuk parameter freq di date_range:
import pandas as pd
import numpy as np
np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)
idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)
df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)
import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)
Nilai yang hilang di isi dengan NaNs
L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)