![]() | |
ADVAN Laptop AI Gen Ultra With Ai 14''ADVAN menghadirkan Laptop terbaru yang dapat memenuhi produktivitas pengguna sehari-hari. Laptop ini merupakan generasi AI Gen terbaru dengan versi Prosesor Intel Ultra. AI Gen Ultra sudah memiliki AI Integrated yang dapat membantu memaksimalkan fungsi kerja perangkat. Laptop ini dapat meunujang produktivitas sehari-hari bagi pekerja professional, pelajar, mahasiswa, gamers, UMKM, dan masih banyak lagi. Free Klik Disini ! |
Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.
Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.
Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.
Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.
Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.
Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.
pip install pandas
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])print(df)
pip install numpy
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)
df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)
df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)
import pandas as pddata = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]df = pd.DataFrame(data)
print(df)
List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.
import pandas as pddf = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)
df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})
import pandas as pd
import numpy as np
np.random.seed(0)
rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)
rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)
import pandas as pd
import numpy as np
np.random.seed(0)rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)
Berikut ini Offset-aliases untuk parameter freq di date_range:
import pandas as pd
import numpy as np
np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)
idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)
df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)
import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)
Nilai yang hilang di isi dengan NaNs
L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)