![]() | |
Pet Kingdom 10 Ltr Pasir Kucing Ultra Odor Seal UnscentedPet Kingdom hadirkan pasir kucing ultra odor seal untuk kebutuhan kucing peliharaan Anda. Pasir kucing premium ini akan menggumpal lebih cepat dan gumpalan tidak mudah rusak, 99.6% tanpa debu, dan terdapat extra karbon dimana dapat mengikat bau sehingga cat litter box tidak cepat bau dan tahan lebih lama. Selain itu, terbuat dari material berkualitas yang aman digunakan untuk kucing Anda. Free Klik Disini ! |
Di tutorial sebelumnya kita telah belajar tentang pengolahan data EXCEL dan CSV menggunakan library pandas.
Di tutorial ini kita kana belajar bagaimana caranya membuat data frame menggunakan library pandas dengan jupyter notebopk.
Data Frame adalah struktur data yang disediakan oleh perpustakaan pandas, selain Seri & Panel.
Data Fame adalah struktur data 2 dimensi dan dapat dibandingkan dengan tabel baris dan kolom.
Setiap baris dapat diidentifikasi dengan indeks bilangan bulat (0..N) atau label yang ditetapkan secara eksplisit saat membuat sebuah objek DataFrame. Setiap kolom dapat memiliki tipe yang berbeda dan diidentifikasi dengan label.
Pastikan terlebih dahulu bahwa Anda telah menginstal library pandas, dan Juga sudah menginstall Visual Studio Code.
pip install pandas
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']})
print(df)
df = pd.DataFrame({'numbers': [1, 2, 3], 'colors': ['red', 'white', 'blue']},
columns=['colors','number'])print(df)
pip install numpy
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
print(df)
df = pd.DataFrame(np.arange(15).reshape(5,3),columns=list('ABC'))
print(df)
df.iloc[::2,0] = np.nan
df.iloc[::4,1] = pd.NaT
df.iloc[:3,2] = 'nan'
df.iloc[:,5] = None
df.iloc[5,:] = None
df.iloc[7,:] = np.nan
print(df)
import pandas as pddata = [
('p1', 't1', 1, 2),
('p1', 't2', 3, 4),
('p2', 't1', 5, 6),
('p2', 't2', 7, 8),
('p2', 't3', 2, 8) ]df = pd.DataFrame(data)
print(df)
List juga bisa berupa ndarray. Semua list/ndarray harus memiliki panjang yang sama.
import pandas as pddf = pd.DataFrame({'A' : [1, 2, 3, 4],'B' : [4, 3, 2, 1]})
print(df)
df = pd.DataFrame({'A' : [1, 2, 3, 4], 'B' : [5, 5, 5]})
import pandas as pd
import numpy as np
np.random.seed(0)
rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Date': rng, 'Val': np.random.randn(len(rng)) })
print (df)
rng = pd.date_range('2024-02-24', periods=5, freq='D')
df = pd.DataFrame({ 'Date': rng, 'Val' : np.random.randn(len(rng))})
print(df)
import pandas as pd
import numpy as np
np.random.seed(0)rng = pd.date_range('2024-02-24', periods=5, freq='T')
df = pd.DataFrame({ 'Val' : np.random.randn(len(rng)) }, index=rng)
print (df)
Berikut ini Offset-aliases untuk parameter freq di date_range:
import pandas as pd
import numpy as np
np.random.seed(0)
tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',
'foo', 'foo', 'qux', 'qux'],
['one', 'two', 'one', 'two',
'one', 'two', 'one', 'two']]))idx = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
print(idx)
idx = pd.MultiIndex.from_product([['bar', 'baz', 'foo', 'qux'],['one','two']])
print(idx)
df = pd.DataFrame(np.random.randn(8, 2), index=idx, columns=['A', 'B'])
print(df)
import pandas as pd
L = [{'Name': 'John', 'Last Name': 'Smith'},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)
Nilai yang hilang di isi dengan NaNs
L = [{'Name': 'John', 'Last Name': 'Smith', 'Age': 37},
{'Name': 'Mary', 'Last Name': 'Wood'}]pd.DataFrame(L)