6 Tehnik Basic Pengolahan Data Dengan Python Pandas

Subscribe Dengan Account Google Untuk Membaca Artikel Tanpa Iklan
6 Tehnik Basic Pengolahan Data Dengan Python Pandas

Teknik analisis data adalah metode dalam memproses data menjadi informasi. Saat melakukan suatu penelitian, kita perlu menganalisis data agar data tersebut mudah dipahami.

Analisis data juga diperlukan agar kita mendapatkan solusi atas permasalahan penelitian yang tengah dikerjakan.

Kalau ngomongin data tentu banyak hal yang bisa kita bahas, pada kesempatan kali ini kita akan membahas beberapa tekhnik pengolahan data dengan python pandas: Data Sample : https://github.com/alfinfanther/dataframe-sample

property145.com data sample property145.com data sample


1) Import data CSV



import pandas as pd

property145 = pd.read_csv("v_property_202106142002.csv")

print(property145)



  2) Export file ke dalam bentuk CSV  dan XLSX



import pandas as pd

property145 = pd.read_csv("v_property_202106142002.csv")

property145.to_csv('saved_export_to_csv.csv', index=False)

property145.to_excel('saved_export_to_xlsx.xlsx', index=False)



3) View Data



property145.head(2)

.head(2) : kode ini akan mengambil data 2 baris teratas


property145.tail(2)


.tail(2) : kode ini akan mengambil data 2 baris terbawah


4) Indexing Data


indexing data satu kolom

property145.set_index("id")



indexing data multiple kolom



property145.set_index(['id','title'])




Hapus indexing data



property145.reset_index(inplace = True)




5) Subsetting


Memilih jumlah kolom yang terbatas dari dataframe yang ada dan menyimpannya dalam dataframe baru:


df = property145[['id', 'sale_rent', 'price']]
print(df)



Mengelompokan baris dan kolom



#pilih 3 baris pertama
df[0:3]

#pilih baris pertama sampai bairs ke 4
df[:4]

#pilih 1 baris terakhir
df[-1:]





Mensubset baris dan kolom dari dataframe dengan metod loc



import pandas as pd

property145 = pd.read_csv("v_property_202106142002.csv")

#pilih semua kolom untuk barus dari nilai index 0 dan 2 dimana tidak ada kolom tertentu di dataframe yang memiliki indek
df = property145.loc[[0, 2], :]
print(df)

#pilih semua kolom untuk baris tertentu atau beberapa baris dimana kolom ditetapkan sebagai index
data = pd.read_csv("v_property_202106142002.csv", index_col="title")
df = data.loc[["Tanah Kavling Dekat Pusat Kota Malang"]]
print(df)
#atau
df = data.loc[["Tanah Kavling Dekat Pusat Kota Malang", "Rumah di kawasan Islamic Village"]]
print(df)



Memilih kriteria dataframe



df = pd.read_csv("v_property_202106142002.csv")
print(df)

#pilih dataframe dengan kondisi =
x = df[df.price == 165000000]
print(x)

#pilih datafamee dengan multiple kondisi
y = df[(df.price >= 165000000) & (df.price <= 860000000)]
print(y)




Menggunakan command isin



#menggunakan command method isin
z = df["title"].isin(["Tanah Kavling Dekat Pusat Kota Malang"])
print(df[z])

#atau
z1 = df["title"].isin(["Tanah Kavling Dekat Pusat Kota Malang"])
z2 = df["price"].isin([165000000])
print(df[z1 & z2])




6) Extracting rows and columns


Extract menggunakan method get()


import pandas as pd
df = pd.read_csv("v_property_202106142002.csv")


#method get
sample_df = df.get("title")
print(sample_df)

#OR
sample_df = df.get(["title", "price"])
print(sample_df)

 Melihat dari popularitas dan mudahnya pengolahan data dengan menggunakan pandas, maka tidak salah kalau kita mempelajarinya.



Demo:




Baca artikel lainya: