Teknik analisis data adalah metode dalam memproses data menjadi informasi. Saat melakukan suatu penelitian, kita perlu menganalisis data agar data tersebut mudah dipahami. Analisis data juga diperlukan agar kita mendapatkan solusi atas permasalahan penelitian yang tengah dikerjakan.

Kalau ngomongin data tentu banyak hal yang bisa kita bahas, pada kesempatan kali ini kita akan membahas beberapa tekhnik pengolahan data dengan python pandas: Data Sample : https://github.com/alfinfanther/dataframe-sample

property145.com data sample
property145.com data sample

1) Importing Import data CSV

import pandas as pd

property145 = pd.read_csv("v_property_202106142002.csv")

print(property145)

  2) Exporting Export file ke dalam bentuk CSV  dan XLSX

import pandas as pd

property145 = pd.read_csv("v_property_202106142002.csv")

property145.to_csv('saved_export_to_csv.csv', index=False)

property145.to_excel('saved_export_to_xlsx.xlsx', index=False)

3) Viewing

property145.head(2)
.head(2) : kode ini akan mengambil data 2 baris teratas
property145.tail(2)
.tail(2) : kode ini akan mengambil data 2 baris terbawah

4) Indexing

indexing data satu kolom

property145.set_index(“id”)
indexing data multiple kolom
property145.set_index([‘id’,’title’])
Hapus indexing data
property145.reset_index(inplace = True)

5) Subsetting

Memilih jumlah kolom yang terbatas dari dataframe yang ada dan menyimpannya dalam dataframe baru:

df = property145[['id', 'sale_rent', 'price']]
print(df)
Mengelompokan baris dan kolom
#pilih 3 baris pertama
df[0:3]

#pilih baris pertama sampai bairs ke 4
df[:4]

#pilih 1 baris terakhir
df[-1:]

Mensubset baris dan kolom dari dataframe dengan metod loc
import pandas as pd

property145 = pd.read_csv(“v_property_202106142002.csv”)

#pilih semua kolom untuk barus dari nilai index 0 dan 2 dimana tidak ada kolom tertentu di datafram yang memiliki indek
df = property145.loc[[0, 2], :]
print(df)

#pilih semua kolom untuk baris tertentu atau beberapa baris dimana kolom ditetapkan sebagai index
data = pd.read_csv(“v_property_202106142002.csv”, index_col=”title”)
df = data.loc[[“Tanah Kavling Dekat Pusat Kota Malang”]]
print(df)
#atau
df = data.loc[[“Tanah Kavling Dekat Pusat Kota Malang”, “Rumah di kawasan Islamic Village”]]
print(df)

Memilih kriteria dataframe
df = pd.read_csv("v_property_202106142002.csv")
print(df)

#pilih dataframe dengan kondisi =
x = df[df.price == 165000000]
print(x)

#pilih datafamee dengan multiple kondisi
y = df[(df.price >= 165000000) & (df.price <= 860000000)]
print(y)

Menggunakan command isin
#menggunakan command method isin
z = df["title"].isin(["Tanah Kavling Dekat Pusat Kota Malang"])
print(df[z])

#atau
z1 = df[“title”].isin([“Tanah Kavling Dekat Pusat Kota Malang”])
z2 = df[“price”].isin([165000000])
print(df[z1 & z2])

6) Extracting rows and columns

Extract menggunakan method get()

import pandas as pd
df = pd.read_csv("v_property_202106142002.csv")
#method get
sample_df = df.get("title")
print(sample_df)

#OR

sample_df = df.get(["title", "price"])
print(sample_df)
 Melihat dari popularitas dan mudahnya pengolahan data dengan menggunakan pandas, maka tidak salah kalau kita mempelajarinya.
Baca artikel lainya: