Simple Web Scraping Menggunakan Python

Subscribe dengan Account Google untuk mendapatkan News Letter terbaru dari Halovina !
Kels 10 M2 Levi Air Purifier Portabel Cadr 40 M3/jam - Putih

Kels 10 M2 Levi Air Purifier Portabel Cadr 40 M3/jam - Putih

Miliki kesegaran udara di dalam ruangan dengan menggunakan Levi Portable Air Purifier persembahan dari Kels. Air purifier ini memiliki jangkauan area filtrasi mencapai 10 meter yang mampu menyerap partikel udara kotor dan menggantinya dengan udara yang lebih bersih. Memiliki filtrasi dengan filter HEPA 13 dan 1 lapisan tambahan untuk memaksimalkan filtrasi udara dari kotoran hingga 99.97%.

Free Klik Disini !

web scraping using python

Web scraping adalah teknik yang digunakan untuk mengambil isi sebuah halaman web secara spesifik, misalnya link gambar, isi berita atau sejenisnya.

kali ini kita akan mencoba mengambil source sebuah halaman web dengan library requests. pada web scraping ada 2 hal yang perlu kamu siapkan

pertama, url tujuan yang akan kamu ambil sourcodenya

kedua, user-agent header. kamu bisa menggunakan google chrome ataupun mozila.

perhatikan sample di bawah ini

 

import requests
from requests.adapters import HTTPAdapter

class Scraper(object):

@classmethod
def scrapy(cls):
urls = {
'home': 'https://www.garuda-indonesia.com/id/id/index.page',
}

headers = {
'User-Agent': 'User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2683.0 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, sdch',
'Accept-Language': 'en-US,en;q=0.8',
'Connection': 'keep-alive'
}

s = requests.Session()
s.mount('https://', HTTPAdapter(pool_connections=1))
r_search = s.get(urls['home'], headers=headers, verify=False)
return r_search.text

print(Scraper.scrapy())

sample code diatas akan mendowload source home page html, silahkan kembangkan lebih lanjut untuk hal yang lain.

 

 

good luck!