SSD ADVAN X HIKSEMI G3000 M.2 NVMe 256GBSolid State Drive (SSD) adalah perangkat penyimpanan data yang menggunakan teknologi IC (integrated Circuit) sehingga lebih cepat, memiliki kinerja tinggi, dan mengkonsumsi daya lebih rendah. SSD semakin populer dan banyak digunakan dalam berbagai perangkat termasuk laptop, PC, server, dan lainnya. Free Klik Disini ! |
Web scraping adalah teknik yang digunakan untuk mengambil isi sebuah halaman web secara spesifik, misalnya link gambar, isi berita atau sejenisnya.
kali ini kita akan mencoba mengambil source sebuah halaman web dengan library requests. pada web scraping ada 2 hal yang perlu kamu siapkan
pertama, url tujuan yang akan kamu ambil sourcodenya
kedua, user-agent header. kamu bisa menggunakan google chrome ataupun mozila.
perhatikan sample di bawah ini
import requests
from requests.adapters import HTTPAdapter
class Scraper(object):
@classmethod
def scrapy(cls):
urls = {
'home': 'https://www.garuda-indonesia.com/id/id/index.page',
}
headers = {
'User-Agent': 'User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2683.0 Safari/537.36',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, sdch',
'Accept-Language': 'en-US,en;q=0.8',
'Connection': 'keep-alive'
}
s = requests.Session()
s.mount('https://', HTTPAdapter(pool_connections=1))
r_search = s.get(urls['home'], headers=headers, verify=False)
return r_search.text
print(Scraper.scrapy())
sample code diatas akan mendowload source home page html, silahkan kembangkan lebih lanjut untuk hal yang lain.
good luck!