Latest News
Rabu, 20 Oktober 2021

scrapping html table menjadi data json dengan beautifulsoup


Pada tutorial sebelumnya, kita sudah mencoba merubah data table di html menjadi json dengan library pandas. Tentunya dapat kita simpulkan bahwa penggunaan library pandas sangatlah mudah, dan hanya membutuhkan beberapa baris coding saja, kita bisa merubah data scrapping table html menjadi json.

Dibalik kemudahan tersebut ada 1 (satu) hal yang kurang nyaman, yaitu ketika di compile menjadi exe dengan library pyinstaller ukuran file exe menjadi lebih besar dari cara lainnya. Kira-kira adakah cara lain yang lebih mudah dan ukuran file exe tidak menjadi lebih besar ?

Berikut coba kita sajikan cara lain untuk merubah data table html ke json selain menggunakan library pandas, kita cukup menggunakan beautifullshoup dengan parsing model html5lib, untuk baris codingnya lebih banyak dari pada yang menggunakan pandas, dan logika sedikit rumit.


import requests

from bs4 import BeautifulSoup

res = requests.get("https://xxxx.com")

html=bs(res .content,'html5lib')

yx=(list(zip(map(lambda x:x.text,html.findAll('td')[::8]),map(lambda x:x.text,html.findAll('td')[1::8]),map(lambda x:x.text,html.findAll('td')[2::8]),map(lambda x:x.text,html.findAll('td')[3::8]),map(lambda x:x.text,html.findAll('td')[4::8]))))

kolom=['NO','NA_SERI_HURUF','NA_NOMOR_PORPORASI','TANGGAL','STATUS']

itemxx=[dict(zip(kolom,row)) for row in yx]

print(itemxx)


  • Blogger Comments
  • Facebook Comments

0 komentar:

Posting Komentar

Item Reviewed: scrapping html table menjadi data json dengan beautifulsoup Rating: 5 Reviewed By: ariesdev