Pada tutorial sebelumnya, kita sudah mencoba merubah data table di html menjadi json dengan library pandas. Tentunya dapat kita simpulkan bahwa penggunaan library pandas sangatlah mudah, dan hanya membutuhkan beberapa baris coding saja, kita bisa merubah data scrapping table html menjadi json.
Dibalik kemudahan tersebut ada 1 (satu) hal yang kurang nyaman, yaitu ketika di compile menjadi exe dengan library pyinstaller ukuran file exe menjadi lebih besar dari cara lainnya. Kira-kira adakah cara lain yang lebih mudah dan ukuran file exe tidak menjadi lebih besar ?
Berikut coba kita sajikan cara lain untuk merubah data table html ke json selain menggunakan library pandas, kita cukup menggunakan beautifullshoup dengan parsing model html5lib, untuk baris codingnya lebih banyak dari pada yang menggunakan pandas, dan logika sedikit rumit.
import requests
from bs4 import BeautifulSoup
res = requests.get("https://xxxx.com")
html=bs(res .content,'html5lib')
yx=(list(zip(map(lambda x:x.text,html.findAll('td')[::8]),map(lambda x:x.text,html.findAll('td')[1::8]),map(lambda x:x.text,html.findAll('td')[2::8]),map(lambda x:x.text,html.findAll('td')[3::8]),map(lambda x:x.text,html.findAll('td')[4::8]))))
kolom=['NO','NA_SERI_HURUF','NA_NOMOR_PORPORASI','TANGGAL','STATUS']
itemxx=[dict(zip(kolom,row)) for row in yx]
print(itemxx)
0 komentar:
Posting Komentar