- Tugas Pemograman dan Data Raya Lanjutan
- Dosen Pengampu: Sabo Hermawan, S.Kom., M.Si.
- Nama: Nadira Azzahra
- Program Studi: Bisnis Digital
- Universitas Negeri Jakarta
- Judul Bahasan: "Dari Web ke Data: Mengambil dan Mengolah Data Secara Efektif"
Materi pada BAB 2 dan BAB 3 membahas dua hal penting dalam dunia data, yaitu pengolahan data (data manipulation) dan pengambilan data dari web (web scraping). Keduanya saling berkaitan karena sebelum data dianalisis, data harus diambil terlebih dahulu, lalu diolah agar menghasilkan informasi yang berguna.
Materi pada BAB 2 ini membahas proses penting dalam pengolahan data, yaitu mulai dari mengambil data hingga mengolahnya menjadi informasi. Pada BAB 3, dijelaskan tentang web scraping, yaitu teknik untuk mengambil data dari website. Setiap website memiliki struktur HTML yang terdiri dari tag, class, dan ID. Dengan bantuan fitur Inspect Element, kita dapat melihat struktur tersebut dan menentukan bagian mana yang ingin diambil. Setelah itu, digunakan library seperti BeautifulSoup untuk mengekstrak data. Namun, proses ini harus dilakukan dengan memperhatikan etika dan aturan, seperti tidak mengambil data pribadi tanpa izin serta tidak membebani server website.
Selanjutnya pada BAB 2, data yang telah diambil akan diolah menggunakan library Pandas. Pandas menyediakan struktur data seperti Series (satu dimensi) dan DataFrame (dua dimensi seperti tabel) yang memudahkan pengolahan data. Dengan Pandas, kita dapat memilih data tertentu, menyaring, mengurutkan, menghitung nilai statistik, serta membersihkan data yang kosong atau tidak lengkap. Tahap ini sangat penting karena data mentah biasanya belum siap untuk dianalisis.
Secara keseluruhan, kedua materi ini saling berkaitan. Web scraping digunakan untuk mengambil data, sedangkan Pandas digunakan untuk mengolah data tersebut menjadi informasi yang lebih rapi dan bermakna. Dengan memahami keduanya, kita dapat melakukan proses pengolahan data secara lengkap dari awal hingga menghasilkan insight yang berguna.