Coba-Coba Crawling Data

Akhirnya, ada waktu juga buat nyobain data mining. Secara kan hari gini orang lagi happening banget ngobrol² soal big data. Mungkin sebagai permulaan boleh juga nyoba crawling data dari Twitter. Pengalaman beberapa tahun yang lalu (kesannya udah lama banget ya? :D) saya pernah install R dan RStudio di lab, tapi baru sampai tahap install aja gak pernah nyobain. Whatta poor me… 🙁

Oke sekarang kita coba gimana persiapannya.

  1. Buka https://apps.twitter.com/app lalu Signin dengan user dan password Twitter anda, lalu klik Create New App. Sebelumnya pastikan anda sudah mengisi nomor mobile di profile setting Twitter. Jika belum, anda bisa klik icon profile anda di sebelah kanan atas lalu pilih Back To Twitter, klik lagi icon profile hingga masuk ke halaman setting lalu klik Mobile. Isikan no handphone anda, tunggu sms konfirmasi lalu input conrfimation code di kolom yang tersedia.
  2. Setelah diklik Create New App, isi form Application Details. Kolom Name dan Description bebas diisi apa aja, kolom Website isi dengan URL yang valid, Callback URL bisa dikosongkan. Kemudian pada bagian Developer Agreement, ceklis Yes, I agree lalu klik Create Your Twitter Application. Jika berhasil, anda akan masuk ke halaman Application Management.
  3. Klik tab Keys and Access Tokens, perhatikan bagian API Key dan API Secret. Kemudian untuk mendapatkan access token, klik Create My Access Tokens maka akan muncul Access Token dan Access Token Secret. Keempat key ini yang nanti akan digunakan pada proses autentikasi.
  4. Install R, bisa didownload gratis di sini
  5. Install RStudio, bisa didownload gratis di sini
  6. Buka console RStudio lalu ketik command install.packages("twitteR") untuk menginstall package twitteR dari GitHub
  7. Lalu ketik command install.packages(c("devtools", "rjson", "bit64", "httr"))
  8. Pada bagian ini restart session R atau keluar dengan ketik q() lalu Enter
  9. Ketik library(devtools)
  10. Ketik install_github("geoffjentry/twitteR")
  11. Pada bagian ini anda sudah selesai menginstall package twitteR dan dapat melanjutkan ke: ketik library(twitteR)
  12. Ketik setup_twitter_oauth("API key", "API secret", "Access Token", "Acess Token Secret")
  13. Pada bagian ini anda sudah bisa melakukan searching, misal dengan ketik: searchTwitter("bandung") untuk menampilkan 25 tweet teratas yang mengandung kata “bandung”
  14. Selanjutnya comand²nya bisa dikembangkan lagi 😀

Sekian dulu, insya Allah kapan² diterusin lagi tulisannya


Comments

Leave a Reply