Jabodetabek – Analisa Harga Rumah dan Venue
Premise & Business Problem
Jakarta itu penuh, Jakarta itu sesak, dan Jakarta itu salah satu kota tujuan perantau terbesar untuk mengejar mimpi dan atau sekedar mencari nafkah. Gimana ga penuh, meskipun hanya mencakup 699,5 kilometer persegi (terkecil di antara provinsi mana pun) wilayah metropolitannya meliputi 6.392 kilometer persegi. Man, Jakarta menjadi wilayah perkotaan terpadat kedua di dunia setelah Tokyo, dengan populasi sekitar 30 juta pada 2010 !!!! Bayangin (melongo) kota ini tepat memiliki kepadatan penduduk yang sangat tinggi yaitu 14.464 orang per kilometer persegi, dan wilayah metropolitannya memiliki kepadatan 4.383 orang / km persegi !!! [1]
Emang sih peluang bisnis Jakarta, serta potensinya untuk menawarkan standar hidup yang lebih tinggi telah menarik para perantau dari seluruh kepulauan Indonesia, sehingga kebudayaannya manjadi campur baur.
Ga cuma penduduk Jakarta, Jakarta sering diisi dengan pekerja dari luar Jakarta setiap hari, sehingga sering disebut Jabodetabek (Jakarta, Bogor, Depok, Tangerang, Bekasi). Banyaknya transportasi umum memudahkan para pekerja ini untuk pergi ke Jakarta walaupun jaraknya terpaut sangat jauh. So, ada banyak investor yang sudah mulai berinvestasi di wilayah Jabodetabek, dan keisengin ini akan mencoba mengeksplorasi bagian-bagian Jabodetabek terkait dengan harga properti yang relatif rendah dengan intensitas persaingan bisnis yang rendah.
Nah pendekatan yang dipake sih dengan cara dipetain bagan informasi di mana indeks harga rumah ditempatin di Jabodetabek dan setiap kota dikelompokkan sesuai dengan kepadatan venue (tempat yang tersedia).
Bahasa pemrograman yang dipakai Python ya guys.
Data Description
- Pakai Forsquare API yang developer account gan untuk dapetin tempat paling umum dari masing-masing kota di Jabodetabek, gratis 500 hit per hari [2].
- Gan saya akuin cari data itu susah, jadi saya kumpulin satu-satu harga rumah rata-rata terbaru Oct 2019 untuk setiap Kota Jabodetabek dari 99.com [3].
Metodologi
Tabulasi datanya terdiri dari Kota, informasi Harga Rumah Rata-rata, sama koordinatnya.
Terus pakai folium untuk nampilin titik-titik koordinat dari masing-masing kota seperti gambar di bawah ini.
Selanjutnya mainkan foursquare API-nya, saya coba untuk menjelajahi berapa banyak tempat yang ada di kota-kota Jabodetabek. Jaraknya dibatasi sampai radius 10 km untuk setiap kota di Jabodetabek ya, karena di rata-rata untuk batas masing-masing kota terus si Foursquare API ini juga cuma ngebatasin 100 tempat untuk setiap koordinat.
Nongol akhirnya contoh tempat/venue seperti di atas dan juga kategorinya. Yuk coba kita cek ada berapa venue yang kita capture untuk masing-masing kota.
Di sini kita dapat melihat bahwa 8 dari 9 kota mencapai batas 100 tempat yang dijatahkan foursquare API. Hmm, cuma Tangerang aja yang berada di bawah 60 venue.
Tapi hasil ini tidak berarti bahwa penyelidikan menjalankan semua hasil yang mungkin di kota. Sebenarnya, itu tergantung pada informasi Latitude dan Longitude yang diberikan dan di sini kita hanya menjalankan pasangan Latitude dan Longitude untuk setiap kota. Kami dapat meningkatkan kemungkinan dengan informasi Lingkungan dengan informasi Latitude dan Longitude yang lebih banyak. Atau mungkin di Tangerang ini setiap venue yang ada di foursquare jaraknya saling berjauhan, bisa jadi sih mengingat radius yang kita pakai hanya 10 km, dan batas yang dari kota Tangerang lebih dari itu.
Ada 144 kategori unik venue di Jabodetabek, nah kita tampilin nih di tabel buat nunjukkin daftar top 10 kategori venue untuk masing-masing wilayah.
Nah masing-masing kota memiliki beberapa kategori tempat yang umum. Oleh karena itu saya pakai machine learning sederhana yang namanya K-means buat ngelompokkin kota. Algoritma K-Means ini salah satu metode pengelompokan paling umum dari unsupervised.
Kemudian untuk best parameternya, saya metode siku (elbow method) untuk mendapatkan jumlah k yang tepat untuk pengelompokan. Nilai k ini maksudnya berapa jumlah kelompok yang tepat untuk semua data.
Secara umum, metrik parameter penilaian diukur dengan istilah distorsi atau sum of squared error yang di mana menghitung jumlah jarak kuadrat dari setiap titik data ke titik pusat kelompok atau yang dinamakan centroid.
Berdasarkan gambar di atas, semua data paling tepat untuk dijadikan 3 kelompok saja. Kemudian kita buat kerangka data baru yang mencakup kelompok serta 10 tempat top untuk setiap kota.
Kita juga bisa memperkirakan jumlah tempat paling umum pertama di setiap kelompok. Oleh karena itu, kita dapat membuat histogram yang dapat membantu kita menemukan nama label yang tepat untuk setiap kelompok.
Dari hasil di atas, kedai kopi sangat umum di Jabodetabek meskipun tidak selalu di tempat pertama untuk most commmon venue ya, tetapi setidaknya ada di tempat ke 2 paling banyak di Jabodetabek (kedai kopi di cluster 1 berada di tempat ke-2).
So, kita bisa mengelompokkan lagi nih, masing-masing cluster tersebut:
- Cluster 0 : “Coffee Shop and Indonesian Restaurant Venues”
- Cluster 1 : “Indonesian Restaurant Venues”
- Cluster 2 : “Coffee Shop Venues”
Nah sekarang saatnya untuk menganalisis harga jual rumah per meter persegi dalam kisaran tertentu. Ini bentuk tabel harga rumah dan clusternya.
Harga-harga tersebut kita rubah jadi histogram biar lebih enak penyajiannya.
See, ternyata di sini pun kita bisa ngelompokkin harga rumah menjadi 3 kelas:
- ‘<’ 10,000,000 : “Low Level HSP”
- 10,000,000–20,000,000 : “Mid Level HSP”
- ‘>’ 20,000,000 : “High Level HSP”
Sehingga tablenya jadi kayak gini guys.
Salah satu tujuan saya itu menunjukkan jumlah informasi 3 tempat teratas untuk setiap kota di peta. Jadi, kita kelompokkan setiap kota dengan jumlah 3 tempat teratas dan kita menggabungkan informasi tersebut di kolom Join.
Results
Nah akhirnya kita jadiin satu table hasilnya, seperti ini penampakannya.
Kita sekarang dapat melihat kolom Join, Labels dan Level_labels sebagai tiga kolom terakhir di atas.
Akhirnya, mari kita visualisasikan cluster yang dihasilkan ke bentuk peta.
Conclusion
Dari hasil di atas, saya dapat berkesimpulan bahwa orang beralih ke kota besar untuk memulai bisnis atau pekerjaan. Untuk alasan ini, orang dapat mencapai hasil yang lebih baik melalui akses mereka ke platform di mana informasi tersebut disediakan.
Depok dianggap sebagai salah satu kota dengan harga rata-rata perumahan terendah, dan Depok berada dalam cluster venue yang berbeda dari kota-kota lain di Jabodetabek. Jadi masih ada peluang bagus nih gan bagi investor untuk berinvestasi di Depok dengan membawa tren dari daerah Jabodetabek lainnya. Sebagai contoh berinvestasi di area coffee shop di Depok, mengingat venue tersebut paling umum di Jabodetabek.
But ingat ya guys, ini dapat dipelajari lebih dalam mengingat keterbatasan dari Foursquare API developer account yang hanya 100 venue per kota, sehingga investor dan stakeholder akan mendapatkan gambaran yang lebih besar terkait potensi Jabodetabek.
Tidak hanya untuk investor tetapi juga manajer kota dapat mengelola kota lebih teratur dengan menggunakan jenis atau platform analisis data yang serupa.
Thank you sudah membaca tulisan saya yang gajelas ini yaaa.
Reference
- [1] Jabodetabek — Wikipedia
- [2] Forsquare API
- [3] Housing Sales Prices of Each City from 99.com
- [4] https://www.linkedin.com/pulse/housing-sales-prices-venues-data-analysis-ofistanbul-sercan-y%C4%B1ld%C4%B1z/
1 Komentar
Tinggalkan Balasan
Anda harus masuk log untuk mengirim sebuah komentar.
Tinggalkan Balasan
Anda harus masuk log untuk mengirim sebuah komentar.
Bagus gan tulisannya, jadi dapat insight di Jabodetabek nih ?