Ngetech #1 : Ngulik Bidang Sains Data
Episode 1 dari series artikel "Ngetech"
2024-09-23 02:46:04 - printoutln("Kaka")
Pendahuluan
Sains data atau Ilmu data (Inggris: data science) merupakan suatu ilmu yang mempelajari tentang seni mengolah, memvisualisasikan, dan menginterpretasikan sebuah kumpulan data. Di dalamnya, terdapat berbagai subcabang yang harus dipelajari, di antaranya adalah Data Engineering, Statistika, Machine Learning, dan masih banyak lagi.
Sains data bermula dari kisah penggabungan ilmu statistika dan komputer. Penggabungan ini didasari oleh ilmuwan yang bertujuan untuk memudahkan dalam memahami, menginterpretasikan, menganalisis, dan memprediksi data. Pada tahun 1994, Business Week menerbitkan “Database Marketing” yang menggambarkan proses bagaimana perusahaan mengumpulkan kumpulan data. Namun, banyak perusahaan yang masih kewalahan untuk mengolah dan memproses data tersebut. Sehingga, diperlukan alat baru untuk menangani jumlah data yang sangat banyak dan terus berkembang.
Kemudian, setelah dilakukan beberapa kali perkembangan, muncullah istilah baru yaitu sains data. Bidang yang mempelajari bagaimana mengolah, menganalisis, dan memprediksi data. Dengan bantuan perangkat lunak, ilmuwan data mengolah dan menginterpretasikan data yang ada. Data tersebut kemudian akan digunakan untuk membantu mengambil keputusan dalam sebuah bisnis.
Ada dua jenis utama data yang digunakan dalam suatu perusahaan. Yang pertama adalah relational database. Relational database ini berarti setiap data yang ada memiliki keterkaitan satu sama lain. Kemudian, yang kedua adalah non-relational database. Non-relational database adalah sebuah kumpulan data yang tidak memiliki keterkaitan satu sama lain. Bahasa yang populer digunakan untuk relational database adalah SQL, dan bahasa yang populer digunakan untuk non-relational database adalah NoSQL. SQL dan NoSQL merupakan dua bahasa yang totally different meski dari segi nama terlihat mirip.
Kegunaan Sains Data
Sains data telah digunakan dalam berbagai sektor industri bisnis seperti olahraga, e-commerce, dan layanan kesehatan. Dalam olahraga misalnya, seorang sains data mengoleksi data dari setiap pemain dari total successful passes, expected goals, tackles won, dan aspek-aspek lainnya. Setelah dijelaskan oleh ilmuwan data, tim pelatih kemudian akan menggunakan data yang dikoleksi tersebut untuk menentukan peran setiap pemain dan taktik suatu tim.
Dengan data yang ada, tim pelatih juga dapat menemukan kelemahan yang dimiliki oleh lawan. Biasanya, sebuah klub profesional memiliki departemen sendiri dalam bidang data, seperti contohnya Liverpool FC yang memiliki departemen Data & Research. By the way, Liverpool itu merupakan salah satu klub sepak bola yang memiliki departemen data terbaik di dunia (Iyalah, klub gw gitu loh). Kasus tersebut membuktikan tentang bagaimana pentingnya sebuah data untuk mempermudah membuat suatu keputusan. Hal tersebut bukan hanya berlaku di dunia olahraga, tetapi juga di berbagai bidang seperti pembuatan keputusan dalam sebuah bisnis.
Prospek Kerja dan Kuliah
Saat ini, prospek kerja dalam bidang sains data ini sedang ramai dicari di dunia kerja. Seiring dengan berkembangnya berbagai inovasi di bidang teknologi, diperlukan data yang dapat memperlihatkan bagaimana perkembangan dari suatu bidang teknologi. Data yang didapatkan ini kemudian divisualisasikan menjadi sebuah diagram, entah itu diagram tabel, diagram lingkaran, diagram grafik, dan macam-macam diagram lainnya. Setelah dijadikan sebagai sebuah diagram, kemudian data tersebut diinterpretasikan, di sinilah seorang ilmuwan data bekerja. Ilmuwan data menganalisis dan menjelaskan bagaimana tren dari sebuah data yang dikoleksi tersebut.
Dengan kemampuan analisisnya, Ilmuwan data diharapkan dapat memberikan sebuah kesimpulan dan memprediksi bagaimana tren data tersebut bekerja. Nah, di bagian ini, ilmuwan data dibantu dengan adanya machine learning. Machine learning membantu memprediksi bagaimana data tersebut akan bergerak di masa mendatang. Tentunya, prediksinya tidak asal-asalan alias random, prediksi tersebut menggunakan ratusan bahkan mungkin ribuan sampel yang ada. Sampel-sampel tersebut diambil dari berbagai kejadian seperti bagaimana sikap konsumen ketika produk baru diluncurkan dengan sebuah inovasi yang sedikit lebih baik tetapi harganya jauh lebih mahal, kemudian bagaimana sikap konsumen ketika ada perubahan user experience di sebuah aplikasi yang di mana konsumen tersebut sudah nyaman dengan user experience sebelumnya.
Data dari kejadian-kejadian tersebut kemudian dikumpulkan untuk membuat sebuah machine learning. Karena pada dasarnya, ada tiga strategi yang digunakan untuk membuat sebuah machine learning, yaitu temukan masalah yang tepat (find the right problem), melakukan sebuah kesalahan berulang kali (fail forward), dan skalabilitas di atas konsep pembuktian (scale beyond proofs of concept).
Eh, wait, tapi kan sekarang AI sedang marak-maraknya, dan juga, lay-off sedang merajalela dalam industri. Yakin job ilmuwan data masih tetap banyak on-demand? Kalau penulis sih mikirnya pekerjaan tersebut bakal tetap ada. Hanya saja, akan ada efisiensi SDM dalam sebuah perusahaan, alias bahasa kasarnya PHK. Tetapi, lay-off di bidang sains data mungkin tidak akan sebrutal di software engineering. Karena sains data masih memerlukan pemikiran manusia untuk menginterpretasikan data yang telah disajikan. Jadi, sains data adalah pilihan yang mungkin bisa dibilang lebih baik daripada software engineering.
Adapun berbagai universitas telah membuka jurusan sains data, contohnya seperti ITS, UNAIR, IPB, dan ada banyak lagi, terutama politeknik atau institut yang fokus dalam bidang teknologi. Dalam jurusan tersebut, kita tidak hanya mempelajari tentang mengolah data, tetapi juga belajar tentang bagaimana menjaga sebuah data dari serangan, mengurangi silo data dalam sebuah perusahaan, dan banyak hal lagi yang berkaitan dengan data. Bahkan di luar negeri, jurusan sains data juga sudah ada di daftar program studi magister dan doktor. Program magister dan doktor di bidang sains data ini lebih cenderung mempelajari apa esensi dari sebuah kumpulan data, kemudian apa saja hal yang dapat dilakukan dengan data tersebut, dan bagaimana data tersebut dapat berpengaruh dalam lingkup society.
Sumber :
https://telkomuniversity.ac.id/prospek-karir-sains-data-jurusan-paling-dicari-di-era-digital/
https://digitalskola.com/blog/data-science/data-science-vs-software-engineer
Credit Photo : https://www.linkedin.com/pulse/data-science-football-how-data-driven-approach-has-changed-joshi/
Bonus Quote :
"Bukan masa depan penuh harapan yang tak akan pernah datang", Start up, Seo Dal-Mi