A) Apa Itu Data Lake ?
Data lake adalah tempat untuk menyimpan data terstruktur dan tidak terstruktur, serta metode untuk mengatur volume data yang sangat beragam dari berbagai sumber.
Data Lake menjadi semakin penting karena orang, terutama dalam bisnis dan teknologi, ingin melakukan eksplorasi dan penemuan data yang luas.
Membawa data bersama ke satu tempat atau sebagian besar di satu tempat membuatnya lebih sederhana.
B) Data Lake VS Data Warehouse
Perbedaan utama antara data lake dan data warehouse adalah bahwa data lake cenderung mencerna data dengan sangat cepat dan menyiapkannya nanti saat orang mengaksesnya.
Sebaliknya, dengan Data Warehouse , Anda menyiapkan data dengan sangat hati-hati di awal sebelum Anda membiarkannya masuk ke data warehouse.
Pengguna cenderung ingin mencerna data ke dalam data lake secepat mungkin, sehingga perusahaan berharap secara cepat memiliki data terbaru sebagai sumber analitik dan pemantauan kinerja bisnis .
Hal ini memungkinkan mereka untuk memiliki akses ke data terbaru dan melihat informasi terbaru.
Dengan data lake, pengguna sering menyerap data dalam bentuk aslinya tanpa mengubahnya.
Ini bisa karena alasan kecepatan, tetapi bisa juga karena alasan lain termasuk keinginan untuk melakukan analitik lanjutan yang bergantung pada data sumber terperinci.
C) Studi Kasus Penggunaan Data Lake
1) Omnichannel Marketing
Menggunakan data lake untuk memperluas data warehous adalah sesuatu yang sering terlihat dalam omnichannel marketing.
Cara berpikir tentang ekosistem data dalam marketing adalah bahwa setiap channel bisa menjadi basis datanya sendiri. Dan kemudian banyak marketer juga membeli data dari pihak ketiga.
Misalnya, seorang marketer mungkin ingin membeli data yang memiliki informasi demografis dan preferensi konsumen tambahan tentang pelanggan.
Hal ini bisa membantu marketer memiliki data lengkap dari setiap pelanggan, yang pada gilirannya membantu membuat kampanye pemasaran lebih dipersonalisasi dan bertarget.
2) Digital Supplay Chain
Digital Supplay adalah lingkungan data yang sama beragamnya dan data lake dapat membantu hal itu, terutama saat data lake ada di Hadoop.
Hadoop sebagian besar merupakan sistem berbasis file karena pada awalnya dirancang untuk file log yang sangat besar dan sangat banyak yang berasal dari server web.
Dalam supplay chain sering terdapat sejumlah besar data berbasis file dan dokumen dari sistem EDI, XML, dan tentu saja saat ini JSON menjadi paling banyak dalam digital supplay chain.
3) Internet Of Thing
Internet of Things menciptakan sumber data baru hampir setiap hari di beberapa perusahaan.
Dan tentu saja, karena sumber-sumber itu beragam, mereka membuat lebih banyak data.
Sebagai contoh, setiap kendaraan angkutan kereta api memiliki daftar sensor yang sangat banyak sehingga perusahaan dapat melacak kendaraan tersebut melalui ruang dan waktu.
Sejumlah besar informasi datang dari tempat-tempat ini, dan data lake sangat populer karena menyediakan gudang untuk semua data tersebut.
Baca artikel lainya:
- Tutorial bassic Mysql bagian 1 - Create Read Update Delete
- Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join
- Tutorial bassic Mysql bagian 3 - Filtering Data
- Tutorial bassic Mysql bagian 4 - Grouping Data
- Tutorial bassic Mysql bagian 5 - Operator dan Clausa
- Tutorial bassic Mysql bagian 6 - Replace Statement
- Tutorial bassic Mysql bagian 7 - Constraint Data
- Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel
- Tutorial bassic Mysql bagian 9 - Subquery
- Tutorial bassic Mysql bagian 10 - Virtual Tabel
- Tutorial bassic Mysql bagian 11 - Control Flow Function
- Membuat service OTP bagian 1 - OTP dan PIN
- Membuat service OTP bagian 2 - Sequence Diagram
- Membuat service OTP bagian 3 - Model dan Serializer
- Membuat service OTP bagian 4 - Validate OTP
- Membuat service OTP bagian 5 - Api Client Service
- Membuat service user login bagian 1 - Konfigurasi Database
- Membuat service user login bagian 2 - Serializer dan JWT
- Membuat CRUD service product bagian 1 - Models Product
- Membuat CRUD service product bagian 2 - Function Serializer
- Membuat CRUD service product bagian 3 - Api Client Service
- Membaut CRUD service product bagian 4 - Auth User
- Membuat CRUD service product bagian 5 - TDR File Log
- Membuat CRUD service product bagian 6 - Unit Test
- Membuat service user register bagian 1 - Django
- Membuat Service user register bagian 2 - Django
- Membuat service filter dan download file CSV di django
- Django upload file menggunakan FileSystemStorage