Memahami Apa Itu Data LAKE dan Kegunaanya

Subscribe Dengan Account Google Untuk Membaca Artikel Tanpa Iklan
Memahami Apa Itu Data LAKE dan Kegunaanya

A) Apa Itu Data Lake ?


Data lake adalah tempat untuk menyimpan data terstruktur dan tidak terstruktur, serta metode untuk mengatur volume data yang sangat beragam dari berbagai sumber.

Data Lake menjadi semakin penting karena orang, terutama dalam bisnis dan teknologi, ingin melakukan eksplorasi dan penemuan data yang luas.

Membawa data bersama ke satu tempat atau sebagian besar di satu tempat membuatnya lebih sederhana.

B) Data Lake VS Data Warehouse


Perbedaan utama antara data lake dan data warehouse adalah bahwa data lake cenderung mencerna data dengan sangat cepat dan menyiapkannya nanti saat orang mengaksesnya. 

Sebaliknya, dengan Data Warehouse , Anda menyiapkan data dengan sangat hati-hati di awal sebelum Anda membiarkannya masuk ke data warehouse.

Pengguna cenderung ingin mencerna data ke dalam data lake secepat mungkin, sehingga perusahaan berharap secara cepat memiliki data terbaru sebagai sumber analitik dan pemantauan kinerja bisnis .

Hal ini memungkinkan mereka untuk memiliki akses ke data terbaru dan melihat informasi terbaru.

Dengan data lake, pengguna sering menyerap data dalam bentuk aslinya tanpa mengubahnya.

Ini bisa karena alasan kecepatan, tetapi bisa juga karena alasan lain termasuk keinginan untuk melakukan analitik lanjutan yang bergantung pada data sumber terperinci.

C) Studi Kasus Penggunaan Data Lake


1) Omnichannel Marketing

Menggunakan data lake untuk memperluas data warehous adalah sesuatu yang sering terlihat dalam omnichannel marketing.

Cara berpikir tentang ekosistem data dalam marketing adalah bahwa setiap channel bisa menjadi basis datanya sendiri. Dan kemudian banyak marketer juga membeli data dari pihak ketiga.

Misalnya, seorang marketer mungkin ingin membeli data yang memiliki informasi demografis dan preferensi konsumen tambahan tentang pelanggan.

Hal ini bisa membantu marketer memiliki data lengkap dari setiap pelanggan, yang pada gilirannya membantu membuat kampanye pemasaran lebih dipersonalisasi dan bertarget.

2) Digital Supplay Chain

Digital Supplay adalah lingkungan data yang sama beragamnya dan data lake dapat membantu hal itu, terutama saat data lake ada di Hadoop.

Hadoop sebagian besar merupakan sistem berbasis file karena pada awalnya dirancang untuk file log yang sangat besar dan sangat banyak yang berasal dari server web.

Dalam supplay chain sering terdapat sejumlah besar data berbasis file dan dokumen dari sistem EDI, XML, dan tentu saja saat ini JSON menjadi paling banyak dalam digital supplay chain.

3) Internet Of Thing

Internet of Things menciptakan sumber data baru hampir setiap hari di beberapa perusahaan.

Dan tentu saja, karena sumber-sumber itu beragam, mereka membuat lebih banyak data.

Sebagai contoh, setiap kendaraan angkutan kereta api  memiliki daftar sensor yang sangat banyak sehingga perusahaan dapat melacak kendaraan tersebut melalui ruang dan waktu.

Sejumlah besar informasi datang dari tempat-tempat ini, dan data lake sangat populer karena menyediakan gudang untuk semua data tersebut.

Baca artikel lainya:


  1. Tutorial bassic Mysql bagian 1 - Create Read Update Delete

  2. Tutorial bassic Mysql bagian 2 - Inner, Left, Right, Cross Join

  3. Tutorial bassic Mysql bagian 3 - Filtering Data

  4. Tutorial bassic Mysql bagian 4 - Grouping Data 

  5. Tutorial bassic Mysql bagian 5 - Operator dan Clausa

  6. Tutorial bassic Mysql bagian 6 - Replace Statement

  7. Tutorial bassic Mysql bagian 7 - Constraint Data

  8. Tutorial bassic Mysql bagian 8 - Mengubah Struktur tabel

  9. Tutorial bassic Mysql bagian 9 - Subquery

  10. Tutorial bassic Mysql bagian 10 - Virtual Tabel

  11. Tutorial bassic Mysql bagian 11 - Control Flow Function

  12. Membuat service OTP bagian 1 - OTP dan PIN

  13. Membuat service OTP bagian 2 - Sequence Diagram

  14. Membuat service OTP bagian 3 - Model dan Serializer

  15. Membuat  service OTP bagian 4 - Validate OTP

  16. Membuat  service OTP bagian 5 - Api Client Service

  17. Membuat service user login bagian 1 - Konfigurasi Database

  18. Membuat service user login bagian 2 - Serializer dan JWT

  19. Membuat CRUD service product bagian 1 - Models Product

  20. Membuat CRUD service product bagian 2 - Function Serializer

  21. Membuat CRUD service product bagian 3 - Api Client Service

  22. Membaut CRUD service product bagian 4 - Auth User

  23. Membuat CRUD service product bagian 5 - TDR File Log

  24. Membuat CRUD service product bagian 6 - Unit Test

  25. Membuat service user register bagian 1 - Django

  26. Membuat Service user register bagian 2 - Django

  27. Membuat service filter dan download file CSV di django

  28. Django upload file menggunakan FileSystemStorage