Python Data Science : Komponen-Komponen Data Science

Subscribe Dengan Account Google Untuk Membaca Artikel Tanpa Iklan

Data science adalah salah satu disiplin ilmu yang secara khusus mempelajari soal data terutama data kuantitatif atau data numerik.

Di bawah ini bagian-bagian data science pada bahasa python yang bisa kamu pelajari:

A) Data exploration & analysis


Terdiri dari : Pandas, NumPy, SciPy

B) Data visualization


Terdiri dari : Matplotlib; Seaborn; Datashaderothers.

C) Classical machine learning


Terdiri dari : Scikit-Learn, StatsModels.

Scikit-learn adalah alat yang digunakan untuk mengimplementasikan klasifikasi, regresi, pengelompokan, dan pengurangan dimensi, sementara StatsModels kurang dikembangkan secara aktif tetapi masih memiliki sejumlah fitur yang bermanfaat.

D) Deep learning


Terdiri dari : Keras, TensorFlow

E) Data storage and big data frameworks


Big Data didefinisikan sebagai data yang secara harfiah terlalu besar untuk berada di satu mesin, atau tidak dapat diproses tanpa adanya lingkungan terdistribusi. Ikatan Python pada teknologi Apache sangat berperan di sini.

Terdiri dari : Apache Spark; Apache Hadoop; HDFS; Dask; h5py/pytables.

F) Odds and ends


Termasuk subtopik seperti natural language processing (NLP), dan manipulasi gambar dengan perpustakaan seperti OpenCV.

Terdiri dari : nltk; Spacy; OpenCV/cv2; scikit-image; Cython

Baca artikel lainya :