Data science adalah salah satu disiplin ilmu yang secara khusus mempelajari soal data terutama data kuantitatif atau data numerik.
Di bawah ini bagian-bagian data science pada bahasa python yang bisa kamu pelajari:
A) Data exploration & analysis
Terdiri dari :
Pandas,
NumPy,
SciPyB) Data visualization
Terdiri dari :
Matplotlib;
Seaborn;
Datashader;
others.
C) Classical machine learning
Terdiri dari :
Scikit-Learn,
StatsModels.
Scikit-learn adalah alat yang digunakan untuk mengimplementasikan klasifikasi, regresi, pengelompokan, dan pengurangan dimensi, sementara StatsModels kurang dikembangkan secara aktif tetapi masih memiliki sejumlah fitur yang bermanfaat.
D) Deep learning
Terdiri dari :
Keras,
TensorFlowE) Data storage and big data frameworks
Big Data didefinisikan sebagai data yang secara harfiah terlalu besar untuk berada di satu mesin, atau tidak dapat diproses tanpa adanya lingkungan terdistribusi. Ikatan Python pada teknologi Apache sangat berperan di sini.
Terdiri dari : Apache Spark; Apache Hadoop; HDFS; Dask; h5py/pytables.
F) Odds and ends
Termasuk subtopik seperti natural language processing (NLP), dan manipulasi gambar dengan perpustakaan seperti OpenCV.
Terdiri dari : nltk; Spacy; OpenCV/cv2; scikit-image; Cython
Baca artikel lainya :