Pertemuan 10

Supervised Learning

Supervised learning adalah salah satu paradigma dalam machine learning di mana algoritma dipelajari dari data yang telah dilabeli. Artinya, kita memiliki data yang sudah memiliki input (fitur) dan output (label atau target), dan tujuan dari supervised learning adalah untuk mempelajari hubungan antara input dan output sehingga algoritma dapat memprediksi output baru untuk input yang belum pernah dilihat sebelumnya.

Berikut adalah minimal 30 algoritma yang termasuk dalam supervised learning, dengan berbagai jenis dan aplikasi yang berbeda:

1. Linear Regression: Algoritma untuk memprediksi nilai kontinu berdasarkan hubungan linier antara fitur dan target.

2. Logistic Regression: Algoritma untuk klasifikasi biner yang menghasilkan probabilitas kelas dengan menggunakan fungsi logistik.

3. Support Vector Machines (SVM): Algoritma yang mencari pemisah optimal (hiperplane) antara kelas dalam ruang fitur.

4. Decision Trees: Algoritma yang membangun model dalam bentuk struktur pohon untuk menggambarkan keputusan dan konsekuensi dari pilihan yang ada.

5. Random Forest: Algoritma ensemble yang terdiri dari beberapa decision tree, di mana prediksi dilakukan dengan mengumpulkan hasil dari masing-masing pohon.

6. Gradient Boosting Machines (GBM): Metode ensemble di mana model dibangun secara bertahap, dengan setiap model berusaha memperbaiki kesalahan prediksi model sebelumnya.

7. AdaBoost: Algoritma ensemble yang meningkatkan performa dengan menfokuskan pada data yang sulit dijangkau oleh model sebelumnya.

8. Naive Bayes: Algoritma probabilistik yang berdasarkan teorema Bayes untuk klasifikasi dengan asumsi independensi fitur.

9. K-Nearest Neighbors (KNN): Algoritma yang memprediksi kelas dari suatu data dengan membandingkan dengan data terdekat berdasarkan jarak (misalnya, Euclidean distance).

10. Neural Networks: Model yang terdiri dari lapisan-lapisan neuron (unit pemrosesan informasi) yang memungkinkan pembelajaran representasi fitur yang kompleks.

11. Gaussian Processes: Metode non-parametrik untuk regresi dan klasifikasi yang mengasumsikan bahwa data berasal dari distribusi Gaussian.

12. Bayesian Networks: Model probabilistik yang menggambarkan hubungan antara variabel melalui grafik yang menggambarkan dependensi kondisional.

13. Lasso Regression: Regresi linear dengan penalti L1 regularization untuk seleksi fitur.

14. Ridge Regression: Regresi linear dengan penalti L2 regularization untuk mengurangi overfitting.

15. ElasticNet: Kombinasi dari L1 dan L2 regularization untuk regresi linear.

16. Principal Component Regression (PCR): Regresi yang dilakukan setelah melakukan reduksi dimensi menggunakan Principal Component Analysis (PCA).

17. Partial Least Squares Regression (PLSR): Regresi yang dilakukan setelah melakukan reduksi dimensi menggunakan Partial Least Squares (PLS).

18. Quadratic Discriminant Analysis (QDA): Model diskriminan yang mengasumsikan bahwa distribusi data dari masing-masing kelas adalah Gaussian.

19. Decision Stump: Decision tree yang hanya memiliki satu tingkat atau pilihan.

20. Bagging: Teknik ensemble yang menggabungkan hasil dari beberapa model yang sama untuk meningkatkan kinerja.

21. Boosting: Pendekatan ensemble yang membangun model secara bertahap dengan memperbaiki kesalahan prediksi model sebelumnya.

22. Multi-layer Perceptron (MLP): Jenis neural network dengan beberapa lapisan tersembunyi.

23. Radial Basis Function Network (RBFN): Neural network dengan fungsi basis radial sebagai fungsi aktivasi di lapisan tersembunyi.

24. Extreme Learning Machine (ELM): Neural network yang memiliki satu lapisan tersembunyi dan menghitung bobot secara acak.

25. Bayesian Neural Networks: Neural network yang memanfaatkan prinsip Bayesian untuk pengaturan bobot dan bias.

26. Conditional Random Fields (CRF): Model probabilistik untuk masalah labeling sequence, seperti dalam pemrosesan bahasa alami atau pengenalan entitas dalam teks.

27. Ordinal Regression: Regresi untuk memodelkan hubungan ordinal antara variabel dependen dan independen.

28. Ordinal Logistic Regression: Versi ordinal dari logistic regression untuk kasus klasifikasi dengan variabel dependen ordinal.

29. Survival Analysis: Model untuk memprediksi waktu sampai terjadinya suatu peristiwa (seperti kematian atau kegagalan).

30. Dynamic Time Warping (DTW): Metode untuk membandingkan sequence data dengan menghitung jarak dinamis antara mereka, sering digunakan dalam pengenalan pola.

Setiap algoritma di atas memiliki kekuatan dan kelemahan tersendiri, serta dapat lebih efektif dalam situasi tertentu tergantung pada sifat data dan masalah yang dihadapi. Dengan memahami berbagai algoritma supervised learning ini, praktisi machine learning dapat memilih dan mengimplementasikan pendekatan yang paling sesuai untuk tujuan spesifik mereka.

Cari Blog Ini

Data Mining

Pertemuan 10

Supervised Learning

Komentar

Posting Komentar