diff --git a/README2.md b/README2.md new file mode 100644 index 0000000..57673cc --- /dev/null +++ b/README2.md @@ -0,0 +1,81 @@ + +    Logistic regression adalah bentuk klasifikasi yang memprediksi data yang bersifat kategorikal/binary/diskrit,
+    seperti "churn atau no churn" dan "1 atau 0" untuk binary class; 'GOOD', 'BEST', 'NORMAL',
+    'BAD', 'WORST' untuk multiclass; etc [4]. Ia dapat memprediksi probabilitas data antara 0 hingga 1
+    dalam bentuk sigmoid function [4]. Data dengan probabilitas yang berada di atas sigmoid function
+    terkategori sebagai 1, sedangkan yang berada di bawahnya terkategori sebagai 0 [4]. Perbedaan dengan linear
+    regression
adalah di mana linear regression hanya memprediksi data numerikal yang dilambangkan dengan
+
$\bf \hat{y} = \mathbf{\theta_0} + \mathbf{X}\mathbf{\theta}_{1:n-1}^T$
(1)

+
atau

+
$\hat{y} = \theta_0 + x_1\theta_1^{T} + x_2\theta_2^{T} + \dots + x_n\theta_{n-1}^{T} $
(2)

+    Di mana $\mathbf{\hat{y}} = +\begin{bmatrix} +\hat{y}_{0} \\ +\hat{y}_{1} \\ +\vdots\\ +\hat{y}_{n-1} +\end{bmatrix} +$, $\mathbf{\theta_0} = +\begin{bmatrix} +\theta_{0,0} \\ +\theta_{0,1} \\ +\vdots\\ +\theta_{0,n-1} +\end{bmatrix} +$, + $\mathbf{\theta_1} = +\begin{bmatrix} +\theta_{1,0} \\ +\theta_{1,1} \\ +\vdots\\ +\theta_{1,n-1} +\end{bmatrix}$ , $\dots$, + $\mathbf{\theta_{n-1}} = + \begin{bmatrix} +\theta_{n-1,0} \\ +\theta_{n-1,1} \\ +\vdots\\ +\theta_{n-1,n-1} +\end{bmatrix} + $,
+    dan + $\mathbf {X} = +\begin{bmatrix} +x_{0,0} & x_{0,1} & \dots & x_{0,n-1} \\ +x_{1,0} & x_{1,1} & \dots & x_{1,n-1}\\ +\vdots\ & \vdots & \ddots & \vdots \\ +x_{n-1,0} & x_{n-1,1} & \dots & x_{n-1,n-1} +\end{bmatrix}$, dan $n$ merupakan dimensi dari fitur (variabel), di
+    mana $\bf x_{1,:}$ merupakan nilai x pada atribut pertama, dan seterusnya.
+    Linear regression berbentuk garis lurus pada dua dimensi dan berbentuk plane datar
+    pada tiga dimensi [4]. Perlu diingat bahwa persamaan (1)
+    menghasilkan prediksi 1 dimensi, sedangkan persamaan (2) menghasilkan prediksi n$\times$1 dimensi.
+    Persamaan (1) menggunakan variabel $\mathbf{\theta}$ dan $\mathbf{X}$ yang dicetak tebal,
   di mana persamaan (2) sebaliknya. Jika linear regression "dipaksakan" untuk dependent variable
+    yang bersifat categorical, maka
+
$\hat{y} = + \left\{ + \begin{array}{} + 1 \quad if \quad \mathbf{\theta}^T \mathbf{X} \geq 0.5 \\ + 0 \quad if \quad \mathbf{\theta}^T \mathbf{X} < 0.5 + \end{array} + \right.$
(3)

+    Persamaan (3) ini juga berlaku untuk logistic regression [4]. Dari persamaan ini dapat dilihat bahwa classifier
+    tidak dapat menentukan probabilitas dari nilai $\hat{y}$ jika $\geq 1$ dan jika
+    $<$ 1. Di sinilah logistic regression berperan untuk mengatasi masalah ini [4]. +


+    Berbeda dengan logistic regression, di mana grafiknya berbentuk sigmoid atau seperti huruf "S".
+    Di samping dependent variable yang di-train bersifat diskrit/binary/categorical,
+     probabilitas dependent variable yang di-predict/di-test harus bersifat continue yang berada di interval $[0,1]$ [4].
+    Contoh aplikasi dari logistic regression adalah [4] + +    Rumus dari sigmoid function sendiri adalah sebagai berikut
+    
$\sigma(\mathbf{\theta}^T \mathbf{X}) = \frac{1}{1+e^{-\mathbf{\theta}^T\mathbf{X}}}$
(4)
+