Regresi logistik adalah sebuah pendekatan untuk membuat model prediksi
seperti halnya regresi linear atau yang biasa disebut dengan istilah Ordinary Least Squares (OLS) regression.
Perbedaannya adalah pada regresi logistik, peneliti memprediksi
variabel terikat yang berskala dikotomi. Skala dikotomi yang dimaksud
adalah skala data nominal dengan dua kategori, misalnya: Ya dan Tidak,
Baik dan Buruk atau Tinggi dan Rendah.
Apabila pada OLS mewajibkan syarat atau asumsi bahwa
error varians (residual) terdistribusi secara normal. Sebaliknya, pada
regresi logistik tidak dibutuhkan asumsi tersebut sebab pada regresi
logistik mengikuti distribusi logistik.
Asumsi Regresi Logistik antara lain:
- Regresi logistik tidak membutuhkan hubungan linier antara variabel independen dengan variabel dependen.
- Variabel independen tidak memerlukan asumsi multivariate normality.
- Asumsi homokedastisitas tidak diperlukan
- Variabel bebas tidak perlu diubah ke dalam bentuk metrik (interval atau skala ratio).
- Variabel dependen harus bersifat dikotomi (2 kategori, misal: tinggi dan rendah atau baik dan buruk)
- Variabel independen tidak harus memiliki keragaman yang sama antar kelompok variabel
- Kategori dalam variabel independen harus terpisah satu sama lain atau bersifat eksklusif
- Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (independen).
- Regresi logistik dapat menyeleksi hubungan karena menggunakan pendekatan non linier log transformasi untuk memprediksi odds ratio. Odd dalam regresi logistik sering dinyatakan sebagai probabilitas.
Model persamaan aljabar layaknya OLS yang biasa kita gunakan adalah
berikut: Y = B0 + B1X + e. Dimana e adalah error varians atau residual.
Dengan regresi logistik, tidak menggunakan interpretasi yang sama
seperti halnya persamaan regresi OLS. Model Persamaan yang terbentuk
berbeda dengan persamaan OLS.
Berikut persamaannya:
| Persamaan Regresi Logistik |
Di mana:
Ln: Logaritma Natural.
B0 + B1X: Persamaan yang biasa dikenal dalam OLS.
Sedangkan P Aksen adalah probabilitas logistik yang didapat rumus sebagai berikut:
| Probabilitas Regresi Logistik |
Di mana:
exp atau ditulis "e" adalah fungsi exponen.
(Perlu diingat bahwa exponen merupakan kebalikan dari logaritma natural.
Sedangkan logaritma natural adalah bentuk logaritma namun dengan nilai
konstanta 2,71828182845904 atau biasa dibulatkan menjadi 2,72).
Dengan model persamaan di atas, tentunya akan sangat sulit untuk
menginterprestasikan koefisien regresinya. Oleh karena itu maka
diperkenalkanlah istilah Odds Ratio atau yang biasa disingkat Exp(B)
atau OR. Exp(B) merupakan exponen dari koefisien regresi. Jadi misalkan
nilai slope dari regresi adalah sebesar 0,80, maka Exp(B) dapat
diperkirakan sebagai berikut:
Besarnya nilai Exp(B) dapat diartikan sebagai berikut:
Misalnya nilai Exp (B) pengaruh rokok terhadap terhadap kanker paru
adalah sebesar 2,23, maka disimpulkan bahwa orang yang merokok lebih
beresiko untuk mengalami kanker paru dibadningkan dengan orang yang
tidak merokok. Interprestasi ini diartikan apabila pengkodean kategori
pada tiap variabel sebagai berikut:
- Variabel bebas adalah Rokok: Kode 0 untuk tidak merokok, kode 1 untuk merokok.
- Variabel terikat adalah kanker Paru: Kode 0 untuk tidak mengalami kanker paru, kode 1 untuk mengalami kanker paru.
Perbedaan lainnya yaitu pada regresi logistik tidak ada nilai "R Square"
untuk mengukur besarnya pengaruh simultan beberapa variabel bebas
terhadap variabel terikat. Dalam regresi logistik dikenal istilah Pseudo R Square, yaitu nilai R Square Semu yang maksudnya sama atau identik dengan R Square pada OLS.
Jika pada OLS menggunakan uji F Anova untuk mengukur tingkat
signifikansi dan seberapa baik model persamaan yang terbentuk, maka pada
regresi logistik menggunakan Nilai Chi-Square. Perhitungan nilai
Chi-Square ini berdasarkan perhitungan Maximum Likelihood.
Copyright:
http://www.statistikian.com/2015/02/regresi-logistik.html
Tidak ada komentar:
Posting Komentar