Sunday, July 26, 2015

Komputasi Numeris: Analisis Regresi Sederhana Non-Linear

Pendahuluan

Pada artikel sebelumnya, kita sudah dapat mencari persamaan regresi linear sederhana menggunakan Least Square Method. Saat ini kita akan mencoba mencari persamaan regresi untuk kurva non-linear sederhana (hanya terdiri atas 2 variabel yaitu 1 variabel dependent dan 1 variabel independent) juga menggunakan Least Square Method.

Pada prinsipnya mencari persamaan regresi non-linear sama dengan regresi linear. Jika kurva yang kita memiliki memiliki pola (trend) lengkung, kita perlu melakukan operasi koordinat agar kurva lengkung tersebut dapat di-representasi-kan dalam kurva linear.

seperti sudah dijelaskan sebelumnya menggunakan MS Excel, Regresi non-linear bermacam-macam. Sebagai contoh:
  1. Regresi Power
  2. Regresi Exponential
  3. Regresi Polynomial
Untuk Analisis Regresi Polinomial akan dijelaskan berikutnya.
Regresi Power direpresentasikan sebagai:

Regresi Exponential direpresentasikan sebagai:
Regresi Polynomial order r direpresentasikan sebagai:



Dasar Teori

Linearisasi kurva lengkung tersebut dapat dilakukan sebagai berikut:
Untuk regresi power dengan a dan b merupakan konstanta dapat direpresentasikan sebagai:
dengan pemisalan:
A = log a, p = log y dan q = log x: maka regresi power dapat direpresentasikan sebagai:

Untuk regesi exponential kita menggunakan LN (baca: len):

dengan pemisalan:
A = ln a, p = ln y dan q=x
maka regresi explonential dapat direpresentasikan (sama seperti saat kita menrepresentasikan regresi Power):
 
 Mudah bukan?

Proses berikutnya kita "perlakukan" persamaan tadi sebagai persamaan linear yang telah kita pelajari sebelumnya.

Untuk mengingat kembali bagaimana mencari nilai a dan b, saya tulis kembali formulanya:
dan

Tetapi kita rubah variabel x dan y menjadi q dan p sehingga menjadi:
dan

Studi Kasus

Setelah kita pahami bagaimana konsep "linearisasi" regresi lengkung menjadi regresi linear, saatnya kita coba dalam studi kasus (saya ambil dari kasus sebelumnya):

Jika kita misalkan variabel jumlah orang menjadi x dan variabel waktu menjadi y, maka perhatikan langkah-langkah dalam tabel MS Excel berikut:


Setelah seluruh variabel formula sudah kita dapatkan, maka nilai A dan nilai b dapat kita cari:

Untuk persamaan regresi Exponential perhatikan tabel MS Excel berikut:



Setelah seluruh variabel formula sudah kita dapatkan, maka nilai A dan nilai b dapat kita cari:


Pembuktian:

Dengan menggunakan fasilitas trendline dari MS Excel yang sudah kita pelajari sebelumnya, kita peroleh persamaan regresi sebagai berikut:


Kurva trendline berwarna merah adalah kurva regresi linear Exponential dan kurva trendline berwarna hitam adalah kurva regresi Power.

Semoga bermanfaat.

Tuesday, July 7, 2015

Menampilkan Persamaan Regresi di Excel 2007 dengan Trendline

Pendahuluan

Banyak kalanya data percobaan yang kita lakukan merupakan data diskrit (cuplikan). Data diskrit tersebut misalnya:
  1. Pengaruh tahanan (resistor) terhadap arus listrik
  2. Arus listrik terhadap daya
  3. dsb

Sebagai contoh yang sudah kita pelajari sebelumnya, kita ingin melihat hubungan antar variabel dependen dengan variabel independen tetapi kali ini menggunakan cara praktis. Semoga cara ini tidak hanya dapat digunakan tetapi juga dimengerti asalnya. Kita tidak ingin membeli kucing dalam karung kan?

Prerequisites

  1. Kita membutuhkan tools MS Excel 2007 (Untuk versi MS Excel sebelumnya atau sesudahnya silahkan disesuaikan).
  2. Data yang akan kita cari persamaan regresinya. Saya menggunakan dua data yang mewakili data linier dan data non linier.
Langkah-langkah

1. Pertama kita tulis data yang kita miliki ke dalam sheet MS Excel seperti pada gambar:


2.  Blok data tersebut kemudian pilih menu insert -> scatter -> scatter with smooth Lines and Marker (sebenarnya jenis scatter-nya bisa bebas saja) seperti pada gambar:


3. Akan terbentuk sebuah chart. Kemudian pilih garis seriesnya dan klik kanan pada garis series tersebut dan pilih add "Add Trendline" seperti terlihat pada gambar
 

4. Jika Add Trendline tidak muncul seperti pada gambar berikut, berarti anda salah dalam memilih object chartnya. Bukan garis series yang anda pilih. Ulangi langkah 3.

5. Memilih tipe regresi. Nah disini, kita akan memilih jenis (tipe) regresi yang cocok dengan grafik kita. Ada beberapa tipe jenis regresi yang ditawarkan oleh MS Excel 2007 yaitu: Exponential, Linier, Logaritmic, Polinomial dengan berbagai Order, Power dan Moving Average seperti terlihat pada gambar.


6. Kecocokan antara jenis regresi dengan grafik ditunjukkan dengan kurva fitting yang terbentuk dengan metode Least Square seperti ditunjukkan pada gambar berikut. Untuk menampilkan formula regresinya, centang "Display Equation on Chart".



7. Selesai.

Monday, July 6, 2015

Komputasi Numeris: Analisis Regresi Sederhana Linear



Pendahuluan:

Persamaan regresi adalah sebuah persamaan matematik (biasanya terdiri minimal 2 variabel) yang digunakan untuk menentukan hubungan 2 variabel tersebut. Variabel tersebut berupa variabel yang diamati (dependen: baca dipengaruhi) terhadap variabel pengaruh (independen: baca mempengaruhi). Seringkali data yang kita peroleh merupakan data experimental yang bersifat diskrit misalnya:
  1. Arus listrik terhadap tegangan
  2. Ukuran file terhadap waktu pengiriman (upload atau download)
  3. Besarnya gaya dengan tekanan
  4. Jumlah karyawan terhadap waktu pengerjaan proyek.
  5. dsb

Yang kita harapkan dari hubungan data-data tersebut adalah:

  1. Membentuk kurva yang dapat “mewakili” hubungan mereka yang disebut sebagai kurva fitting.  
  2. Mengestimasi (memprediksi) nilai pada titik-titik yang tidak diketahui.

Contoh:

Kita memiliki data lama pengerjaan proyek dengan dua variabel yaitu jumlah karyawan terhadap waktu pengerjaan sebagai berikut:
Grafik perbandingan kedua variabel tersebut adalah sebagai berikut:


Dari data tersebut, kita mungkin ingin tahu, hubungan antara jumlah karyawan dengan waktu pengerjaan. Untuk saat ini, kita hanya tahu bahwa: “Semakin banyak karyawan, waktu pengerjaan akan semakin cepat” atau dengan kata lain "Jika ingin pekerjaannya diselesaikan lebih cepat, maka tambahlah karyawan". 
Hal ini didasarkan pada tren data atau grafik tersebut. Tetapi hanya itu. kita tidak bisa menjawab pertanyaan berikut:
  1. Jika saya ingin mengerjakan proyek dalam 25 hari, berapa karyawan yang saya harus rekrut?
  2. Berapa karyawan maksimum yang bisa saya rekrut? Jika melihat pada contoh grafik di atas, setelah 15 karyawan, perubahan waktu pengerjaan tidak lagi signifikan (tidak banyak berubah di sekitar angka 18 hari).
  3. Berapa waktu tercepat pengerjaan proyek? Kecuali kita bukan Bandung Bondowoso yang dapat mengerjakan sebuah perkerjaan dalam satu malam
Pertanyaan-pertanyaan tersebut dapat kita selesaikan dengan persamaan regresi sederhana yang hanya melibatkan 2 variabel (dependen dan independen). Untuk variabel yang lebih komplek, disarankan menggunakan analisis regresi berganda. Pada kesempatan ini, kita akan membahas analisis regresi linear. Untuk analisis regresi non linear akan kita bahas berikutnya.

Dasar Teori: 

Secara prinsip, terdapat 2 metode pendekatan dalam membangun kurva fitting:  
  1. Regresi (nantinya disebut sebagai regresi kuadrat terkecil atau least square method
  2. Interpolasi  
Metode regresi (yang akan kita pelajari) dibuat dengan merepresentasikan tren data secara umum. Kurva yang terbentuk tidak harus melewati titik-titik data diskrit. Perhatikan gambar berikut:

Sedangkan interpolasi adalah metode pendekatan yang dilakukan dengan membuat kurva yang melalui setiap titik. Perhatikan contoh berikut:


Regresi Kuadrat Terkecil
 
Sebelum kita masuk pada bagaimana membuat kurva fitting, kita pahami dulu pengertian menggunakan Least Square Method. Least Square Method adalah metode pengkuadratan kesalahan terkecil.Disini kita akan mencari terlebih dulu nilai kuadrat terkecilnya kemudian nilai tersebut dikuadratkan sehingga diharapkan nilai kesalahannya akan sangat kecil.
Mencari titik terkecil atau terbesar dari sebuah persamaan, secara gampang dapat dilakukan dengan mencari akar persamaan dari persamaan turunannya. Sebagai contoh, sebuah persamaan kuadrat:

memiliki titik puncak parabola di x=0.5. Diperoleh dari f'(x) = 2x - 1 = 0

Karena nilai ekstrim error dapat dicari menggunakan turunan dari persamaan tersebut, maka least square method untuk regresi linear dapat kita algoritmakan sebagai berikut:

1. Asumsikan sistem persamaan linear yang akan kita selesaikan adalah  y = a + bx
2. Error atau kesalahannya dan kuadrat error-nya adalah:
 

3. Jumlah kuadrat kesalahannya:
       
4. Cari nilai terbaik untuk a dan b atau dengan kata lain akan dibentuk kurva fitting dengan error terkecil dengan cara mencari akar persamaan turunannya.
5. Berikut adalah proses mencari nilai a dan b terbaik:
6. Proses mencari nilai b:
Substitusikan  persamaan (1) terhadap persamaan (2):


Maka nilai b adalah:

sedangkan nilai a adalah persamaan (1)

7. Selesai.


Studi Kasus
Setelah kita peroleh formula untuk mencari nilai a dan b terbaik, saatnya kita implementasikan dalam sebuah kasus. Sedikit berbeda dengan pendahuluan yang sebaiknya menggunakan analisis regresi non linear, contoh yang akan kita selesaikan adalah sebagai berikut:

Dari contoh di atas, diketahui jumlah data (n) adalah 8.
Saat-nya kita kumpulkan variabel-variabel yang dibutuhkan untuk mencari a dan b. Perhatikan tabel excel berikut:

maka

Untuk nilai a:

Sehingga persamaan regresi linearnya adalah y = 0.545455 + 0.6363636 x

Pembuktian

Untuk melihat apakah persamaan kita benar atau tidak, kita dapat menggunakan trendline di excel (tutorial dapat dibaca di sini) seperti pada gambar berikut:

Selamat mencoba