Sunday, October 25, 2015

Object Detection: Membuat Classifier Anda Sendiri

Pendahuluan

Pada tutorial sebelumnya, kita sudah belajar bagaimana mendeteksi obyek mobil dengan Haarcascade Classifier. Pada tulisan ini, kita akan belajar bagaimana membuat classifier kita sendiri dengan kasus "Deteksi Compact Disk". Diharapkan setelah mempelajari tutorial ini, anda dapat menentukan sendiri obyek apapun yang akan anda deteksi.

Persiapan 
Software yang saya gunakan adalah:
  1. Visual Studio 2010 
  2. library OpenCV 2.4.11.
  3. ObjectMarker
  4. Cascade2xml

Langkah-langkah:

Berikut adalah langkah-langkah pembuatan classifier. Sesuaikan sendiri dengan path direktori anda.

1. Step: Pembuatan list negatif

Buat list foto background (negatif) yang sudah dalam format JPG dan greyscale dengan perintah: dir /b > negatif.txt dan jangan lupa bersihkan file negatif.txt dari dirinya sendiri (karena kata "negatif.txt" ada di dalamnya). Pastikan isi negatif.txt hanya daftar JPG gambar negatif anda. Lihat pada Gambar 1 berikut:

 
Gambar 1: Proses pembuatan list gambar negatif

2. Step: Pemberian fullpath gambar negatif

Berikan FullPath untuk setiap foto negatif yang sudah dibuat (gunakan file list_neg.bat) dengan perintah:

(for /F "delims=" %%L in (neg.txt) do @echo D:\DataJati\belajar_image_processing\negatif\jpg\%%L)>> negNew.txt

Edit lebih dulu dan sesuaikan folder path anda. Pada contoh gambar 2, saya meletakkan file background (negatif) di path: D:\DataJati\belajar_image_processing\negatif\jpg. Sesuaikan dengan path anda masing-masing.


Gambar 2: Proses pemberian fullpath gambar negatif

3. Step: Pembentukan file negNew.txt

Gambar 3 menunjukkan isi file negatif yang lengkap dengan fullpath-nya

Gambar 3: File negNew.txt

4. Step: Persiapan file positif

File positif adalah file yang nantinya menjadi acuan pendeteksian obyek. Kita sebenarnya akan melatih sistem untuk mengenali obyek seperti obyek yang terlihat di file positif ini. Pindahkan file positif anda ke direktori rawdata dengan mengubah format menjadi BMP. Path image rawdata saya ada di D:\DataJati\belajar_image_processing\CD_Tracking\img\rawdata\. Proses pemindahan ke folder rawdata ini wajib karena aplikasi objectmarker.exe di langkah 5 membutuhkannya.

Gambar 4: File positif dalam format BMP

5. Step: Pembuatan object info

Penandaan obyek dengan file objectmarker.exe. Penandaan obyek dimaksudkan untuk menandai area obyek yang akan dideteksi dalam gambar positif. File objectmarker ini saya letakkan di folder yang sama dengan file lainnya seperti terlihat pada Gambar 5 untuk memudahkan saja. Aplikasi objectmarker dapat didownload di sini.

Gambar 5: Aplikasi objectmarker

Saat aplikasi objectmarker dijalankan, anda akan diminta untuk "menandai" sebuah area yang merupakan obyek terdeteksi. Perhatikan gambar 5a. Pada gambar 5a, saya menandai CD di tangan saya, yang otomatis dicatat rawdata area tersebut (gambar 5b).

 Gambar 5a: Proses pembuatan rawdata (1)

Gambar 5b: Proses pembuatan rawdata (2)

6. Step: Terbentuk file info.txt

File info.txt ini berisi rawdata dari sample yang berasal dari gambar positif dari proses tahap 5. Gambar 6 menunjukkan isi rawdata dan bisa berbeda dengan rawdata anda.

Gambar 6: File info.txt yang berisi rawdata gambar positif

7. Step: Replace karakter

Ganti slash (/) menjadi backslash (\) mengikuti format direktori di Sistem Operasi Windows.

Gambar 7: Replace karakter / menjadi \

8. Step: Full Path untuk file info.txt (rawdata)

Proses ini diperlukan untuk memberikan fullpath di file info.txt anda menjadi file positif.txt

Gambar 8a: Proses pemberian full path untuk setiap rawdata

File positif ditunjukkan pada Gambar 8b sebagai berikut:



9. Step: Pembuatan file vector (*.vec)

Buat file VEC menggunakan create_sample_command.bat. Sesuaikan parameter num sesuai jumlah file positif anda (lihat langkah 8). Yang perlu menjadi perhatian adalah parameter lebar dan tinggi (w dan h) disesuaikan dengan langkah 13. Perhatikan gambar 9a. Gambar 9b menunjukkan proses eksekusi createsample.

Gambar 9a: Pembuatan file vector

Proses eksekusinya ditunjukkan pada Gambar 9b sebagai berikut:


  Gambar 9b: Proses pembentukan file vector

10. Step: Terbentuk file vector

Gambar 10 menunjukkan telah terbentuk file samples.vec

Gambar 10: File samples.vec

11. Step: Pembuatan classifier

Pada tahap ini, kita akan membuat classifier XML yang masih terpisah-pisah (belum kita satukan) sebanyak jumlah stage yang tentukan. Pertama kita buat dulu direktori classifier yang akan menampung classifier kita. Perhatikan gambar 11a.

Gambar 11a: Pembuatan tempat penampungan (direktori) classifier

Kemudian kita buat perintah untuk membuat classifier. Perhatikan gambar 11b

Gambar 11b: Perintah haartraining

Pada gambar 11b, saya menulisnya dengan enter agar tidak terlalu panjang saja. :)
Proses training-nya ditunjukkan pada gambar 11c sebagai berikut:

Gambar 11c: Proses Training

12. Step: Terbentuk training cascade

Pada tahap ini telah terbentuk file cascade yang berada di direktori classifier

 Gambar 12: Training Cascade

13. Step: Penyatuan file cascade menjadi cascade classifier lengkap

Pada tahap ini, kita akan menyatukan training cascade di langkah 12 supaya menjadi cascade classifier lengkap yang nantinya akan kita panggil di source code. Saya menggunakan tools convert cascade2xml yang dapat didownload di sini
Pertama kita pindahkan dulu isi classifier kita ke direktori data di aplikasi cascade2xml seperti pada gambar 13a.

 Gambar 13a: Pemindahan classifier ke data

Gambar 13b menunjukkan perintah konversi cascade2xml (perhatikan parameter h dan w-nya). Sesuaikan dengan langkah 9. Data merupakan direktori tempat classifier yang sudah kita pindahkan.

Gambar 13b: Proses penyatuan

Output dari cascade2xml adalah output.xml seperti ditunjukkan gambar 13a. File output inilah yang nanti dipanggil pada source pendeteksian obyek anda.

Implementasi

Setelah file classifier sudah kita dapatkan, berikut adalah source code pendeteksian obyek dalam file CPP.

#include "opencv2/objdetect/objdetect.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"

#include <iostream>
#include <stdio.h>

using namespace std;
using namespace cv;

void deteksi_tampilkan( Mat frame );

String cascade_name = "E:\\cascade2xml\\output.xml";
CascadeClassifier cd_cascade;

string window_name = "Tampilkan - Deteksi Obyek";

int main( )
{
   CvCapture* ambilVideo;
   Mat frame;

   //-- 1. Panggil cascade

if( !cd_cascade.load( cascade_name ) ){ printf("--(!)Error loading\n"); system("PAUSE"); return -1; };

   //-- 2. Baca video

ambilVideo = cvCaptureFromCAM( 0 );
   if (!ambilVideo) {
       printf("Tidak dapat memanggil Kamera");
   }
   else
   {
       printf("Panggil Camera Sukses");
   }

   if( ambilVideo )
   {
     while( true )
     {
   frame = cvQueryFrame( ambilVideo );

   //-- 3. Terapkan classifier ke Frame Video

  
     if( !frame.empty() )
       { deteksi_tampilkan( frame ); }
       else
       { printf(" --(!) Tidak ada Frame -- Berhenti!"); break; }

       int c = waitKey(10);
       if( (char)c == 'c' ) { break; }
      }
   }
   return 0;
 }

//-- Fungsi deteksi_tampilkan

void deteksi_tampilkan( Mat frame )
{
  std::vector<Rect> obyek;
  Mat frame_gray;

  cvtColor( frame, frame_gray, CV_BGR2GRAY );
  equalizeHist( frame_gray, frame_gray );

  //-- Deteksi obyek

cd_cascade.detectMultiScale( frame_gray, obyek, 1.1, 2, 0|CV_HAAR_SCALE_IMAGE, Size(30, 30) );

  for( size_t i = 0; i < obyek.size(); i++ )
  {
    Point center( obyek[i].x + obyek[i].width*0.5, obyek[i].y + obyek[i].height*0.5 );
    ellipse( frame, center, Size( obyek[i].width*0.5, obyek[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
  }

  //-- Tampilkan Pendeteksian
imshow( window_name, frame );
}

Hasil


Note:
Penting untuk menjadi perhatian, banyaknya file positif, negatif dan jumlah stage dalam proses training akan sangat berpengaruh pada ketepatan pendeteksian obyek yang anda lakukan. Permasalahannya, semakin banyak file positif, negatif dan jumlah stage akan memperpanjang waktu yang diperlukan untuk melakukan haartraining. Jadi siapkan cemilan dan tempat duduk yang nyaman saat melakukan haartraining.

Referensi

https://www.cs.auckland.ac.nz/~m.rezaei/Tutorials/Creating_a_Cascade_of_Haar-Like_Classifiers_Step_by_Step.pdf

Selamat mencoba

Wednesday, October 7, 2015

Teknik Digital: Algoritma Booth Untuk Perkalian Dua Bilangan Biner Integer Bertanda

Pendahuluan:

Asumsinya pertama kita sudah mengetahui operasi aritmatika dasar (tambah, kurang, kali dan bagi) untuk bilangan biner integer. Sebagai contoh :

Operasi penjumlahan:

Operasi pengurangan

Operasi perkalian


Operasi pembagian


Asumsi kedua kita juga sudah mengetahui representasi bilangan negatif biner dengan komplemen 2. Sebagai contoh:

-10 (desimal) = 10110 (biner 5 bit)

Saat ini kita akan menggunakan Algoritma Booth untuk perkalian bilangan biner bertanda (signed binary multiplication) karena perkalian bilangan biner bertanda tidak semudah biasanya. :)

Sebelum kita masuk ke algoritma, ada baiknya kita samakan terlebih dulu istilah yang nanti saya gunakan. Jika saya ingin melakukan operasi aritmatika: 6 * -7 maka:

Multiplikan = 6
Multiplier = -7

Algoritma

Algoritma booth adalah sebuah proses iterasi dimana jumlah iterasinya sama dengan jumlah bit yang kita gunakan dalam representasi bilangan biner. Sebagai contoh jika kita memiliki angka -7 dalam desimal dan kita menggunakan 11001 sebagai bilangan binernya, berarti kita menggunakan 5 bit sehingga jumlah iterasi nantinya adalah 5x.

Algoritma Booth ini menggunakan 4 variabel yaitu
  1. Produk
  2. Bit terakhir produk (product's last bit)
  3. Bit terakhir produk sebelumnya (product's previous last bit)
  4. Action
Keterangan:
  • Variabel produk terdiri dari 2 bagian yaitu nilai kiri (left side) dan nilai kanan (right side). Nilai kiri produk nantinya berisi nilai yang akan di "operasi" dengan penjumlahan atau pengurangan dengan multiplikan sedangkan nilai kanan berisi multiplier. Jumlah bit antara left side dan right side harus sama. 
  • Product's last bit (untuk selanjutnya disingat Last Bit) adalah nilai least significant bit (LSB) atau nilai bit paling kanan dari product. Misalnya nanti product memiliki nilai 11010 11001, maka nilai Last bit sama dengan 1. 
  • Product's previous last bit (selanjutnya disingkat Previous Bit) adalah nilai last bit pada iterasi sebelumnya.
  • Setiap kenaikan proses iterasi,  nilai bit produk akan digeser (shifted) ke kanan.
  • Action: Nilai aksi ini tergantung pada susunan last bit dan previous bit di masing-masing iterasi sebagai berikut:
  • 00 : Tidak ada aksi apa-apa
  • 01 : tambahkan bit pada left side product dengan multiplikan
  • 10 : kurangi bit pada left side product dengan multiplikan
  • 11 :  Tidak ada aksi apa-apa
Studi Kasus

Setelah kita memahami langkah-langkah pada algoritma booth, saatnya kita coba implementasi Algoritma Booth pada perkalian bilangan biner bertanda.

Kasus I
Kasus yang akan kita gunakan adalah 6 * -7 (dalam desimal).

Multiplikan : 6 (desimal) = 00110 (biner)
Multiplier : -7 (desimal) = 11001 (biner)
Bantu : -6 (desimal) = 11010 (biner)

Contoh di atas menggunakan representasi 5 bit yang berarti ada 5 iterasi algoritma booth. Angka bantu di sini digunakan untuk membantu aksi saat susunan last bit dan previous bit adalah 1 dan 0.

Perhatikan gambar di bawah ini:
Penjelasan proses penambahan dan pengurangan left side produk dengan multiplikan di Step 1 ke Step 1a dan dari Step 3 ke Step 3a

Penjumlahan produk dengan multiplikan:

Pengurangan produk dengan multiplikan (saya menggunakan teknik penjumlahan dengan angka bantu):

Kasus II: 
9 * -7 dengan 6 bit bilangan biner. Karena menggunakan 6 bit, maka ada 6 step iterasi Algoritma Booth.

Multiplikan : 9 (desimal) = 001001 (biner)
Multiplier : -7 (desimal) = 111001 (biner)
Bantu : -9 (desimal) = 110111 (biner)

Perhatikan tabel berikut:

Semoga Bermanfaat