Ngomongin Penelitian : Computer Vision, Machine Vision dan Image Processing

Posted by

Yak, nyambung dari postingan sebelumnya. kita udah nyinggung soal pengolahan citra dan kawan – kawannya. tapi sebelumnya kita kenalan dulu sama computer vision, dan machine vision.

jadi, ada 2 terminologi yang sebetulnya berbeda tapi agak – agak overlapping disini. ada bidang ilmu yang menamakan diri Machine Vision. ada bidang ilmu yang menamakan diri Computer vision.

secara definisi, machine vision itu menurut AVA (Automated Vision Association) :

“The use of devices for optical, non-contact sensing to automatically
receive and interpret an image of a real scene in order to obtain
information and/or control machines or processes.”

(AVA 1985).

atau ditambahin lagi sama om Bacthelor *gile, namanya aja udah sarjana* :

Machine Vision (MV) is concerned with the engineering of integrated
mechanical-optical-electronic-software systems for examining natural
objects and materials, human artefacts and manufacturing processes, in
order to detect defects and improve quality, operating efficiency and the
safety of both products and processes. It is also used to control machines
used in manufacturing.

(Bachelor, BG. “Like Two Peas in a Pod”)

sedangkan computer vision, hmmm … gue ga berhasil nemuin definisi textbook-nya, tapi bisa kita liat disini, kalo computer vision itu kira – kira :

Computer vision is a field that includes methods for acquiring, processing, analyzing, and understanding images and, in general, high-dimensional data from the real world in order to produce numerical or symbolic information, e.g., in the forms of decisions

(wikipedia.org)

hmm, ribet yak ? sebetulnya kalo kita bagi 2 tahap, kedua cabang ini kira – kira punya 2 step besar : yang satu kita sebut sebagai …. tahap satu *yealah* yang kedua  kita sebut tahap dua.

(yak, nama diatas diberikan secara pribadi oleh penulis. jadi mohon maaf kurang terlihat cerdas 🙁 )

Tahap satu

tahap satu dari dua ilmu ini SAMA. secara garis besar ada image acquisition, image processing, image analysis, dan image understanding. atau kalo kata om Whelan (2000) : Image analysis, image processing, image representation, image understanding…. ada juga kalo kata pak de Sun (2000) dibagi 3 kategori : low image processing, Intermediate level processing, dan high level processing.

wes, sakarep mu lah pilih yang mana. tapi gue sih lebih pilih yang pertama. lebih mudah dipahami :p

nah, makanya kalo kita pernah denger tentang image processing. sebetulnya itu baru satu tahap dari 2 buah step besar computer vision dan machine vision. it was a biiig chunk of  science ! image processing, itu berbicara soal bagaimana kita memanipulasi gambar. namanya juga ‘pengolahan’. Citra digital, kita olah sedemikian rupa, sehingga bisa representasikan, atau kita fahami. misalnya dengan cara menghilangkan warna – warna tertentu (dengan thresholding), atau mengecilkan noda (erote) atau membesarkan noda (dilate).

nah, dari gambar yang udah kita olah, nanti ada titik – titik tertentu (disebut piksel) yang mengelompok dan bisa kita representasikan. misal, setelah di thresholding (salahsatu metode yang terkenal otsu) biasanya kita mendapatkan citra biner. artinya, citra itu cuma punya 2 warna : hitam atau putih. terus, tinggal kita kelompokin deh, yang hitam objek, yang putih background (atau sebaliknya). untuk merepresentasikan luasan objek, kita tinggal hitung jumlah titik (piksel)-hitam nya. terus dikonversi ke satuan riil make model, kayak centimeter atau meter.

nah, kalo image understanding gimana ? nah, ini dia serunya bidang ilmu kita. jadi, seringkali computer vision/machine vision ini bersinggungan dengan bidang ilmu yang lain. salahsatu paling sering digandeng itu adalah kecerdasan buatan (artificial intellegence) jadi maksudnya gimana ?

Gini, misalnya setelah image representation, kita tahu bahwa mangga… itu luasannya 300 piksel. tapi apakah semua mangga luasannya 300 piksel ? belum tentu. ternyata setelah di ambil citra sebanyak 30 mangga, luasannya beda – beda. ada yang 200, 270, 380, macem macem. nah tujuan kita mau bedain antara mangga dan daun berdasarkan luasannya, gimana ? kita beri pemahaman, supaya si komputer understand… bahwa, gambar, itu dikatakan mangga kalo punya luasan 200 – 400 misalnya. diluar itu, dia pasti daun.

if (luas_mangga > 200) and (luas mangga <= 400) then
mangga = true
else
mangga = false
end if

contoh diatas pakai AI, bertipe rule-based. buat masalah yang lebih kompleks ? rule-based kadangkala ga mengakomodir sih, makanya muncul lah berbagai macam cara; jaringan syaraf tiruan, naive bayes, support vector machine, dll. yaaa gitulah.

Hubungan antara CV, MV, dan ilmu lain (Sumber : wikipedia.org)

eits, ada yang kelewat. kalo image acquisition maen dimana bang ?

nah image acquisition lah yang menjawab misalnya, kita tahu bahwa ada objek luasnya 300 piksel, kira – kira apakah sama luasa riil dari objek seluas 300 piksel, difoto dalam jarak 1 cm, dengan 300 piksel di foto dalam jarak 100 cm ? ya BEDA !

atau, apakah sama warna merah yang difoto saat intensitas 100 lux, dengan intensitas cahaya 8000 lux ? belum tentu.

apakah sama, warna yang dihasilkan ketika sumber cahaya adalah matahari dengan lampu LED ? belum tentu.

makanya image acquisition ini berperan juga sangat penting dalam machine/computer vision. karena, kalo ngambil citranya salah, yowes. take ulang !

bentar. rehat dulu yak ! kita lanjut tahap dua di posting selanjutnya . abang lelah dek ! :p

Tags: ,

Leave a Reply