Sabtu, 15 Januari 2011

Mengakali ReCaptcha (Image VerificatioN)

Tetapi sebelumnya saya ingin menjelaskan bahwa ReCaptcha (Image VerificatioN) bertujuan untuk mengurangi bot dalam komentar atau pembuatan sebuah akun di beberapa situs. Selain itu dengan menggunakan ReCAPTCHA maka kita secara langsung membantu mendigitize buku-buku sejarah Shakespeare (karena scanner - OCR / Text Recognation Software) terkadang tidak bisa menebak tulisan secara akurat dan masih membutuhkan bantuan manusia. Untuk lebih jelasnya silahkan lihat disini.


Nah terkait alasan diatas saya harus menekankan bahwa apa yang dibahas dibawah ini SEBAIKNYA TIDAK DILAKUKAN.

Mungkin nisa digunakan saat menemui kasus brutal seperti kata-kata yang sulit dibaca atau amburadul seperti ini.


Selain itu tujuan sayia menulis bahasan ini adalah untuk sedikit lebih mengenali juga soal recaptcha ini,  walopun mungkin dari sisi "gelap" nya....



Jadi, INGAT, dukung proyek digitalisasi buku2 sejarah ini melalui penggunaan recaptcha yg baik dan benar. Terimakasih banyak atas perhatiannya....



Tahukah anda bahwa sebenarnya recaptcha cuma membutuhkan input SATU KATA saja, sedangkan kata lainnya cuma dummy. Nah "seninya" disini adalah menentukan mana kata yg tepat dan yg dummy.


PENGENALAN DASAR : TIGA CIRI KATA YG DUMMY


1. KATA YG HANCUR-HANCURAN TIDAK TERBACA

Kata yg amburadul tidak jelas ---> 100% dummy.
Anda cukup memasukkan kata satunya lagi yg terbaca saja.


2. KATA YG MENGANDUNG KOMPONEN ANGKA


Walaupun katanya jelas terbaca, tapi kalau semua atau sebagian adalah ANGKA, maka itu dummy 
Anda masukkan saja kata yg sama sekali tidak ada angkanya.


3. KATA YG MENGANDUNG TANDA BACA / SIMBOL


Walaupun katanya jelas terbaca, tapi kalo ada tanda baca atau simbol (koma, titik dua, tanda kutip, dash, titik ~ apapun) maka itu dummy.
Anda hanya memerlukan kata yg bersih tanpa tanda baca.




PENGENALAN LANJUTAN : BUT WHAT IF ...

1. KEDUA KATANYA TERLIHAT VALID ??
Kalau ada satu kata yg cuma terdiri dari 3 ato 4 huruf, sedangkan kata lainnya jauh lebih panjang, maka kemungkinan besar kata yg lebih dikit hurufnya adalah dummy.


2. KEDUA KATANYA TERLIHAT VALID DAN JUMLAH HURUFNYA HAMPIR SAMA ??


Ini yang paling tricky dari semua kasus recaptcha, ada 2 cara :


1. Pilih kata yg tidak lazim ato tidak memiliki arti 
Seringkali, kata yang punya arti adalah dummy ~ walaupun tidak selalu 


Nah pada sample pertama diatas, yang valid adalah bscian (apaan tuh ?), sedangkan school (kata yg umum) adalah dummy word. 


Pada sample kedua, yang valid adalah ureter (istilah biologi yg tidak umum dipakai sehari-hari), sedangkan citizen (kata yang umum) adalah dummy word.


2. Pilih kata yg font nya lebih tebal atau bold
Seringkali, yang bold adalah kata valid, yang tipis adalah dummy ~ walaupun tidak selalu 




3. KEDUA KATANYA TERLIHAT NGACO ??

Pada sample ini, kata pertama bisa langsung diabaikan, tapi kata kedua. Nah, ini bisa diakali dengan tidak memasukkan huruf yang tidak jelas pada kata yg valid itu. Seperti yg sudah disinggung diatas, "korupsi" satu huruf masih diperbolehkan. Jadi untuk kasus ini, kata nya adalah : portuiz




TAMBAHAN ...
1. NON-CASE SENSITIVE

Kata yang valid ini tidak case-sensitive, jadi anda bisa abaikan soal huruf besar-kecilnya. Pada contoh ini saya sengaja memakai huruf besar-kecil tak beraturan, dan dianggap benar ~ asalkan hurufnya tepat.


2. TOLERANSI KESALAHAN



Pada kata yg valid, tidak usah mengetikkan seluruh hurufnya ~ maksimal 1 huruf yg hilang akan tetap dianggap benar. Misalnya disini kata yang valid adalah trupper, tapi saya hanya memasukkan kata truppe (sengaja tidak lengkap 1 huruf ) dan masih dianggap benar 


Juga di sample ke-2, kata valid nya adalah tooply, tapi apabila diketik toopli maka masih dianggap benar juga.


Hanya saja kalo sudah sampe 2 huruf atau lebih yg hilang ato diganti, maka langsung dianggap salah.


3. MENGGANTI DUMMY WORD


Kalau mau, bisa juga memasukkan kata kedua secara RANDOM sesuai pilihan agan ~ asalkan kata yg benarnya udah dimasukin, maka kata kedua yg merupakan dummy tidak akan diperhatikan oleh komputer.


Misalnya disini saya memasukkan kata dummy nya adalah fuck.


KESIMPULAN :


Cukup masukkan SATU kata yg jelas terbaca dan tanpa tanda baca atau angka.


Juga penggunaan hurufnya adalah non-case sensitive, dan ada toleransi kesalahan max. 1 huruf .


IN THE END ...


Nah saat semua jalan telah gagal, berarti anda memang lagi apes, pencet reset button recaptcha nya deh...hehe


AYO BERLATIH !


Google ternyata menyediakan juga tempat untuk berlatih recaptcha. Coba kunjungi kesini : http://www.google.com/recaptcha/demo/




Disini anda bisa berkali-kali mencoba tanpa batas. Cukup ketik input nya dan klik tombol submit, nanti akan langsung dikasih tau apakah correct ato incorrect



















Sumber : disini

0 komentar:

:)) ;)) ;;) :D ;) :p :(( :) :( :X =(( :-o :-/ :-* :| 8-} :)] ~x( :-t b-( :-L x( =))

Posting Komentar

Silahkan tinggalkan komentar anda.

Related Posts Plugin for WordPress, Blogger...