Thursday, March 25, 2010

மனிதம் தேடும் இணையம் : CAPTCHA - 2 (முற்றும்)


இணையதள வடிவமைப்பாளர்களுக்கும், அதை உடைக்கும் SPAM தொழிலதிபர்களுக்கும் நடந்த சுமோ யுத்தத்தில் நசுங்கிச் சின்னபின்னமானது அப்பாவி பயனாளர்கள் தான். உச்சகட்டத்தில் பயனாளர்கள் வர்க்கத்தை மொத்தமாக மறந்து விட்டு, போட்டியில் மூழ்கிப் போன விளைவு தான் கீழ்காணும் CAPTCHAக்கள். பார்த்து மகிழவும். ரொம்பவும் பொழுதுபோகாமல் இருக்கும் அன்பர்கள் விடைகளைப் பின்னூட்டத்தில் உள்ளிட்டு, பெருமிதப்பட்டுக்கொள்ள வரவேற்கப்படுகிறார்கள்.



காலப்போக்கில் வடிவமைப்பாளர்களுக்கு CAPTHCAக்களின் தேவை ஆயிரம், லட்சம் என்று அதிகமானது. ஒரு CAPTCHA மீண்டும் காட்சிப்படுத்தப்படுவதற்கு நீண்ட கால இடைவெளித் தேவைப்பட்டதே காரணம். ஏனெனில் ஒவ்வொரு நூறாவது முறையும் ஒரே CAPTCHA க்கள் மீண்டும் தோன்ற ஆரம்பித்தால் நிரல்களை வைத்து நூற்றுக்கு ஒன்று, என்ற கணக்கில் நிரல்கள் எழுதி வெளுக்கப்படும். இதனால் CAPTCHAக்களை வடிவமைத்துத் தரும் நிறுவனங்கள் பெருகின, அவற்றுள் கட்டணச்சேவை மற்றும் இலவசச் சேவை இரண்டும் அடக்கம். இதில் பிரச்சினை என்றால் மூன்றாம் நபரின் CATPCHAக்களைப் பயன்படுத்தும் போது குக்கீஸ்கள் மூலம் உங்கள் வருகையாளர்களின் நடவடிக்கைகள் குறித்துத் தெரிந்து கொள்ள வாய்ப்பிருப்பது(third party cookies) உபரித் தகவல். எனவே கண்ட கண்ட CAPTCHAக்களைப் பயன்படுத்தும் தளங்களுக்குச் செல்லும் போது முன்னெச்சரிக்கைக்காக ஒருமுறை பின்பக்கம் திரும்பிப் பார்த்துக் கொள்வது பரிந்துரைக்கப்படுகிறது.


இது ஒருபுறம் நடந்து கொண்டிருக்க, இப்பிரச்சினையை வித்தியாசமான கோணத்தில் அணுகியவர்கள், reCAPTCHA என்ற திட்டத்தை முன்மொழிந்தார்கள். அதாவது CAPTCHAக்களை உடைக்கப் பயன்படுத்தும் OCR தொழில்நுட்பத்தைக் கொண்டு தான் ஆவணங்களைக் கணினிமயப்படுத்துவது வழக்கம். அவ்வாறு செய்யும் போது நூற்றுக்கு நூறு சரியான வார்த்தைகள் அடையாளம் காணப்படுவதில்லை. அவ்வாறு OCR அடையாளம் காணமுடியாமல் சிரமப்படும் வார்த்தைகளை சரி பார்த்துத் திருத்துவதென்பது நேரத்தை விழுங்கும் வேலை.ஒரு வார்த்தையை OCR அடையாளம் காணமுடியாவிட்டால் அதுவே ஒரு சிறந்த CAPTCHAவிற்கான அடையாளம். எனவே அந்த வார்த்தைகளை CAPTCHAக்களாக மாற்றி இணையத்தில் உலாவ விட்டு, மக்கள் மூலம் சரியான வார்த்தைகளைத் திரும்பப் பெறும் சாமர்த்தியத் திட்டம் தான் reCAPTCHA. சுருங்கச் சொன்னால் 'ஊர்ச்செலவுல ஊறுகாய் சாப்பிடறது'.

reCAPTCHA திட்டம் கார்னெகி மெலன் பல்கலைக் கழகத்தால் புத்தகங்களைக் கணினிமயமாக்க செயல்பாட்டுக் கொண்டுவரப்பட்டது. இணையதள வடிவமைப்பாளர்களுக்கும் தங்கள் தளத்திற்கான CAPTCHAக்களுக்கு ஒரு நல்ல வழங்கி கிடைத்த மகிழ்ச்சி. எங்கெல்லாம் இலவசமோ அங்கெல்லாம் CAPTCHA அவசியம். இணையத்தின் இலவசச் சக்கரவர்த்தி கூகுளுக்கு CAPTCHAக்களின் தேவை மிகமிக அதிகம். விளைவு reCAPTHCA திட்டம் கூகுளுக்குக் கைமாறியது. twitter மற்றும் facebook ஆகியவை reCAPTCHA பயன்படுத்தும் தளங்களில் முக்கியமானவை.

reCAPTCHA எப்படி செயல்படுகிறது?. ஒரு புதிர் சரியா, தவறா என்று கணிப்பதற்கு, உங்களுக்கு விடை தெரிந்திருக்க வேண்டும். ஆனால் reCAPTCHA என்பது விடைதெரியா புதிர்களுக்கு மக்களிடம் விடையைப் பெறும் முறை. அதில் எவ்வாறு விடைகளைச் சரியா, தவறா என்று கணிக்கிறார்கள்?. எப்போதும் reCAPTCHAக்கள் இரண்டு வார்த்தைகளோடு தான் காட்சிக்கு வைக்கப்படும். அவற்றில் ஒன்று விடை தெரிந்த வார்த்தை மற்றது reCAPTCHA வார்த்தையாக இருக்கும். பயனாளர் அவற்றுக்கான விடையை உள்ளிடும் போது ஒன்று சரியாக இருந்தால் மற்றொன்றும் சரியாகத் தான் இருக்கும் என்ற நம்பிக்கையின் அடிப்படையில் பயனாளரின் விடை சேமிக்கப்படும். அதோடு விட்டுவிடாமல் அதே reCAPTCHA பல்வேறு ஜோடி வார்த்தைகளுடன் பல பயனளார்கள் மூலம் விடைகள் பெறப்பட்டு அதிகபட்சமாக பெறப்பட்ட விடையே சரியானத் தீர்வாக எடுத்துக்கொள்ளப்படுகிறது.

இப்பொழுது கூகுள் reCAPTCHA மூலம் ஆதிகால நியூயார்க் டைம்ஸ் இதழ்களைக் கணினிமயப்படுத்திக் கொண்டிருக்கிறது. ஒரு நாளைக்குச் சுமாராக 30 மில்லியன் வார்த்தைகள் reCAPTCHA மூலம் சரிப்படுத்தப்பட்டுக்கொண்டிருக்கிறது. தங்களுத்தெரிந்தோ, தெரியாமலோ இணைய உலகம் அதற்கு உழைத்துக் கொண்டிருக்கிறது. 'பாதுகாப்புக்கு பாதுகாப்பாச்சு, வேலையும் முடிஞ்சு போச்சு' என்று ஒரே கல்லில் இரண்டு மாங்காய் அடிக்கப்படுவது சுவராஸ்யம்.

இணையத்தில் எங்கேனும் CAPTCHAக்கள் பக்கம் செல்லுகையில் இரட்டை வார்த்தைகளைக் கண்டதும் reCAPTCHA உங்களுக்கு நினைவுக்கு வருவதற்கு இத்தொடர் காரணியாக இருந்தால் மிக்க மகிழ்ச்சியடையப்படும் என்று தெரிவித்துக் கொண்டு சுடுதண்ணி விடைபெற்றுக்கொள்கிறது :).




14 comments:

சைவகொத்துப்பரோட்டா said...

//இரட்டை வார்த்தைகளைக் கண்டதும் reCAPTCHA உங்களுக்கு நினைவுக்கு வருவதற்கு இத்தொடர் காரணியாக இருந்தால் மிக்க மகிழ்ச்சியடையப்படும்//

நிச்சயம் இந்த தொடர் நினைவில் வரும், நன்றி.

Mohan said...

சான்சே இல்லை... உங்களுக்கு நிகர் நீங்கள்தான்.... பயனுள்ள தகவல்களை
சுவாரசியமாக தருகிறீர்கள்! வாழ்த்துக்கள்!
நன்றிகள் பல.......

சென்ஷி said...

கலக்கல்... நானும் சில நேரம் சிந்திச்சிருக்கேன்... வேலை செய்யறது மனுசனா மெசினான்னு நா(ன்)ங்க கண்டு பிடிக்க மேலே இருக்கற வார்த்தையை கீழ டைப் செய்யுன்னு இருக்கும். நாம மனுசந்தானேன்னு நெனைச்சிட்டு டைப்பிச்சிட்டு வருவேன்.. அதுல இம்புட்டு விசயம் இருக்கறத தெரிஞ்சுக்கிட்டதுக்கு நன்னி...

(facebookல ரி காப்ச்சா அடிக்கடி உபயோகப்படுத்தி இருக்கேன்)

ஜோதிஜி said...

நன்றிகள்.......

கிரி said...

சுவாராசியமா இருக்கு.

ஒரு சில தளங்களில் இதற்க்கு பதிலாக 1+3= என்று கேட்டு இருப்பார்கள்.. இது நீங்கள் கூறி இருக்கும் முறையை விட எளிதாக உடைக்க முடியுமா!

எனக்கு இதைப்போல இருப்பது எளிதாக உள்ளது.

முத்துலெட்சுமி/muthuletchumi said...

சுவாரசியம்ங்க :) நன்றி.

சுடுதண்ணி said...

மிக்க மகிழ்ச்சி சைவகொத்துப்பரோட்டா :)

ஊக்கத்துக்கு நன்றி மோகன் :)

மிக்க மகிழ்ச்சி சென்ஷி. தொடர்ந்து வாங்க ;)

மிக்க நன்றிகள் ஜோதிஜி :)

வருகைக்கு நன்றி கிரி. OCR மூலம் கிரகித்துக் கொள்ளுமளவுக்கு எழுத்துக்களோ அல்லது எண்களோ எதுவாக இருந்தாலும் உடைப்பது எளிது. அதுவும் கூட்டல், கழித்தல், பெருக்கல் கணக்குகள் மிக எளிது. உங்கள் வருகையும், கருத்தும் மிக்க மகிழ்ச்சியளிக்கிறத். தொடர்ந்து வாங்க.

ரொம்ப மகிழ்ச்சி முத்துலெட்சுமி :)

யவனராணி said...

captcha பற்றி விரிவான தகவலுக்கு நன்றிங்க சுடுதண்ணி சார்...!

ஜெ.ஜெயமார்த்தாண்டன் said...

மீண்டும் ஒரு நல்ல பதிவு. வாழ்த்துக்கள். நல்ல தமிழில் எழுத நீங்கள் எடுத்துக்கொள்ளூம் முயற்சி குறித்து மகிழ்ச்சி.

கண்மணி/kanmani said...

அம்மாடி இவ்வளவு இருக்கா?
அருமையான தகவல் அழகான தமிழில்.நன்றி.

Menaga Sathia said...

கலக்கல்...

வினையூக்கி said...

அட்டகாசம் இவ்வளவுத் தகவல்களே நன்றி சுடுதண்ணி, நீங்க சுடுதண்ணி இல்லை. செட்டிநாட்டு முழு மதிய உணவு

puduvaisiva said...

வணக்கம் சுடுதண்ணி அண்ணே
இப்போதுதான் பழைய நாலு பதிவையும் படித்தேன் அனைத்தும் புதிய புதிய செய்திகள் காலதாமதத்திற்கு மன்னிக்கவும்.

சில நேரங்களில் இந்த reCAPTCHA எழுத்துகளை பார்த்தால் தலைசுத்தும்.

reCAPTCHA தமிழில் அமைத்தால் இப்படி இருக்குமா?

1. எட்டுகால் பூச்சிக்கு எத்தனை ------- கால் ?
2.பூனை ------ குடிக்கும்
3.டெல்லிக்கு அதிக தந்தி அடித்த முதல்வர் ------
4. மானாட மயிலாட நிகழ்ச்சியில் எத்தனை ஜட்ச் ------------
5. மொக்கை படத்தை முதலிடம் தரும் டி.வி ---------

:-)))

சுடுதண்ணி said...

நன்றி யவனராணி :). தொடர்ந்து வாங்க.

உங்கள் ஊக்கத்துக்கு மிக்க நன்றி ஜெயமார்த்த்தாண்டன் :).

நன்றி கண்மணி :)

மிக்க நன்றி மேனகாசத்யா. தொடர்ந்து வாங்க :).

வருகைக்கும் ஊக்கத்துக்கும் மிக்க நன்றி வினையூக்கி. மகிழ்ச்சி :)

மிக்க நன்றி சிவா தம்பி. தமிழ் reCaptchaக்கள் அருமை. குறிப்பாக 3ம், 5ம் :)))))