Thursday, March 25, 2010

மனிதம் தேடும் இணையம் : CAPTCHA - 2 (முற்றும்)


இணையதள வடிவமைப்பாளர்களுக்கும், அதை உடைக்கும் SPAM தொழிலதிபர்களுக்கும் நடந்த சுமோ யுத்தத்தில் நசுங்கிச் சின்னபின்னமானது அப்பாவி பயனாளர்கள் தான். உச்சகட்டத்தில் பயனாளர்கள் வர்க்கத்தை மொத்தமாக மறந்து விட்டு, போட்டியில் மூழ்கிப் போன விளைவு தான் கீழ்காணும் CAPTCHAக்கள். பார்த்து மகிழவும். ரொம்பவும் பொழுதுபோகாமல் இருக்கும் அன்பர்கள் விடைகளைப் பின்னூட்டத்தில் உள்ளிட்டு, பெருமிதப்பட்டுக்கொள்ள வரவேற்கப்படுகிறார்கள்.



காலப்போக்கில் வடிவமைப்பாளர்களுக்கு CAPTHCAக்களின் தேவை ஆயிரம், லட்சம் என்று அதிகமானது. ஒரு CAPTCHA மீண்டும் காட்சிப்படுத்தப்படுவதற்கு நீண்ட கால இடைவெளித் தேவைப்பட்டதே காரணம். ஏனெனில் ஒவ்வொரு நூறாவது முறையும் ஒரே CAPTCHA க்கள் மீண்டும் தோன்ற ஆரம்பித்தால் நிரல்களை வைத்து நூற்றுக்கு ஒன்று, என்ற கணக்கில் நிரல்கள் எழுதி வெளுக்கப்படும். இதனால் CAPTCHAக்களை வடிவமைத்துத் தரும் நிறுவனங்கள் பெருகின, அவற்றுள் கட்டணச்சேவை மற்றும் இலவசச் சேவை இரண்டும் அடக்கம். இதில் பிரச்சினை என்றால் மூன்றாம் நபரின் CATPCHAக்களைப் பயன்படுத்தும் போது குக்கீஸ்கள் மூலம் உங்கள் வருகையாளர்களின் நடவடிக்கைகள் குறித்துத் தெரிந்து கொள்ள வாய்ப்பிருப்பது(third party cookies) உபரித் தகவல். எனவே கண்ட கண்ட CAPTCHAக்களைப் பயன்படுத்தும் தளங்களுக்குச் செல்லும் போது முன்னெச்சரிக்கைக்காக ஒருமுறை பின்பக்கம் திரும்பிப் பார்த்துக் கொள்வது பரிந்துரைக்கப்படுகிறது.


இது ஒருபுறம் நடந்து கொண்டிருக்க, இப்பிரச்சினையை வித்தியாசமான கோணத்தில் அணுகியவர்கள், reCAPTCHA என்ற திட்டத்தை முன்மொழிந்தார்கள். அதாவது CAPTCHAக்களை உடைக்கப் பயன்படுத்தும் OCR தொழில்நுட்பத்தைக் கொண்டு தான் ஆவணங்களைக் கணினிமயப்படுத்துவது வழக்கம். அவ்வாறு செய்யும் போது நூற்றுக்கு நூறு சரியான வார்த்தைகள் அடையாளம் காணப்படுவதில்லை. அவ்வாறு OCR அடையாளம் காணமுடியாமல் சிரமப்படும் வார்த்தைகளை சரி பார்த்துத் திருத்துவதென்பது நேரத்தை விழுங்கும் வேலை.ஒரு வார்த்தையை OCR அடையாளம் காணமுடியாவிட்டால் அதுவே ஒரு சிறந்த CAPTCHAவிற்கான அடையாளம். எனவே அந்த வார்த்தைகளை CAPTCHAக்களாக மாற்றி இணையத்தில் உலாவ விட்டு, மக்கள் மூலம் சரியான வார்த்தைகளைத் திரும்பப் பெறும் சாமர்த்தியத் திட்டம் தான் reCAPTCHA. சுருங்கச் சொன்னால் 'ஊர்ச்செலவுல ஊறுகாய் சாப்பிடறது'.

reCAPTCHA திட்டம் கார்னெகி மெலன் பல்கலைக் கழகத்தால் புத்தகங்களைக் கணினிமயமாக்க செயல்பாட்டுக் கொண்டுவரப்பட்டது. இணையதள வடிவமைப்பாளர்களுக்கும் தங்கள் தளத்திற்கான CAPTCHAக்களுக்கு ஒரு நல்ல வழங்கி கிடைத்த மகிழ்ச்சி. எங்கெல்லாம் இலவசமோ அங்கெல்லாம் CAPTCHA அவசியம். இணையத்தின் இலவசச் சக்கரவர்த்தி கூகுளுக்கு CAPTCHAக்களின் தேவை மிகமிக அதிகம். விளைவு reCAPTHCA திட்டம் கூகுளுக்குக் கைமாறியது. twitter மற்றும் facebook ஆகியவை reCAPTCHA பயன்படுத்தும் தளங்களில் முக்கியமானவை.

reCAPTCHA எப்படி செயல்படுகிறது?. ஒரு புதிர் சரியா, தவறா என்று கணிப்பதற்கு, உங்களுக்கு விடை தெரிந்திருக்க வேண்டும். ஆனால் reCAPTCHA என்பது விடைதெரியா புதிர்களுக்கு மக்களிடம் விடையைப் பெறும் முறை. அதில் எவ்வாறு விடைகளைச் சரியா, தவறா என்று கணிக்கிறார்கள்?. எப்போதும் reCAPTCHAக்கள் இரண்டு வார்த்தைகளோடு தான் காட்சிக்கு வைக்கப்படும். அவற்றில் ஒன்று விடை தெரிந்த வார்த்தை மற்றது reCAPTCHA வார்த்தையாக இருக்கும். பயனாளர் அவற்றுக்கான விடையை உள்ளிடும் போது ஒன்று சரியாக இருந்தால் மற்றொன்றும் சரியாகத் தான் இருக்கும் என்ற நம்பிக்கையின் அடிப்படையில் பயனாளரின் விடை சேமிக்கப்படும். அதோடு விட்டுவிடாமல் அதே reCAPTCHA பல்வேறு ஜோடி வார்த்தைகளுடன் பல பயனளார்கள் மூலம் விடைகள் பெறப்பட்டு அதிகபட்சமாக பெறப்பட்ட விடையே சரியானத் தீர்வாக எடுத்துக்கொள்ளப்படுகிறது.

இப்பொழுது கூகுள் reCAPTCHA மூலம் ஆதிகால நியூயார்க் டைம்ஸ் இதழ்களைக் கணினிமயப்படுத்திக் கொண்டிருக்கிறது. ஒரு நாளைக்குச் சுமாராக 30 மில்லியன் வார்த்தைகள் reCAPTCHA மூலம் சரிப்படுத்தப்பட்டுக்கொண்டிருக்கிறது. தங்களுத்தெரிந்தோ, தெரியாமலோ இணைய உலகம் அதற்கு உழைத்துக் கொண்டிருக்கிறது. 'பாதுகாப்புக்கு பாதுகாப்பாச்சு, வேலையும் முடிஞ்சு போச்சு' என்று ஒரே கல்லில் இரண்டு மாங்காய் அடிக்கப்படுவது சுவராஸ்யம்.

இணையத்தில் எங்கேனும் CAPTCHAக்கள் பக்கம் செல்லுகையில் இரட்டை வார்த்தைகளைக் கண்டதும் reCAPTCHA உங்களுக்கு நினைவுக்கு வருவதற்கு இத்தொடர் காரணியாக இருந்தால் மிக்க மகிழ்ச்சியடையப்படும் என்று தெரிவித்துக் கொண்டு சுடுதண்ணி விடைபெற்றுக்கொள்கிறது :).




14 comments:

சைவகொத்துப்பரோட்டா said...

//இரட்டை வார்த்தைகளைக் கண்டதும் reCAPTCHA உங்களுக்கு நினைவுக்கு வருவதற்கு இத்தொடர் காரணியாக இருந்தால் மிக்க மகிழ்ச்சியடையப்படும்//

நிச்சயம் இந்த தொடர் நினைவில் வரும், நன்றி.

Mohan said...

சான்சே இல்லை... உங்களுக்கு நிகர் நீங்கள்தான்.... பயனுள்ள தகவல்களை
சுவாரசியமாக தருகிறீர்கள்! வாழ்த்துக்கள்!
நன்றிகள் பல.......

சென்ஷி said...

கலக்கல்... நானும் சில நேரம் சிந்திச்சிருக்கேன்... வேலை செய்யறது மனுசனா மெசினான்னு நா(ன்)ங்க கண்டு பிடிக்க மேலே இருக்கற வார்த்தையை கீழ டைப் செய்யுன்னு இருக்கும். நாம மனுசந்தானேன்னு நெனைச்சிட்டு டைப்பிச்சிட்டு வருவேன்.. அதுல இம்புட்டு விசயம் இருக்கறத தெரிஞ்சுக்கிட்டதுக்கு நன்னி...

(facebookல ரி காப்ச்சா அடிக்கடி உபயோகப்படுத்தி இருக்கேன்)

ஜோதிஜி said...

நன்றிகள்.......

கிரி said...

சுவாராசியமா இருக்கு.

ஒரு சில தளங்களில் இதற்க்கு பதிலாக 1+3= என்று கேட்டு இருப்பார்கள்.. இது நீங்கள் கூறி இருக்கும் முறையை விட எளிதாக உடைக்க முடியுமா!

எனக்கு இதைப்போல இருப்பது எளிதாக உள்ளது.

முத்துலெட்சுமி/muthuletchumi said...

சுவாரசியம்ங்க :) நன்றி.

சுடுதண்ணி said...

மிக்க மகிழ்ச்சி சைவகொத்துப்பரோட்டா :)

ஊக்கத்துக்கு நன்றி மோகன் :)

மிக்க மகிழ்ச்சி சென்ஷி. தொடர்ந்து வாங்க ;)

மிக்க நன்றிகள் ஜோதிஜி :)

வருகைக்கு நன்றி கிரி. OCR மூலம் கிரகித்துக் கொள்ளுமளவுக்கு எழுத்துக்களோ அல்லது எண்களோ எதுவாக இருந்தாலும் உடைப்பது எளிது. அதுவும் கூட்டல், கழித்தல், பெருக்கல் கணக்குகள் மிக எளிது. உங்கள் வருகையும், கருத்தும் மிக்க மகிழ்ச்சியளிக்கிறத். தொடர்ந்து வாங்க.

ரொம்ப மகிழ்ச்சி முத்துலெட்சுமி :)

யவனராணி said...

captcha பற்றி விரிவான தகவலுக்கு நன்றிங்க சுடுதண்ணி சார்...!

ஜெ.ஜெயமார்த்தாண்டன் said...

மீண்டும் ஒரு நல்ல பதிவு. வாழ்த்துக்கள். நல்ல தமிழில் எழுத நீங்கள் எடுத்துக்கொள்ளூம் முயற்சி குறித்து மகிழ்ச்சி.

கண்மணி/kanmani said...

அம்மாடி இவ்வளவு இருக்கா?
அருமையான தகவல் அழகான தமிழில்.நன்றி.

Mrs.Menagasathia said...

கலக்கல்...

வினையூக்கி said...

அட்டகாசம் இவ்வளவுத் தகவல்களே நன்றி சுடுதண்ணி, நீங்க சுடுதண்ணி இல்லை. செட்டிநாட்டு முழு மதிய உணவு

♠புதுவை சிவா♠ said...

வணக்கம் சுடுதண்ணி அண்ணே
இப்போதுதான் பழைய நாலு பதிவையும் படித்தேன் அனைத்தும் புதிய புதிய செய்திகள் காலதாமதத்திற்கு மன்னிக்கவும்.

சில நேரங்களில் இந்த reCAPTCHA எழுத்துகளை பார்த்தால் தலைசுத்தும்.

reCAPTCHA தமிழில் அமைத்தால் இப்படி இருக்குமா?

1. எட்டுகால் பூச்சிக்கு எத்தனை ------- கால் ?
2.பூனை ------ குடிக்கும்
3.டெல்லிக்கு அதிக தந்தி அடித்த முதல்வர் ------
4. மானாட மயிலாட நிகழ்ச்சியில் எத்தனை ஜட்ச் ------------
5. மொக்கை படத்தை முதலிடம் தரும் டி.வி ---------

:-)))

சுடுதண்ணி said...

நன்றி யவனராணி :). தொடர்ந்து வாங்க.

உங்கள் ஊக்கத்துக்கு மிக்க நன்றி ஜெயமார்த்த்தாண்டன் :).

நன்றி கண்மணி :)

மிக்க நன்றி மேனகாசத்யா. தொடர்ந்து வாங்க :).

வருகைக்கும் ஊக்கத்துக்கும் மிக்க நன்றி வினையூக்கி. மகிழ்ச்சி :)

மிக்க நன்றி சிவா தம்பி. தமிழ் reCaptchaக்கள் அருமை. குறிப்பாக 3ம், 5ம் :)))))