Thursday, March 11, 2010

மனிதம் தேடும் இணையம் : CAPTCHA - 1

கரகாட்டக்காரன் திரைப்படத்தில் செந்தில், சரளா ஜோடியைப் பார்த்து சிவாஜி, பத்மினி என்று காசு கொடுத்து சொல்லவைப்பது போல் ஒரு காட்சி வரும். கவுண்டமணியிடம் மாட்டிக்கொண்டு, 'உனக்கேண்டா இந்த வேலை' என்று கேட்டதும் செந்தில் சொல்லும் பதில் 'ஒரு வெளம்பரம்ம்ம்'. இணையத்தின் வளர்ச்சியில் மிகுந்த சவாலுக்குள்ளான விஷயங்கள் இரண்டு. ஒன்று பாதுகாப்பு மற்றொன்று விளம்பரத்தொல்லைகளைச் சமாளிப்பது.

SPAM என்ற பதப்படுத்தப்பட்ட இறைச்சியை இரண்டாம் உலகப்போருக்குப் பின் அமெரிக்கவிலும், ஐரோப்பாவிலும் திகட்டத்திகட்ட சந்தைப்படுத்தியதின் மனரீதியான பாதிப்பே, பின்னாளில் அளவுக்கு மீறித் தொல்லைதரும் விளம்பரங்களையோ அல்லது தகவல்களையோ இணையத்தில் கண்டால் SPAM என்று அலறி ஓடக் காரணமாகி, பின்னர் அதுவே பெயராகவும் ஆகிப்போனது. இதைப்போல் சரித்திரத்தில் பெயர் பெற விரும்பும் அன்பர்கள் சொந்தமாக ஒரு தொலைக்காட்சி நிறுவனத்தை வாங்கி, இலவச இணைப்பாக ஒரு திரைப்படத்தையும் வாங்கி, அதன் விளம்பரத்தைப் போட்டு மக்களைக் கதற விடலாம். அர்ப்பணிப்புடன் 10 அல்லது 15 வருடங்கள் இதனைச் செய்தால் எண்ணம் ஈடேர சாத்தியமுண்டு :). இன்றைய தேதியில் SPAM என்பதைத் தமிழ்ப்படுத்தச் சொன்னால் 'சன் பிக்சர்ஸ்' அல்லது 'கலாநிதி மாறன்' நல்ல தேர்வு :D.

SPAM செய்பவர்களுக்குத் தங்கள் எழுத்துக்களை மின்னஞ்சல்கள், ப்ளாக்கர், வேர்ட்ப்ரஸ் பதிவுகள் மற்றும் எங்கெல்லாம் இலவசமாக கல்லா கட்ட முடியுமோ அங்கெல்லாம் சரமாரியாக கிளைகளைப் பரப்பிக் கடைபரப்புவதே தொழில் தர்மம். ஒரு கட்டத்தில் இவர்கள் பயனாளர் கணக்குகளை தானியங்கி நிரல்கள் மூலம் (bots) குவிக்க ஆரம்பித்ததும் இணைய நிறுவனங்கள் திணறிப்போயின. தொழில்நுட்ப வளர்ச்சிக்கு மூலமே நிம்மதியாக உட்கார விடாமல் செய்யும் :) சவால்கள் தான், சவால்களைச் சந்திக்கும் ஒருவர் உளரேல் அவர் பொருட்டு எல்லார்க்கும் பெய்யும் தீர்வு :D. பல்லாயிரக்கணக்கான உண்மைப் பயனாளிகளின் கூட்ட நெருக்கடியில் கலந்து கரைந்து விடும் இவர்களைத் தடுப்பதற்காக என்ன செய்யலாம் என்று பல தரப்புகளில் ஆய்வுகள் நடந்த போது, இஸ்ரேலைச் சேர்ந்த மொனி நோர் என்பவர் இணையத்தளங்கள் தங்கள் வருகையாளர் ஒரு மனிதனா அல்லது தானியங்கி நிரலா என்பதை அறிவதற்கான வழிமுறைகளையும், சாத்தியக்கூறுகளையும் ஆய்வுக்குறிப்பாக வெளியிட்டார்.

கிருஷ்ணா பரத்

செய்திகளை முந்தித்தருவதில் தினத்தந்தி போல், இணையத்தில் புதுமைகளை முந்தி தருவதுடன், இலவசமாகவும் தந்து நம் நெஞ்சில் நீங்கா இடம்பெற்றிருக்கும் கூகுள் நிறுவனத்தில் ஒரு குழு அமைக்கப்பட்டு 1997ம் ஆண்டு முதல் முறையாக CAPTCHA (Completely Automated PublicTuring test to tell Computers and Humans Apart) அறிமுகப்படுத்தப்பட்டது. அக்குழுவில் பலபேர் இருந்தாலும் சென்னை ஐ.ஐ.டியில் படித்த கிருஷ்ணா பரத்தும் (கூகுள் செய்திகள் பிரிவினைக் கொண்டு வந்தவர்) ஒருவர் என்பதை இங்கு விளக்குப் போட்டுக் காண்பிப்பதில் சுடுதண்ணி பெருமிதம் கொள்கிறது. இதனைப் படித்தவுடன் கைதட்டி, விசிலடித்து ஆட்டோகிராப் வாங்க விரும்பும் அன்பர்கள் பெங்களூர் கூகுள் அலுவலகத்தின் தலைவர் அறைக்கதவைத் தட்டவும் :).

பல தளங்களில் புதிய கணக்குத் திறக்கும் போதோ அல்லது உங்கள் பயனாளர் கணக்கினுள் நுழையும் போதோ, நம்மை கணினித்திரையில் முகத்தைத் தேய வைக்குமளவுக்கு உற்றுப் பார்க்க வைக்கும் காரணி CAPTCHA. சிலரின் சேட்டைகளுக்காக இன்று உலகமே குஷ்டப்படுகிறது என்றாலும், எல்லாம் பயனளார்களின் நன்மை கருதியே என்பதால் கசப்பாக இருந்தாலும் மருந்தாக நினைத்து இணைய உலகம் CAPTCHAவை சகித்துக்கொள்ளப் பழகிவிட்டது. CAPTCHA என்பது பால்வாடிப் புத்தகங்களில் இருக்கும் படம் பார்த்து கதை சொல்லும் முறைதான். படங்கள் எழுத்துக்களாகவோ, காட்சிகளாகவோ, புதிர்களாகவோ இருக்கும். தங்களின் தொழில் முடங்கிப்போவதைப் பொறுக்காத SPAM தொழிலதிபர்கள் படங்களில் இருக்கும் எழுத்துக்களைக் கிரகிக்கும் OCR (optical character recognition) தொழில்நுட்பத்தைப் பங்காளியாகச் சேர்த்துக் கொண்டு CAPTCHAக்களை உடைக்க ஆரம்பித்ததின் விளைவுகள் தான் நமது கண்களைச் சுழுக்கெடுத்து, கடுப்பேற்றி சமயத்தில் இணையப்பக்கங்களையே மூடி விட்டுப் போகுமளவுக்கு வளைந்து, நெளிந்து காட்சி தரும் CAPTCHAக்கள்.



இருதரப்பினருக்கும் போட்டி முத்திப் போனதின் விளைவே மேலே காணும் CAPTHCAக்கள். இப்போட்டியில் மனிதர்களேத் தடுமாறிப்போகும் அளவுக்கு எழுத்துக்கள் நெளிந்து போனது, OCR எம்மாத்திரம். OCR தொழில்நுட்பம் சறுக்க ஆரம்பித்ததின் காரணமாக நூற்றுக்கணக்கான தொழிலாளர்களை வைத்து CAPTCHAக்களை உள்ளிட்டு பயனளார் கணக்கை ஒப்பந்த அடிப்படையில் உருவாக்கித் தரும் நிறுவனங்கள் பல முளைத்தன. இணையம் அதன் போக்கில் உருவாக்கித் தரும் தொழில் வாய்ப்புகள் மிக சுவராசியமானவை, அவற்றுள் இதுவும் ஒன்று.

CAPTCHA உள்ளிட்டுத் தரும் நிறுவனங்களின் விளம்பரங்கள்

நாள் ஒன்றுக்கு சராசரியாக 200 மில்லியன் CAPTHCAக்கள் மக்களால் இணையத்தில் உள்ளிடப்படுகின்றன. ஒரு CAPTCHA சில நொடிகள் எடுத்துக் கொண்டாலும் பல லட்சம் மணி நேரம் தினந்தோறும் CAPTCHA க்களால் மனிதர்களிடமிருந்து சுரண்டப்படுகிறது. நேரம் கிடைத்தால் சரக்கடிக்கவோ, சினிமாவுக்கோ அல்லது தொலைக்காட்சியில் மூழ்கிப்போகவோ வசதியில்லாத கூட்டம் ஒன்று CAPTCHAக்களால் வீணாகிப் போகும் பல லட்சம் மணி நேர மனித உழைப்பை எப்படி பயனுள்ளதாக மாற்றுவது என்று யோசிக்கத் தொடங்கியது. அதன் விளைவுகள் மற்றும் சில சுவாரஸ்யமான CAPTCHAக்கள் ஆகியவைப் பற்றி அடுத்த பகுதியில்.


9 comments:

சைவகொத்துப்பரோட்டா said...

இடையே வந்த "திருக்குறளும்", கட்டுரையும் சுவராசியமாய் இருக்கிறது.

கண்மணி/kanmani said...

வெய்ட்டிங்....அடுத்த பகுதிக்கு

சுடுதண்ணி said...

தொடர்ந்த ஊக்கத்திற்கு மிக்க நன்றி சைவகொத்துப்பரோட்டா :)

சுடுதண்ணி said...

விரைவில் :). @ கண்மணி

ஜோதிஜி said...

இன்னும் ரெண்டு ஓட்டு குத்த முடியுமான்னு யோசித்து விட்டு வெளியேறுகின்றேன்.

முத்துலெட்சுமி/muthuletchumi said...

ஜோதிஜி said...
இன்னும் ரெண்டு ஓட்டு குத்த முடியுமான்னு யோசித்து விட்டு வெளியேறுகின்றேன்.

//

:)))

சுடுதண்ணி said...

:))) மிக்க நன்றி ஜோதிஜி, முத்துலெட்சுமி. மகிழ்ச்சி :)

guru said...

//இன்றைய தேதியில் SPAM என்பதைத் தமிழ்ப்படுத்தச் சொன்னால் 'சன் பிக்சர்ஸ்' அல்லது 'கலாநிதி மாறன்' நல்ல தேர்வு//

spamஐ பற்றி, தெளிவாக புரிந்து கொள்ள கூடிய அளவுக்கு, நல்ல விளக்கம்..

சுடுதண்ணி said...

ஊக்கத்துக்கு மிக்க நன்றி குரு :)