பிரத்யேக

தகவல் விஞ்ஞானம் – ஒரு அறிமுகம்

டேடா விஞ்ஞானிகள் இல்லையேல் மனித முன்னேற்றமே நின்றுவிடும்!”

“எங்கு தேடினாலும், எத்தனைச் சம்பளம் கொடுத்தாலும் கிடைக்காத டேடா விஞ்ஞானிகள்”

  • இப்படி, இரண்டு ஆண்டுகளுக்கு முன்பு, ஏகத்துக்கு ஊதி வாசிக்கப்பட்ட டேடா விஞ்ஞானிகள் எங்கே?
  • இன்று, இந்தத் தேவை என்னவாயிற்று?
  • டேடா விஞ்ஞானம் என்றால் என்ன?
  • கணினி விஞ்ஞானம் படிப்போர் இத்துறையில் இறங்கலாமா?
  • அப்படி இறங்க முடிவு செய்தால், எப்படித் தேறுவது?

ஊதி வாசிப்புத் தொழில்நுட்பங்கள்

 

data_science_1முதலிலேயே சொல்லி விடுகிறேன். ஊதி வாசிப்பு எதுவும் இக்கட்டுரைகளில் இடம் பெறாது.  இதுபோன்ற கேள்விகளுக்கு பதில் சொல்வதற்கு முன், தரவு விஞ்ஞானத்தின் பின்னணியைச் சற்று சுருக்கமாகப் பார்ப்போம்.

கடந்த ஐந்து ஆண்டுகளாக, கணினி மென்பொருள் துறையில், பயங்கர பில்டப் கொடுக்கப்பட்ட ஒரு விஷயம், ஏராளமான தரவை (தரவுகள்) கையாளும் முறைகள். திடீரென்று தரவுகள்/தகவல்கள் எப்படி ஏராளமானது? மனித நடவடிக்கைகள் தொடங்கிய நாள் முதல் தரவு, மற்றும் அதைக் கையாளும் முறைகள் இருந்து வந்துள்ளது.  ஒரு கல்யாணத்தில் ஒரு நோட்டுப் புத்தகத்தில் மொய்ப் பணக் கணக்கு எழுதும் பொழுது தரவுவைப் பதிவு செய்கிறோம்.

  • மொய் எழுதியவரின் பெயர்
  • மொய்ப் பணம் எத்தனை
  • சில சமயங்களில் மொய்ப் பணத்தில் வகைப்பாடு (denomination) – அதாவது, ஐநூறு, நூறு, ஐம்பது, பத்து ரூபாய் நோட்டுக்கள் எத்தனை
  • அன்பளிப்பு அட்டைகள் – இவற்றை நாம் பணத்தோடு கலக்காமல், தனியாக எழுதி விடுவோம்

இவை எல்லாம் தரவுகள். மொய் தேதியை மாறினால் மட்டுமே எழுதுவோம். கல்யாண வீட்டில் தெரிய வேண்டிய தகவல், இன்ன நாளில் இத்தனை பணமும், இத்தனை பணத்திற்கு அன்பளிப்பு அட்டைகளும் மணமக்களுக்கு வந்தன என்ற இறுதிக் கணக்கு.

அதே கல்யாண வீட்டில், அன்பளிப்புப் பொருட்களின் கணக்கு சற்று மாறுபடும்.

  • அன்பளிப்பு கொடுத்தவரின் பெயர்
  • பொருளின் பெயர்

இந்தத் தரவிலிருந்து தெரிய வேண்டிய முக்கிய தகவல், பொருள் வாரியாக எத்தனை மணமக்களுக்கு அன்பளிப்பாக வந்து சேர்ந்தது என்பது. உதாரணத்திற்கு, 7 குக்கர், 17 தட்டுக்கள் போன்ற விவரங்கள்.

வீட்டிற்கு மளிகைப் பொருட்களின் பட்டியலும் தரவைக் கொண்டே உருவாகிறது.  மளிகைப் பொருட்களின் பட்டியல் ஒரு வினோதமான பட்டியல் – இதில் மனிதர்களுக்கே உரிய, பல உள்ளர்த்தங்கள் உண்டு.

  • கத்திரிக்காய் ¾
  • தீக்குச்சி 3
  • நல்லெண்ணை 250
  • அரிசி 10

இது தரவு என்றாலும், துல்லியமற்ற தரவு. வாராவாரம் மளிகை வாங்கி வரும் கணவருக்கு இந்தப் பட்டியல் போதும் – ஆனால் ஒரு எந்திரத்திற்குப் போதாது. கத்திரிக்காய் மற்றும் அரிசி கிலோ கணக்கு (இந்தியாவில்), தீக்குச்சி பெட்டிக் கணக்கில், நல்லெண்ணை மில்லி கணக்கில். பட்டியல் எழுதுவது அலுப்பான விஷயம். இதனால், பல உள்ளர்த்தங்களோடு சுருக்கி விடுவது மனித இயல்பு. இதை இங்கே சொல்லக் காரணம் உள்ளது. தரவுகளில், எந்திரத் தரம் இல்லாததற்கு, அதன் அலுப்பூட்டும் தன்மையே முக்கிய காரணம். நாம் அலசப் போகும் தரவு விஞ்ஞானத்திம் மிக முக்கிய சவால் இதுவே.

காகிதத்தில் இருந்த தரவு கடந்த 65 ஆண்டுகளாக டிஜிட்டல் உருவத்தில் கணினிகளுக்கு மாறியது. முக்கியமாக, பல நூறு ஆண்டு காகிதப் பழக்கங்களும் அத்துடன் கூடவே வந்தன.

ஆரம்பத்தில் கணினிகளுக்குள் தரவைக் கொண்டு செல்வது ஒரு ஆமை வேக விஷயமாக இருந்தது – பெரும்பாலும் விசைப்பலகை (keyboard) மூலம் தரவு கைப்பட உருவாக்கப்பட்டது. இதனால், காகிதத் தரவை விட அதிகத் தரவு உருவாக்கப்பட்டாலும், கணினிகளால் சமாளிக்கக் கூடிய அளவிலேயே இருந்தது. இன்றைய மடிக்கணினியின் வன்தட்டு (hard disk), 1990 –ல் ஒரு பெரிய நிறுவனத்தின் தரவு அளவிற்கு கையாளும் திறமை படைத்தது என்றால் பாருங்களேன். உதாரணத்திற்கு, ஒரு பெரிய நிறுவனத்தின் தரவு மையத்தில் 1990 –களில் எத்தனைத் தரவுகள் இருக்க முடியும்?

 

தரவு வகை ஒரு பதிவுக்கான தேவை (record size) வருடாந்திரப் பதிவுகள் (#records) வருடாந்திரத் தேவை (storage needs)
விற்பனை (sales) 2,000 பைட்டுகள் 400,000 800 மெகாபைட்டுகள்
வாங்கல் (purchasing) 1,000 பைட்டுகள் 100,000 100 மெகாபைட்டுகள்
தயாரிப்பு (manufacturing) 2,000 பைட்டுகள் 300,000 600 மெகாபைட்டுகள்
மனித வளம் (human resources) 2,000 பைட்டுகள் 25,000 50 மெகாபைட்டுகள்
துணைப் பதிவுகள் (masters, indices) 4,000 பைட்டுகள் 50,000 200 மெகாபைட்டுகள்
மொத்தத் தேவை 1,750 மெகாபைட்டுகள் அல்லது 1.7 கிகாபைட்டுகள்

 

இன்றைய திறன்பேசியில் 2 ஜிபி மெமரி என்பது சர்வ சாதாரணம்.  எப்படி 1990 –களில் ஒரு பெரிய நிறுவனத்தை நடத்தவே 2 ஜிபி –க்குள் முடிந்தது?

  1. முதலில், வியாபாரக் கணினியில், திரவை விசைப்பலகை மூலமாக மட்டுமே உருவாக்கினார்கள்
  2. விசைப்பலகை மூலம் தேவையான தரவை மட்டுமே உருவாக்கினார்கள். இன்றைய வாட்ஸ் ஆப் போல ஒரு செய்தி பல கோடி முறை முன்னனுப்பப்படவில்லை
  3. தொட்டதற்கெல்லாம், வருடல் அல்லது ஸ்கேன் முறைகள் கிடையாது
  4. பட்டைக் குறியீடு (bar codes) முறைகள் 1990 –களில் பிரபலம் அடையவில்லை
  5. பொருட்கள், அவற்றின் குறியீடு மூலம் மட்டுமே அடையாளம் காணப்பட்டன. இன்று, குறியீடு மற்றும் வண்ணப் படங்கள் மூலம் அடையாளம் காட்டுகிறோம்

விசைப்பலகை மூலம் உருவாக்கப்படும் தரவிற்கு ’ஏழைத் தரவு’ ( textual data என்ற ஆங்கிலச் சொற்களுக்கான அடியேனின் தமிழ் முன்வைப்பு! ஏழைத் தரவிற்கு பயனும் அதிகம், தேக்கத் தேவைகளும் (storage requirements) குறைவு) என்றும் மற்ற வகைத் தரவிற்கு ’பணக்காரத் தரவு’ (படங்கள், பாட்டுக்கள், விடியோக்கள், வரைபடங்கள் – இவை பணக்காரத் தரவுகள் – rich data, பயனிருந்தாலும், ஏராளமான தேக்கத் தேவை இவற்றிற்கு உண்டு) என்றும் அழைப்பது கணினித் தொழிலில் வழக்கம் ☺

கணினிகளால் சமாளிக்கப்படும் தரவு, 15 ஆண்டுகளுக்கு முன், ஒரு விஞ்ஞான, அரசாங்க அல்லது வியாபார அமைப்புகளில் பணிபுரிவோர் மட்டுமே உருவாக்கும் விஷயமாக இருந்தது. கடந்த 15 ஆண்டு காலமாக இந்த நிலைமை வெகு வேகமாக மாறத் தொடங்கியது. நுகர்வோர் இணைய வசதிகளால், இருக்கும் தரவைப்  பயன்படுத்துவதோடு, புதிய தரவையும் உருவாக்கத் தொடங்கினார்கள்.

  1. முதலில், Mouse  மூலம், தரவுத் தேர்வுகள், பல வியாரப் பயன்பாடுகளிலும் வரத் தொடங்கியன. ஆரம்பத்தில், தவறான தரவுகளை நுகர்வோர் அபத்தமாகக் கணினிக்கு அனுப்புவதைத் தடுக்கவே இம்முறை அறிமுகப்படுத்தப்பட்டது. உதாரணத்திற்கு, ஊர் என்ற இடத்தில் ‘கூடுவாஞ்சேரி’ என்று சொல்லி, மாநிலம் என்ற இடத்தில் ‘பஞ்சாப்’ என்று கணிக்குள் உள் அனுப்புவது விசைப்பலகையில் எளிது. Mouse மூலம், ‘கூடுவாஞ்சேரி’ என்று சொன்னவுடன், அடுத்த மாநிலம் என்னுமிடத்தில், ‘கூடுவாஞ்சேரி’ என்ற ஊர் பெயருள்ள மாநிலங்கள் மட்டுமே நுகர்வோருக்கு முன் வைக்கப்படும். நாளடைவில், எல்லா படிவங்களிலும் இப்படிப்பட்ட வசதிகள் தேவையாக மாறி, பல புதிய தரவுகள் தேக்கப்பட்டன
  2. விசைப்பலகை மற்றும் Mouse ஐத் தாண்டித், திரைத்தடவல் முறைகள் வந்த பிறகு, இந்தத் தரவுத் தேக்க வேகம் அதிகரிக்கத் தொடங்கியது
  3. வருடிகளின் விலை குறைந்தவுடன், பல வியாபாரங்கள் முக்கிய ஆவணங்களை, தங்களுடைய பதிவுகளுடன் தேக்கத் தொடங்கின. இவற்றின் தேக்கத் தேவை கைப்பட உருவாக்கிய தரவைக் கட்டிலும் பல மடங்கு அதிகம்
  4. மின்னஞ்சல் என்பது ஒரு வியாபார ஆயுதமாக மாறத் தொடங்கியது. பதிவுகள் மின்னஞ்சலுடன் ஒரு சுட்டியாக அனுப்பும் திறன் உருவாக்கப்பட்டது. மின்னஞ்சல் வழங்கிகளின் தேக்கத் தேவைகளும் அதிகரிக்கத் தொடங்கின. இவற்றால் உருவாக்கப்பட்ட தரவுகளும் ஏராளமாயின

சமூக வலையமைப்பு மென்பொருள் தளங்கள் பொதுவாக மிகவும் பிரபலமடைந்ததன் விளைவு, இந்த தரவு அதிகரிப்பு என்பது ஒரு வாதம். சமூக வலையமைப்புத் தளங்களை வியாபாரத்தில் இல்லாதவர்களும் பயன்படுத்துகிறார்கள். இவற்றில், பல கருவிகளிலிருந்து ( கணினி, வில்லைக் கணினி, திறன்பேசிகள், இணையக் கருவிகள்) என்று பல முறைகளிலும், சாதாரண சொற்கள், சத்தங்கள், பாடல்கள், படங்கள், விடியோக்கள் என்று பல பணக்காரத் தரவுகளை மட்டும் உருவாக்குவதில்லை. அவற்றை முன்நோக்கியும் அனுப்புகிறோம்.

பொதுவாக, எல்லாத் துறைகளும் கணினிகளைப் பயன்படுத்தத் தொடங்கிவிட்டதால், இவ்வகைத் தரவு அதிகரிப்பு என்பது இன்னொரு வாதம். உதாரணத்திற்கு, நொடிக்கு 40,000 தேடல் ஆணைகளை இன்று கூகிள் கையாளுகிறது. பொதுமக்கள் அதிகம் கவலைப்படாத விஞ்ஞான ஆராய்ச்சி உலகம், இன்று ஏராளமான தரவுவைக் கையாள்வதை முக்கியமான ஒரு தேவையாக மையப்படுத்தி முன்னேறி வருகிறது. என்றும் இல்லாத அளவிற்கு, திறன்பேசிகள், விஞ்ஞானக் கருவிகள், வருடிகள், வியாபாரங்கள், உடல்நல அமைப்புகள், ஊடகங்கள் என்று பலவகை அருவிகள் தரவைக் குவித்த வண்ணம் உள்ளன. மனித சமூகம் தோன்றியது முதல் 1990 –வரை உருவாக்கிய தரவைக் காட்டிலும், இரு மடங்கு 1990-களில் மட்டுமே மனித நடவடிக்கைகள் உருவாக்கியன. அதாவது பத்தாண்டுகளில், இரு மடங்கான தரவு, இன்று 5 ஆண்டுகளில் இரு மடங்கு என்று மாறி, கூடிய விரைவில் இரண்டு ஆண்டுகளில் இரு மடங்காகும் வாய்ப்புள்ளது.

வழக்கமான, கணினித் துறைப் பாட்டுத்தானே இது, இதிலென்ன புதுசு என்று தோன்றலாம். திடீரென்று உருவாகிய தரவு சுனாமியை எப்படிச் சமாளிப்பது என்பதுதான் கேள்வி. இந்தப் பிரச்னையைக் கையாள்வதில் நிபுணர்கள் ’டேடா விஞ்ஞானிகள்’. உடனே பத்து நாள் தாடியுடன், சோதனைக் குழாயில் நீல நிற திரவத்துடன் இவர்கள் நடமாடுபவர்கள் என்று மட்டும் நினைக்க வேண்டாம். நம்மைப் போல, வழக்கமாக தினமும் சவரம் செய்து கொண்டு, ஜீன்ஸ் அணிந்த ஆசாமிகள் இவர்கள். சுருக்கமாகச் சொல்லப் போனால், இவர்களின் பங்களிப்பு , ’மலையைக் (மலைத்தொடரை என்பதே சரி) கெல்லி எலியைப் பிடிப்பது’. அதாவது, ஏராளமான தரவிலிருந்து, ஒரு வியாபாரத்திற்கோ, அல்லது விஞ்ஞான ஆராய்ச்சிக்கோ பயனுள்ள விஷயத்தைக் கண்டெடுப்பது.

அவ்வளவு எளிதான விஷயமல்ல இது. பல கோடானு கோடி தரவிலிருந்து பயனுள்ள முடிவுகளை எடுக்க உதவுவது ஒரு மாபெரும் முயற்சி. ஓரளவு குறைந்த தரவுடன் பல்லாண்டுகளாக இத்தகைய முயற்சிகளை, கணினி மென்பொருள் பொறியாளர்கள் செய்து வந்திருந்தாலும், மிக அதிகமான தரவு என்றவுடன் பழைய முறைகள் பயனற்றுப் போய் விடுகின்றன. கேட்ட கேள்விக்கு பதில் வருவதற்குள் நமக்கெல்லாம் வயசாகிவிடும்!  அத்துடன், இவ்வகை முயற்சிகள் தனி மனித முயற்சிகள் அல்ல. டேடா விஞ்ஞானிகள் ஒரு மிகப் பெரிய அமைப்பின் ஒரு முக்கிய பங்காளிகள். இவர்கள் பயனுள்ள ஆய்வுகளைச் செய்ய பலருடைய ஒத்துழைப்பு தேவை.

தரவு விஞ்ஞானத் துறை தரவை உணவு போல பார்க்கிறது. உதாரணத்திற்கு, நமக்கு பெரும்பாலும் சூடான உணவே பிடிக்கிறது. சில சமயம் சூடற்ற சாண்ட்விச் நமக்கு ஓகே. அவ்வப்பொழுது ஐஸ்க்ரீம் ஓகே. இன்றைய தரவு உலகம்  இப்படித்தான் தரவு ஆய்வுத் தேவைகளை அணுகுகிறது. உணவு மற்றும் தரவுத் தேவைகளுக்கும் உள்ள வித்தியாசம் என்னவென்றால், சூடான உணவை நாம் அதிகம் நாடுகிறோம். சூடான தரவை தரவு உலகம் இதுவரை ஒதுக்கி வந்துள்ளது!

உருவாகியவுடன் அந்த தரவில் என்ன பயனுள்ளது? அதிலிருந்து ஒரு நிறுவனமோ, ஆராய்ச்சியோ, அரசாங்கமோ என்ன பயன் பெறலாம் என்ற நோக்கத்துடன் செய்யப்படும் தரவு ஆய்விற்கு, சூடான தரவு சயின்ஸ் என்கிறார்கள். தரவு உருவாகி ஒரு வாரத்தில்/மாதத்தில் அந்த தரவுவில் என்ன பயனுள்ளது? அதிலிருந்து ஒரு நிறுவனமோ, ஆராய்ச்சியோ, அரசாங்கமோ என்ன பயன் பெறலாம் என்ற நோக்கத்துடன் செய்யப்படும் தரவு ஆய்விற்கு, இதமான தரவு சயின்ஸ் என்கிறார்கள். உருவாகி ஒரு/பல வருடம் கழித்து அந்த தரவில் என்ன பயனுள்ளது? அதிலிருந்து ஒரு நிறுவனமோ, ஆராய்ச்சியோ, அரசாங்கமோ என்ன பயன் பெறலாம் என்ற நோக்கத்துடன் செய்யப்படும் தரவு ஆய்விற்கு, குளிரான தரவு சயின்ஸ் என்கிறார்கள்.

 

data_science_3சற்று கூர்ந்து கவனித்தால், உலகெங்கும் ஏராளமான தரவு உருவாகினாலும், சூடான தரவு என்பது ஒரு தரவு மூலத்திலிருந்து அளவான தரவாக இருக்கும். ஒரு ரசீது தருவதற்கும், ஆர்டரை பூர்த்தி செய்வதற்கும், ஒரு ஆய்வில் சில நோக்கப்பதிவுடன் இந்த தரவு ஒதுக்கப் படுகிறது. இதில் விதிவிலக்கு, ராட்சச விஞ்ஞான சோதனைகள் – இவ்வகை சோதனைகள் (LHC போன்ற சோதனைகள் நொடிக்கு பல கோடி தரவுகளை உருவாக்குகின்றன), நொடியில் தரவு சுனாமி என்பது சர்வ சாதாரணம்.

சேமிக்கப்பட்ட தரவு வார/மாதம் ஒரு முறை அலசப்படுவது சென்ற 50 ஆண்டுகளாக கணினிகளால் நிகழும் ஒரு விஷயம். சில நிறுவனங்களில், ஒரு மாத தரவு என்பது தலை சுற்றும் அளவிற்கு வளர்ந்து விடுகிறது. பெரும்பாலும், விற்பனை, மனித வளம் போன்ற துறைகளில் இவ்வகை தரவிற்கு மதிப்பு அதிகம். இவ்வகை இதமான தரவுவைக் கொண்டு பல்வேறு இயக்க மேலாண்மை முடிவுகள் மேற்கொள்ளப்- படுகின்றன. இவ்வகைத் தரவு வரவு முன்பைவிட அதிகமாகி விட்டாலும்,இன்றைய கணினிகளால் தாக்கு பிடிக்கும் அளவிலேயே இருக்கின்றது. உதாரணத்திற்கு, எந்த ஊர்களில், எந்தப் பகுதிகளில் சென்ற மாதம் ஒரு வகை டீத்தூள் அதிகமாக அல்லது மோசமாக விற்பனையாகிற்று, போன்ற கேள்விகளுக்கு, இதமான தரவு கொண்டு பதில் சொல்லலாம்.

ஒரு/சில வருடத் தரவில் மிக அதிகமான புரிதல்கள் மறைந்து கிடக்கின்றன என்பது தரவு விஞ்ஞானிகளின் நெடுநாளைய நம்பிக்கை. பெரும்பாலும் நிறுவனங்கள், வருடாந்திர விற்பனை, வரவு செலவை கணக்கிட்ட பிறகு, அந்தத் தரவை அதிகம் திரும்பிப் பார்ப்பதில்லை. அடுத்த வருட, குறிக்கோளை எட்டுவதற்கே நேரம் இருப்பதில்லை. ஆனால், இந்தக் குளிர் தரவிலிருந்து ஒரு நிறுவனம், எப்படிச் செயல்பட்டால், முன்னேறலாம் என்பது பற்றிய முக்கிய படிப்பினைகள் மறைந்து கிடக்கின்றன என்கிறார்கள் தரவு விஞ்ஞானிகள். இன்று நாம், டிவியில் அன்றைய நாளின் அதிக வெப்பம் மற்றும் குளிர்நிலை என்னவென்று பார்க்கிறோம். அத்துடன் சராசரி வெப்பம் என்னவென்றும் பார்க்கிறோம். இந்தச் சராசரி வெப்பம் என்பது ஒரு 50 ஆண்டு காலமாக, அந்த மாதத்தில், அந்த நாளில் எத்தனை வெப்பம்  இருந்தது என்பதே. இந்தச் சராசரி என்பது நமக்கு ஒரு அளவுகோலாக அமைகிறது.  அன்றைய வெப்பம் சராசரி வெப்பத்தை விட அதிகமா அல்லது குறைவா என்பது உண்மையான நிலையை எடுத்துரைக்கிறது. இதுபோலவே, வியாபாரம், அரசாங்கம், புள்ளியியல் போன்ற துறைகளில் இப்படிப்பட்ட பழைய குளிர் தரவு விஞ்ஞானம், பல விஷயங்களை எடுத்துரைப்பதோடு, முக்கியப் பாதையயும் எடுத்துக் காட்ட வல்லது. பல நிறுவனங்கள் மொத்த விற்பனை அளவு சரியில்லை என்று பல பொருட்களை சொற்ப நேரத்தில் துறக்கத் தயங்குவதில்லை. உதாரணத்திற்கு, இவ்வகைக் குளிர் தரவு விஞ்ஞானம், சில அதிகம் விற்காத பொருட்கள், சில ஊர்களில் அதிகமாக சில மாதங்களில் வருடா வருடம் விற்பதை எடுத்துக் காட்டி, அந்த பொருட்களைத் தயாரிப்பதை நிறுத்தாமல், சில மாதங்களில் மட்டுமே தயாரிக்கும் ஒரு உத்தியை இந்த நிறுவனத்திற்கு முன் வைக்கலாம். இது போன்ற பல பருவப் பொருட்கள் தயாரிக்கும் நிறுவனங்கள் காப்பாற்றப்படக் கூட வாய்ப்பு உண்டு என்கிறார்கள் டேடா விஞ்ஞானிகள்.

 

data_science_2ஆனால், குளிர் தரவு விஞ்ஞானத்தில் உள்ள ஒரு பெரிய சவால், பல்லாண்டுகளுக்கான தரவு மலை போல இருப்பதுதான். குவிந்து கிடக்கும் இந்த ’மலைத் தொடர்ச்சியை’, பயனுள்ள ஒரு கருவியாக மாற்றுவது ஒரு விண்வெளி ராக்கெட்டை மேலே வெற்றிகரமாக அனுப்புவதற்குச் சமமானது.   இந்த ’மலைத் தொடர்ச்சி’ சொல் பிரயோகத்திற்கு ஒரு காரணம் உண்டு – சில ஆண்டுகளின் தரவு பெரிய மலை, சில ஆண்டுகளின் தரவு சின்ன மலை, சில ஆண்டுகளின் தரவு மரமற்ற மலை, இன்னும் சில ஆண்டுகளின் தரவு வெறும் பாறையான மலை என்று இருப்பதோடு அல்லாமல், நடுவிலே மலையே இல்லாமல் இருப்பதும் தரவு விஞ்ஞானத்தில் சாதாரணம். பழைய  தரவுவிற்கு இதுவரை அத்தனை மதிப்பும் மரியாதையும் இல்லை.  இந்த மலைத் தொடர்ச்சி சமாச்சாரம், இன்றைய தரவு விஞ்ஞானத்தைப் பற்றிய மிகப் பெரிய ஊதிவாசித்தலுக்கு வழிவகுத்துள்ளது. சற்று விவரமாக, எப்படி இந்த மலைத் தொடர்ச்சியை மனிதர்கள் உருவாக்குகிறார்கள் என்று பார்ப்போம். ஒரு சராசரி சில்லரை வியாபாரச் சங்கிலியை உதாரணமாகக் கொள்வோம்.

நேரம் வியாபார மையம் வியாபாரத் தரவு
2010 மே மாதம் மையம் 8 த.நா. 4:15 தமிழ்நாட்டிற்கு சுருக்கம். மாலை 4:15
2010 மே மாதம் மையம் 15 தநா, 17:30 தமிழ்நாட்டிற்கு சுருக்கம். மாலை 5:30
2011 ஜூன் மையம் 8 TN, 4:15 தமிழ்நாட்டிற்கு ஆங்கிலச் சுருக்கம். மாலை 4:15
2011 ஜூன் மையம் 15 TN, 17:30 தமிழ்நாட்டிற்கு ஆங்கிலச் சுருக்கம். மாலை 5:30,
2013 ஜூன் மையம் 8 TN, 16:15 தமிழ்நாட்டிற்கு ஆங்கிலச் சுருக்கம். மாலை 4:15. 24 மணி நேர அளவீடு
2013 ஜூன் மையம் 15 TN, 17:30 தமிழ்நாட்டிற்கு ஆங்கிலச் சுருக்கம். மாலை 5:30. 24 மணி நேர அளவீடு

 

வெறும் இரண்டு தரவுகளில் இரு மையங்களிலிருந்து 3 வருடங்களில் உள்ள தரவு மாற்றங்களை இந்தப் பட்டியலில் நீங்கள் பார்க்கலாம். இது போல, பல லட்சம் தரவுகளில், மனிதர்கள் உருவாக்கும் தரவுகளை ஒன்றாக சேர்த்துப் பார்த்தால், பெரிய மலையளவோடு இந்த பிரச்னை முடியாது, ஒரு மலைத் தொடர்ச்சிபோலவே  தோற்றமளிக்கும். தரவுகள் பயன்பட வேண்டுமென்றால், தரவில் தரம் இருக்க வேண்டும், அத்துடன் ஒரு நியமத்திற்கு உட்பட்டும் இருக்க வேண்டும்.

டேடா விஞ்ஞானிகளை எவ்வகை நிறுவனங்கள் நாடுகின்றன? இவை பெரும்பாலும் ஏராளமான தரவுடன் உழலும், ஆனால், அதிக பயன் பெறாத அமைப்புகள்.

  1. அரசாங்க அமைப்புகள் – டிஜிட்டல் முறையில் ஏராளமான படிவங்களைப் பயனற்று சேர்க்கும் அரசாங்கங்கள் உலகம் முழுவதும் உள்ளன. வீட்டுப் பத்திரம் முதல், ரேஷன் கார்டு வரை, அரசாங்கங்கள் தரவு உளையில் உழலும் வினோதப் பிராணிகள்
  2. வங்கிகள் – ஒவ்வொரு நிதி நடவடிக்கையும் இன்று டிஜிட்டல் முறைகளில் கையாளப்படுகின்றன. ’சொல்வனத்தில்’ எதிர்காலமற்ற பணமா அல்லது பணமற்ற எதிர்காலமா என்று கட்டுரை ஒன்றை 2011 –ல் எழுதினேன். இன்று, பணம் அல்லது செல்வம் என்பது வங்கிகளில் உள்ள பாதுகாப்பான தரவு – அவ்வளவுதான். அதைத் தாண்டி இந்த டிஜிட்டல் சுரங்கத்தை அதிகம் பயன்படுத்தாத வங்கிகள் ஏராளம்
  3. நுகர்வோர் பொருள் நிறுவனங்கள் – கோடிக் கணக்கில் தினமும் வியாபாரம் செய்யும் சோப்பு, ஷாம்பூ, உணவுப் பொருட்கள், மது, காலணிகள், போன்ற விஷயங்களை வியாபாரம் செய்யும் நிறுவனங்கள். இவர்கள் ஏராளமான தரவுடன் பல்லாண்டுகளாகப் போராடும் அமைப்புகள். அடிப்படைச் செயல்பாட்டிற்கே ஏராளமான தரவுகளை நம்பியிருக்கும் நிறுவனங்கள் இவை
  4. திறன்பேசி நிறுவனங்கள் – மாதம் ஒன்றுக்கு 50 லட்சம் புதுத் தொடர்புகளை இந்தியாவில் மட்டுமே உருவாக்கும் திறன்பேசி நிறுவனங்களிடம் , ஏராளமான தொடர்புத் தரவுகள் பயனற்றுக் கிடக்கின்றன
  5. மருந்து நிறுவனங்கள் – மனித ஜீனோம் ப்ராஜெக்ட் 1999 –ல் முடிந்ததிலிருந்து, மருந்துக் நிறுவனங்கள்  மருந்து ஆராய்ச்சியில் மரபணு ஆராய்ச்சியின் ஏராளமான தரவுகளைக் கையாள்வது நிபுணத்துவம் தேவையுள்ள ஒரு துறையாக மாறி விட்டது
  6. காப்பீடு நிறுவனங்கள் – உலக மக்களின் பொருளாதார நிலை உயர உயர, அவர்களது போக்குவரத்து, மருத்துவ, மற்றும் சொத்து காப்பீட்டுத் தேவைகள் ஏராளமாக அதிகரித்து வந்துள்ளன. காப்பீடு நிறுவனங்கள், உலகெங்கும் அதிகம் முன்னேறாமல், அடிப்படைப் படிவங்களை கொண்டு காலம் தள்ளுகின்றன
  7. சில்லறை வியாபாரங்கள் – உலகின் மிகப் பெரிய நிறுவனம் சில்லறை வியாபாரத்தில் ஈடுபட்டுள்ள வால்மார்ட். உலகம் முழுவதும், சில்லறை வியாபாரச் சங்கிலி நிறுவனங்கள் ஒவ்வொரு நாளும் நடக்கும் பல கோடி வியாபார நடவடிக்கைகளைப் பதிவு செய்வதோடு நின்றுவிடுகின்றன
  8. விஞ்ஞான அமைப்புகள் – பல விஞ்ஞான ஆராய்ச்சிகள் ஏராளமான தரவுகளைக் கையாள்வதை முக்கியத் தேவையாக பார்க்கத் தொடங்கிவிட்டன. LHC பற்றி ‘விஞ்ஞான கணினி’ என்ற கட்டுரையில் எழுதியிருந்தேன். புதிய அணு நுண் துகளைக் கண்டு பிடிப்பது ஏராளமான தரவிற்குள் தேடும் முயற்சி என்று மேம்போக்காகச் சொல்லலாம் (இந்த விஞ்ஞான முறைகள் சோப்பு, ஷாம்பூ தரவில் தேடுவதைப் போன்றன அல்ல). வானவியல் ஆராய்ச்சி இன்று ஏராளமான தரவை கையாள்வதை மையப்படுத்தி வருகிறது.

மேலே சொன்ன அமைப்புகள் ஒரு பெரும் பட்டியலின் சின்ன பகுதி. இது போல, பல கோடி அமைப்புகள் உலகெங்கும் தரவை சேகரிக்கும் முயற்சியில் ஈடுபட்டுள்ளன. ஆனால், ஒரு ரசீது வழங்குவதோ, அல்லது ஒரு பில் வழங்குவதோடு நின்று விடுகின்றன. வாடிக்கையாளர்கள், நுகர்வோர், மக்கள் பற்றிய பல முக்கிய தகவல்கள் இந்த தரவுகளில் எங்கோ புதைந்து கிடக்கின்றன. இந்தப் புதையலில், ஒரு வியாபாரத்தின் முன்னேற்றம், அல்லது திட்டத்தின்/ ஆராய்ச்சியின் அடுத்த கட்டத்திற்கு வழி வகுக்கும் சக்தி உள்ளது. புதையலை வெளிக் கொண்டுவர டேடா விஞ்ஞானிகளின் பங்கு முக்கியமானது.

அடுத்த பகுதியில், இவர்களின் வேலையின் முக்கிய அங்கங்களை அலசுவோம். இடையில் இந்தக் காணொளியைச் சிறிது பாருங்கள்.

சொல்வனம் – அக்டோபர் 2016

தகவல் விஞ்ஞானம் – கற்றுக் கொள்ள மற்றும் பயிற்சி வாய்ப்புகள் : பகுதி 3

கல்லூரியில் படித்து முடித்தவுடன் டேடா விஞ்ஞானி என்பது நடக்காத விஷயம் என்பது முதல் இரண்டு கட்டுரைகளில் புரிந்திருக்கும். சரி, எப்படி டேடா விஞ்ஞானியாவது? இத்துறை இன்னும் சில ஆண்டுகளில் வசீகரம் இழந்து விடுமா? கணினிகளின் முன்னேற்றம், இந்தத் துறையை தேவையற்ற ஒன்றாக்கி விடுமா? இது போன்ற கேள்விகளுக்கு இந்தப் பகுதியில் பதில் தர முயல்கிறேன்.

முதலாவது, என்.ஐ.ஐ.டி., ஆப்டெக் போன்ற நிரலர்களை உருவாக்கும் அமைப்புகளிலிருந்து தரவு விஞ்ஞானம் கற்க சாத்தியமில்லை. இதற்கென்று சில பிரத்தியேகக் கல்வி அமைப்புகள் இந்தியாவில் உள்ளன: http://analyticsindiamag.com/top-analytics-training-institutes-india-ranking-2014/

என்னுடைய பார்வையில், அடிப்படையில் தரவு விஞ்ஞானம் பயில விழைபவர்கள் சில முக்கியமான விஷயங்களை தங்களுடைய இளங்கலை மற்றும் முதுகலைப் பயிற்சியில் அவசியம் படிக்க வேண்டும்;

1. கணினி விஞ்ஞானம் மற்றும் மென்பொருள் பொறியியல்

2. புள்ளியியல்

3. தரவுதளங்கள் மற்றும் சீக்வல் (SQL) அல்லது தரவு மேலாண்மை

4. முடிந்தால், ஹதூப், மேகக் கணிமை, பற்றிய புரிதல்

5. முக்கியமாக, வியாபார ஆய்வுப் பயிற்சி

இரண்டாவது, மேலே சொன்ன அனைத்தையும் கரைத்துக் குடித்தாலும் உடனே டேடா விஞ்ஞானியாகி விட முடியாது. இது ஒரு கடுமையான பயணம் – முதலில் பிற விஞ்ஞானிகளின் கீழ் வேலை செய்து, பல ஆண்டுகள் இந்தத் துறையைப் புரிந்து கொள்ளுதல் அவசியம்.

மூன்றாவதாக, மாறிக் கொண்டே வரும் இத்துறையில் தன்னை புதுப்பிக்கும் திறன் படைத்தவர்களே வெற்றி பெறுவார்கள். ஏராளமாகப் படித்து முனைவர் பட்டம் பெற்று விட்டேன் என்ற கதை அதிக நாட்களுக்கு உதவாது. நேற்று பல்கலைக்கழகத்தில் படித்தவர்கள், உங்களை விட அதிகம் தெரிந்திருக்கும் வாய்ப்பு இந்தத் துறையில் என்றும் உள்ள அபாயம்.

 

data-sciences-3-pic-1

இந்தத் துறையில் ஆரம்பிப்பவர்களுக்கு இரண்டு வகை சவால்கள் இருக்கும். இதில் முதல் வகை, புள்ளியியல் துறையில் முனைவர் பட்டம் பெற்று இத்துறையைத் தேர்ந்தெடுப்பவர்கள். இவர்கள், ஆரம்ப கட்டங்களில், ஒரு டேடா விஞ்ஞானியின் கீழ் வேலை செய்யும் பொழுது இவர்களுக்கு நேரும் நெருக்கடிகள் சில:

* ஏராளமாகப் புள்ளியியல் படித்துவிட்டு, வியாபாரங்களில், அடிப்படை தரவுப் போராட்டங்கள் எளிதில் போரடிக்கத் தொடங்கிவிடும்

* கணினி மென்பொருள் துறைக்கே உரியப் பல குழப்பமான சொற்றொடர்கள் இவர்களுடைய தன்னம்பிக்கையையே உலுக்கும் தன்மை படைத்தவை

* பெரும்பாலும் புள்ளியியலில் முனைவர் பட்டம் பெற்றவர்கள் அதிகம் வியாபாரம் பற்றிய புரிதல் இன்றி தானுண்டு, தன் தரவு உண்டு என்றிருப்பார்கள். இவர்கள் வியாபாரச் செயல் முறைகள், வழக்கங்கள், மற்றும் நிதி பற்றிய புரிதலுக்குத் தடுமாறுவது இயற்கையான ஒன்று. ஆனால், தரவில் வீரச் செயல்கள் ஓரளவிற்கு மேல் பயன்பட வேண்டுமானால், வியாபாரம் பற்றிய புரிதல் அவசியம்

இரண்டாம் வகை, முதுகலையில் கணினி விஞ்ஞானம் மற்றும் வியாபார ஆய்வு படித்தவர்களின் ஆரம்ப நெருக்கடிகள்:

* வியாபார ஆய்வு மற்றும் கணினி விஞ்ஞானம் கற்கையில், தரவு என்பது பற்றிய மேலோட்டமான புரிதல் மட்டுமே இருக்கும். அதன் முக்கியத்துவம் ஒரு தரவை தேக்கும் அமைப்பில் சேர்ந்த பிறகே

புரியும். இந்தப் புதுப் புரிதல், சில மாதங்களில் அலுப்பு தட்டும் வாய்ப்பு, நிறைய உள்ளது. முதல் வகையினரைப் போல தரவுப் போராட்டங்கள் அலுக்கத் தொடங்கி விடும்

* ஆரம்ப நாட்களில், பல நுகர்வோருடன் சேர்ந்து ஒரு புதிய ஸிஸ்டமை உருவாக்கத் துடிக்கும் இவர்களுக்கு ஏமாற்றமே மிஞ்சும். ஏனென்றால், படிப்பிருந்தாலும், பல வருட வியாபார அனுபவம் இல்லாததால், மற்ற வியாபார ஆய்வாளர்கள் கீழே பணி புரிந்து, சில சமயம் ஒரு குமாஸ்தா போல வேலை செய்யவும் தேவைப்படும். அட, என்றைக்கு ஒரு முழு ஸிஸ்டமிற்கு நாம் பொறுப்பேற்பது என்ற ஆதங்கம் இவ்வகையினருக்கு ஆரம்பத்தில், ஒரு ஐந்து ஆண்டுகள் இருப்பது மறுக்க முடியாத உண்மை

* இவ்வகையினரின் ஆரம்ப பத்தாண்டுகளில், தனக்கு அதிகம் புள்ளியியல் தெரியாததும், ஒரு குறையாகப் படலாம்.

 

data-sciences-3-pic-2இரண்டு சாராரும் வித்தியாசமின்றித் தவிப்பது, ஆய்வின் முடிவுகளைத் தெளிவாக மேலாண்மைக்கு அழகாகப் புரியும்படி விளக்கும் பணி. எல்லா பின்னணி விஷயங்களும் எளிதில் படித்து அல்லது பயிற்சியில் பெற்று விடலாம். ஆனால், காட்சியளிப்புத் திறன் என்பது சிலருக்கு எளிதில் அமையும். மற்றவர்களுக்குக் கடைசி வரை போராட்டம்தான்.

இவ்விரண்டு சாராரும் செய்யும் சில ஆரம்ப அசட்டுத்தனங்கள் என் பார்வையில் இவை;

* தரவு சொல்லும் கதையை சரியாக முழுவதும் புரிந்து கொள்ளாமல் மிகவும் டெக்னிகலாக விளக்கத் தொடங்கினால், அனுபவமின்மையை வெளிச்சம் போட்டுக் காட்டிவிடும்

* சிலர் தரவுடன் மிகவும் தன்னை ஒருங்கிணைத்துக் கொண்டு, வியாபாரம் என்னவோ தானே தொடங்கியது போல, தீர்வுகளை முன் வைக்கத் தொடங்கி விடுவார்கள். புத்திசாலி சினிமா டைரக்டர் எப்படி சில கதைப் பகுதிகளை இளையராஜாவின் பின்னணி இசைக்கு விட்டு வைப்பாரோ, அதே போல, டேடா விஞ்ஞானிகளும் தீர்வுகளை மேல்மட்ட மேலாண்மையினரிடம் விட்டு விட வேண்டும்

* தரவு சொல்லும் கதையை மேலாண்மையினருக்கு விளக்குவது ஒரு தனிக்கலை. தரவின் கதைக்கும் டேடா விஞ்ஞானியின் கதைக்கும் மிகப் பெரிய வித்தியாசம் உள்ளது. உதாரணத்திற்கு, தரவின் கதைப்படி, ஒரு 200 கோடி ரூபாய் முதலீடு செய்து சில வியாபார மாற்றங்கள் நிகழ்த்த வேண்டும் என்று வைத்துக் கொள்வோம். இந்த 200 கோடி முதலீடு பயனளிக்குமா என்று நிச்சயம் சொல்ல முடியாது; அப்படியே பயனளித்தாலும், எதிர்பார்த்த லாபத்தையோ, செயல்திறனையோ அளிக்கும் என்பதும் சொல்வதற்கில்லை. டேடா விஞ்ஞானியின் கதையாக இருந்தால், அது, அவரது தோல்வியாக பாவிக்கப்படும். சரியான முறையில் தரவின் கதையை சரியாகச் சொன்னால், மேலாண்மை, இம்முயற்சியில் லாபம் வரும் பொறுப்பை தானே ஏற்றுக் கொள்ளும்.

 

data-sciences-3-pic-3ஆக, நாம் முக்கியமாக இத்துறையைப் பற்றித் தெரிந்து கொள்ள வேண்டிய விஷயங்கள்:

* தரவைப் பற்றிய முழுப் புரிதலுடன் யாரும் பல்கலைக்கழகங்களிலிருந்து வருவதில்லை

* தரவுடன் தரப் போராட்டம் என்பது இந்தத் துறையில் ஒரு அம்சம் – அவ்வளவுதான். அதில் விடாமல் போராடி வெற்று பெறுபவர்களே இத்துறையில் வெற்றி பெற முடியும்

* டேடா விஞ்ஞானியின் வசீகர வாழ்க்கை வெறும் 5% தான். மற்ற 95% தரவு ஆய்வு சார்ந்த வசீகரமற்ற ஒன்று

* தரவு விஞ்ஞானம் பற்றிய பல பயிற்சி அமைப்புகள் இருந்தாலும், உங்களுடைய நிறுவனத்திற்குத் தேவையான பயிற்சியை எந்த ஒரு அமைப்பும் வழங்கப் போவதில்லை

* மாறிக் கொண்டே வரும் மென்பொருள் கருவிகளை, எந்தப் பின்னணியிலிருந்து நீங்கள் வந்தாலும், அறிந்து கொண்டு, உங்களைப் புதுப்பித்துக் கொண்டே இருப்பது அவசியம்

* கடைசியாக, இது ஒரு பல துறைகளின் சங்கமத் துறை. இதனால், இளங்கலை தரவு விஞ்ஞானப் பட்டப் படிப்பு என்றால் ஓட்டம் பிடியுங்கள்

அடுத்து, இத்துறையின் வசீகரம் எதிர்காலத்தில் குறைந்து விடுமா என்ற கேள்விக்கு வருவோம். முதலில், கடந்த இரண்டு ஆண்டு காலமாக அதிகம் ஊதி வாசிக்கப்பட்ட விஷயம் டேடா விஞ்ஞானி என்ற ஒரு பதவி. இந்தப் பதவி, ஒவ்வொரு பெரிய நிறுவனத்திலும், எனக்குத் தெரிந்தவரை 25 ஆண்டுகளாக இருக்கும் ஒரு பதவி – வித்தியாசம் என்னவென்றால், இவர்களை டேடா விஞ்ஞானிகள் என்று முன்பு அழைக்கவில்லை. தரவு ஆய்வாளர் என்று வங்கிகள், அரசாங்கங்கள், காப்பீடு, தொலைத் தொடர்பு நிறுவனங்கள் அழைத்து வந்தன. கடந்த 20 ஆண்டுகளாக, ஏராளமான தரவை நிறுவனங்கள் தேக்கும் வசதி வந்ததால், தரவு ஆய்வாளர்களின் தேவை அதிகரித்து விட்டது. எந்திரக் கற்றலியல் வளர்ந்து வருகையில், டேடா விஞ்ஞானிகள் மிகவும் அவசியமாகி விட்டனர்.

குப்பையில் வைரமும் இருக்கிறது என்பதை, பல நிறுவனங்கள் உணரத் தொடங்கிவிட்டன. உதாரணத்திற்கு, புதிய ஒரு வாடிக்கையாளரை உருவாக்குவது ஒரு நிறுவனத்திற்கு, ஒரு பெரிய செலவு. வியாபாரம் என்றிருந்தால், விற்பனை செலவு என்பது இருக்கத்தானே செய்யும் என்று வாதம் செய்த காலம் மலையேறிவிட்டது. இன்று,, புதிய வாடிக்கையாளர்களைத் தேடிப் பிடிப்பதோடு, மிக முக்கியமான விஷயம், இருக்கும் வாடிக்கையாளரைத் தக்க வைத்துக் கொள்வது. எந்த வாடிக்கையாளர், இதோ, இன்னும் 6 மாதங்களில் வெளியேற இருக்கிறார் என்பது மிக முக்கிய விஷயம். இவர்களைத் தக்க வைத்துக் கொள்ள ஆகும் செலவு, புதிய வாடிக்கையாளரைப் பிடிக்கும் செலவை விடக் குறைவு. எப்படி 6 மாதங்களில் விலகப் போகும் வாடிக்கையாளரைக் கண்டு பிடிப்பது? இங்குதான் டேடா விஞ்ஞானிகள், இருக்கும் தரவைக் கொண்டு, உதவ முடியும்.

கணினி கற்றலியல் வளர்ந்து இன்னும் சில ஆண்டுகளில், டேடா விஞ்ஞானியே தேவையில்லை என்றாகி விடுமா? இரண்டாம் பகுதியில் சொன்னது போல, ஆரம்ப கட்ட தரவுப் போராட்டங்களுக்கே இவ்வகை எந்திரக் கற்றலியல் பயன் தருகிறது. மற்றபடி, ஏராளமான தரவிலிருந்து பயனுள்ள விஷயங்களை வெளிக் கொண்டு வருவது இன்னும் மனிதத் திறமை சார்ந்த விஷயமாகவே உள்ளது. எதிர்காலத்தில், எந்திரக் கற்றலியலின் பங்கு அதிகரித்தாலும், நமது தரவு ஆய்வுத் தேவைகளும் அதிகரித்துக் கொண்டே இருக்கும். ஓரளவிற்கு மனிதர்களால் உருவாக்கப்படாத தரவை ஆய்வு செய்வது எந்திரங்களுக்கு எளிது. எதிர்காலத்தில், நமது தரவின் கணிசமான பகுதி உணர்விகளால் உருவாகும் வாய்ப்பு உள்ளது. உணர்விகள், சரியாக வடிவமைக்கப்பட்டால், தவறின்றி, சீராக தரவை உருவாக்கும் – மனிதர்களைப் போல அவ்வப்பொழுது தவறுகள் செய்யாது. ஆனாலும், மனிதர்கள், இந்த உணர்விகளால் உருவாக்கப்படும் தரவை விதவிதமாக ஆய்வு செய்து முடிவெடுக்க மனிதர்களையே நாடுவார்கள்.

இதனால், இத்துறைக்குப் பல்லாண்டுகள் எதிர்காலம் இருப்பது உண்மை. ஆரம்ப கட்டத்தில் இருக்கும் இத்துறையில் சாதிக்க பல வாய்ப்புகள் இன்றைய இளைஞர்களுக்கு இந்தத் துறை வழங்கும் என்பதில் சந்தேகமில்லை.

சொல்வனம் – அக்டோபர் 2016

தகவல் விஞ்ஞானம் – ஒரு அறிமுகம் – தொழில் தேவைகள் – பகுதி 2

data-scientist

இப்பகுதியில், ஒரு தகவல் விஞ்ஞானியின் தொழில் சார்ந்த தேவைகளைப் புரிந்து கொள்வோம். என்னதான் ஊதி வாசிக்கப்பட்டாலும் தகவல் விஞ்ஞானி என்ற ஒரு வசீகரத் தொழில் பெயர், தரவு என்பதன் முக்கியத்துவத்தை உயர்மட்ட மேலாண்மை வர்க்கத்திற்குத் தெரியப் படுத்திய ஒரு நல்ல செயல் என்றுதான் சொல்ல வேண்டும்.

தகவல் விஞ்ஞானிகள் மலை போல குவிந்திருக்கும் தரவை வைத்துக் கொண்டு என்ன செய்ய முடியும்? இதில் பல விஷயங்கள்/புரிதல்கள் மறைந்திருப்பது ஒரு புறம் இருந்தாலும், தகவல் விஞ்ஞானிகள் என்னமோ மாயாஜாலம் செய்ய வல்லவர்கள் என்று மட்டும் நினைக்க வேண்டாம். இந்தத் துறையிலும் பல நிரூபிக்கப்பட்ட அணுகுமுறைகள் உள்ளன.

சொல்வனத்தில் ’விஞ்ஞான வளர்ச்சியின் வளர்ச்சி’ என்ற கட்டுரைத் தொடரில், விஞ்ஞான முறைகள் பற்றி சில ஆண்டுகள் முன்பு எழுதியிருந்தேன். சில தரவு விஞ்ஞான அணுகுமுறைகள், விஞ்ஞான ஆராய்ச்சி முறைகளை மூலமாகக் கொண்டது.

இம்முறைகளை சில படிகளாகப் பட்டியலிடலாம்;

  • ஒரு புனைக்கொள்கையை (hypothesis) முன் வைக்கலாம். உதாரணத்திற்கு, ஒரு விஞ்ஞான சோதனை, ஏராளமான தரவை உருவாக்கினால், அந்த தரவில் இரண்டு அல்லது மூன்று மாறிகளுக்கு (variables) இடையில் ஒரு உறவு (relationship) உள்ளது என்ற சந்தேகத்தின் பேரில் ஆராய்ச்சியை ஆரம்பிக்கலாம். இது வெறும் ஊகம் தான். தரவு மூலம் சந்தேகத்திற்கு இடமின்றி நிரூபிக்கப்பட வேண்டும். வியாபார உதாரணமாக, சில்லரை வியாபாரத்தில், சில பொருட்களின் விற்பனை, சில பகுதிகளில், சில மாதங்களில் ஏராளமாக விற்கும் என்ற கொள்கையை முன் வைக்கலாம். விஞ்ஞான ஆராய்ச்சியில் விஞ்ஞான அறிவு எவ்வளவு முக்கியமோ, வியாபாரத்தில், வியாபார அறிவு அவ்வளவு முக்கியம் (Information hypothesis)
  • ஒரு வருட தரவை வைத்து, ஏதாவது இவ்வகை உறவுகள் உள்ளனவா என்று முதலில் ஊர்ஜிதப்படுத்திக் கொள்ள வேண்டும். இந்த உறவு நிச்சயமில்லை என்றாலும், ஓரளவு உறவிற்கு சாத்தியம் உண்டு என்று நிச்சயப்படுத்தும் வழி இது. விஞ்ஞான முறைகளில், அருமையான கோட்பாடுகள் இருப்பதால், இந்தப் படி அவ்வளவு கடினமில்லை. வியாபார உலகில், எதுவும் நிச்சயமில்லை. அசட்டுத்தனமான புனைக்கொள்கையை ஆரம்பத்திலேயே தவிர்ப்பதற்கான முக்கிய படி இது (Data filtering and testing)
  • படி 2 –ல் பல சமயம், எதிர்பார்த்த மாறிகளுக்குள்ளான உறவுகள் இல்லையேல், புனைக்கொள்கையை சற்று மாற்றிக் கொள்ள நேரிடும். நம்முடைய சில்லரை வியாபார உதாரணத்தில், LED சர விளக்குகளை எடுத்துக் கொள்வோம். இவை பொதுவாக பண்டிகை நாட்களில் அதிகம் விற்கும் பொருட்கள். ஒரு மாவட்டத்தின் தரவை எடுத்துக் கொண்டு, ஆகஸ்ட் மாத விற்பனையை ஆராய்ந்தால், இதில் அதிகம் LED சர விளக்குகள் விற்காதது தெரிய வருகிறது என்று வைத்துக் கொள்வோம். ஆகஸ்ட் மாதத்தில் அதிக பண்டிகை நாட்கள் இல்லாததால், நம் புனைக் கொள்கைக்கு ஒத்து வராத விஷயம் இது. செப்டம்பர் முதல் டிசம்பர் வரை ஆராய்ந்தால், LED சர விளக்குகள் நாம் எடுத்துக் கொண்ட மாவட்டத்தில் ஓரளவு விற்பனை ஆகிறது என்று தெரிய வருகின்றது என்று வைத்துக் கொள்வோம். புனைக் கொள்கை ஓரளவிற்கு சரிப்பட்டு வருகிறது. ஆனால், நாம் தேர்ந்தெடுத்த மாவட்டத்தில் LED சர விளக்குகளை வாங்கும் வசதி படைத்தவர்கள் அதிகம் இல்லையேல், நாம் வேறு மாவட்டத் தரவை ஆராய வேண்டும். அப்படி ஒரு மாவட்டம் சிக்கினால், அது போன்ற வருவாயுள்ள மற்ற மாவட்டங்களிலும் அப்படியே விற்பனை செப்டம்பர் முதல் டிசம்பர் வரை அதிகமாக இருக்கிறதா என்று ஊர்ஜிதம் செய்து கொள்ள வேண்டும். தேவைப்பட்டால், மீண்டும் படி 2 –ஐ பின்பற்றி, எந்த அளவிற்கு புனைக்கொள்கையை மாற்றினால் விடை கிடைக்கும் என்று சரி பார்க்க வேண்டும். சில சமயம் ஆட்டத்தை படி 1-லிருந்து ஆரம்பிக்கவும் நேரிடும். தகவல் விஞ்ஞானிகள் பல புனைக்கொள்கைகளைத் தேடிய வண்ணம் இருக்க வேண்டும். சில சமயம் புனைக்கொள்கையை மாற்றுவதால், படி 2-ன் தரவையும் மாற்ற நேரிடலாம் (Hypothesis adjustment)
  • ஓரளவு நம்பிக்கையான புனைக்கொள்கையை நிரூபிக்க பல வருட தரவைக் கொண்டு சோதிப்பது வியாபார உலகில் அவசியம். விஞ்ஞான முயற்சிகளில், பல லட்சம் கணினிகளுடன், இந்தப் படி, பல தனிக் குழுக்களால் அலசப்படுகிறது. விஞ்ஞானத்தில், குறைந்த பட்சம் இரண்டு அல்லது மூன்று குழுக்களின் முடிவுகள் ஒத்துப் போக வேண்டும். அத்துடன், துல்லியத் தேவைகள் விஞ்ஞான தரவில் மிகவும் முக்கியம். வியாபார உலகம் சற்று மாறுபட்டது. இங்கு தரவு விஞ்ஞானிகள் வியாபார ரகசியம் கருதி ஒரு நிறுவனத்திற்கு வெளியே போவதில்லை. அத்துடன், விஞ்ஞான உலகம் போல அவ்வளவு துல்லியம் தேவையில்லை. இந்தப் படி, இரு உலகத்திலும் மிகவும் நேரம் மற்றும் மனித சக்தி எடுக்கும் படி (Full Data analysis)
  • நான்காம் படியின் முடிவுகளை சரியாக பொருளாய்தல் (interpretation) தகவல் விஞ்ஞானியின் மிக முக்கியப் பணி. விஞ்ஞான உலகில், சக விஞ்ஞானிகள் எளிதில் பொருளாய்தலைப் புரிந்து கொள்ளும் திறனுடையவர்கள். வியாபார உலகில், மிக ஜாக்கிரதையாக, உயர் மேலாண்மை வர்கத்தினருக்குப் புரியும்படி செய்தல் ஒரு தகவல் விஞ்ஞானியின் கடமை. விஞ்ஞானத்தின் குறிக்கோள், பொருளாய்தலுடன் முடிந்துவிடும். ஆனால், வியாபார உலகில், மிக முக்கியமான ஒரு படி உள்ளது. எளிமையாக்குகிறேன் என்று பல தகவல் விஞ்ஞானிகள், சில முக்கிய தரவு பொருளாய்தலை பித்தலாட்டமாக்கும் அபாயத்தை நடைமுறையில் பார்த்துள்ளேன் (Data interpretation)
  • வியாபார உலகில், பொருளாய்தல் மூலம் வியாபாரப் பரிந்துரை (business recommendation) ஏதாவது செய்ய வேண்டும். இல்லையேல், தகவல் விஞ்ஞானி வீட்டிற்கு அனுப்பப்படுவார். இது மிகவும் நிறுவன அரசியல் சார்ந்த விஷயம். இங்குதான், ஒரு வியாபார அமைப்பில்வேலை செய்யும் தகவல் விஞ்ஞானி சாதுர்யமாக செயல்பட வேண்டும்

 

data-science-process

தரவு விஞ்ஞானப் படிகளைப் பார்த்தோம். ஆனால், இது ஒன்றும் கைப்பட செய்யும் சமாச்சாரம் இல்லை. இத்துறைக்கு பல தொழில்நுட்ப தேவைகள் மற்றும் வல்லுனர்கள் தேவை. முக்கியமாக, இவ்வகைக் கருவிகள் மிகவும் தேவை;

 

கருவி வகை

தரவு விஞ்ஞான படி

விளக்கம்

தரவு திரட்டல் (data extract)

2, 4

தரவு அலசலுக்கு தேவையான வடிவத்தில் தரவு, அதன் மூலத்தில் இருப்பதில்லை.

தரவு அலசல்(data analysis)

2, 3, 4, 5

தரவை பல பட்டியல்கள் மற்றும் அடிப்படை ஆய்வுகள் செய்தே புனைக்கொள்கைக்கு ஒத்துவருமா என்று முடிவு செய்ய முடியும்

தரவு தரமேம்பாடு (data quality)

2, 3, 4, 5

தரவு ,மனிதர்களால் உருவாக்கப்பட்டாலே பிரச்னைதான். மனிதர்கள் பலவிதம், அது போல அவர்கள் உருவாக்கும் தரவிலும் பலவகை பிரச்னைகளும் உருவாகும். ஒருவர் தமிழ்நாட்டிற்கு, தநா என்றும், இன்னொருவர் த.நா. என்றும், வேறொருவர் தநா. என்றும் தரவை உருவாக்குவார்கள். மேலும், சிலர் தேவையில்லையென்றால், தரவே கொடுக்க மாட்டார்கள். இதை எல்லாம் சரிகட்ட தரவுத் தர மேம்பாடு அவசியம்

புள்ளியியல் (statistics)

2,3,4,5

புள்ளியல் மென்பொருட்கள் தரவை சரியாக அடிப்படையில் புரிந்து கொள்ள பல கருவிகளை தருகிறது. உதாரணத்திற்கு, ஒரு விற்பனை தரவில் அதிக மாறுதலில்லாத அளவு (a measure without much variation) சில அலசல்களுக்கு, புனைக்கொள்கைகளுக்கு பயன்படாது. இதை புள்ளியியல் மூலம் எளிதில் சொல்லிவிடலாம்.

எந்திரக்கற்றலியல் (machine learning)

2,4

சில சலிப்பூட்டும் படிகளுக்கு எந்திரக் கற்றலியல் கருவிகள் மிக உதவும்

தரவுஉருவகாக்கம்(data interpretation/ presentation)

5,6

விஞ்ஞான மற்றும் வியாபார உலகில் வடிவியல் மிகவும் அவசியம். இதற்கான கருவிகள் ஏராளம்

விரிவாக இந்தக் கருவிகளைப் பற்றி அலசுவோம்.

தரவுத் திரட்டல் கருவிகள் (data extraction tools)

தரவு விஞ்ஞானத்தில் அடித்தளம் ஆராய்ச்சிக்கேற்ற தரவு. அதென்ன ஆராய்ச்சிக்கேற்ற தரவு? அதாவது முன் வைக்கும் புனைக் கொள்கையை நிரூபிப்பதற்கு சம்பந்தப்பட்ட தரவு தேவை. நம்முடைய LED சர விளக்குகள் உதாரணத்தில், பல மாத/வருட, பல மையங்களின் வியாபார தரவு தேவைஆனால், LED சர விளக்குகள் சார்ந்த தரவாக மட்டுமே இருக்க வேண்டும். தீப்பெட்டி வியாபாரத் தரவில் நமக்கு பயனேதும் இல்லை. தரவுதளங்களில் எல்லா பொருட்களின் விற்பனை தரவும் இருக்கும். அதிலிருந்து நமக்கு வேண்டிய LED சர விளக்குகள் தரவை மட்டும் திரட்ட வேண்டும். அத்துடன், LED சர விளக்குகள் மற்றிய விளக்கமான (descriptive attributes) மாறிகளும் தேவை. இவ்வகைத் திரட்டல் கருவிகள் பல்லாண்டுகளாக மென்பொருள் துறை உருவாக்கி வந்துள்ளது. Microsoft, Oracle, SAS, SAP, Informatica, IBM போன்ற நிறுவனங்கள் தரவு திரட்டல் கருவிகளை பல்லாண்டுகளாய் மெருகேற்றி வந்துள்ளார்கள். SQL போன்ற கணினி மொழியில் வல்லமை தகவல் விஞ்ஞானிக்கு அவசியம். SQL –ஐத் தாண்டி, ஏராளமான தரவுகளைத் திரட்ட, இந்த நிறுவனங்களின் பிரத்யேகக் கருவிகள் தெரிய வேண்டும்.

அடிப்படைக் தரவு அலசல் கருவிகள் (basic data analysis tools)

image03முதல் தேவை, அடிப்படை தரவு கருவிகளில் சரளமாக விளையாடும் திறன். அதாவது Python, R, SAS போன்ற கருவிகளில் கையில் உள்ள தரவை ஆராயும் திறன். இத்துடன், இன்றைய தரவுதளங்களுடன் எளிதாகச் சஞ்சரிக்கத் தேவையான மொழி SQL. இவ்வகைக் கருவிகள், ஒரு தகவல் விஞ்ஞானியின் ஆரம்ப கட்ட ஆராய்ச்சிக்கு அவசியம். தேவையான தரவை தேவையான அம்சங்களோடு ராட்சச தரவுதளங்களிலிருந்து வடிகட்டி, எடுத்து ஆராய்வது தகவல் விஞ்ஞானிகளின் அடிப்படை வேலை. உதாரணத்திற்கு, தேசிய அளவு சில்லறை வியாபாரம் ஒன்றில், கடந்த ஐந்து ஆண்டுகளில், தென் மாநிலங்களில், அதிகமாக நுகர்வோர் வாங்கும் பகுதி எது என்ற கேள்வியை எப்படி அணுகுவது? முதலில், ராட்சச தரவுதளத்திலிருந்து, தென் மாநில சில்லறை மையங்களின் கடைசி ஐந்தாண்டு வியாபாரத் தரவு தேவை. இந்த தரவு கிடைத்த பின்புதான் மற்ற ஆராய்ச்சி செய்து கேள்விக்குப் பதில் அளிக்க முடியும். இதற்கு மேலே சொல்லப்பட்ட கருவிகளில் ஆளுமை தேவை.

அடிப்படை தரவு தரக் கருவிகள் (Basic data quality tools)

image00

ஒரு ரகசியத்தைப் போட்டு உடைப்பதில் எந்தத் தயக்கமும் எனக்கில்லை – தகவல் விஞ்ஞானிகள், வசீகரமான பதில்களைத் தரும் நேரம் வெறும் 5% தான். மற்ற 95% நேரம், அடிப்படை தரவு மற்றும் தரக் கருவிகளுடன் போராடியே வாழ்பவர்கள். மலையைக் கெல்லுவது என்பதைவிட இவர்களைக் குப்பையைக் கிளறி வைரம் தேடுபவர்கள் எனலாம். முன்னே சொன்ன சில்லறை வியாபார தரவை எடுத்துக் கொள்வோம். நுகர்வோர் பல நேரங்களில், பொருட்களை வாங்கிச் சென்றதன் பதிவுதான் தரவு. இதைத் தவிர வாங்கிய நேரம் மற்றும் தேதி போன்ற விஷயங்கள் எளிதாகக் கிடைத்துவிடும். எந்தப் பொருட்கள், எந்தப் பகுதியில் அடுக்கப்பட்டிருக்கும் என்பது மிகவும் சிக்கலான பிரச்னை. முதிர்ந்த சில்லறை வியாபாரங்கள், இன்ன பொருட்கள், இன்னப் பகுதியில் நாட்டின் எந்தப் பகுதியிலும் ஒரே சீராக அடுக்குவார்கள். இவர்களின் அமைப்புகளிலும், சில சின்ன வியாபாரத் தளங்களில், சில பகுதிகள் இருக்காது. சீரற்ற அடுக்கு முறைகள் உள்ள சில்லறை வியாபாரங்களில் இந்தக் கேள்விக்கு பதிலளிப்பது, இயலாத செயல். விற்பனை நடந்த நேரத்தைச் சரியாக பதிவு செய்வதிலும் வேறுபாடுகள் இருக்கும்ஒரு தளம், மாலை ஐந்து மணியை 17:00 என்றும் இன்னொன்று 5:00 என்றும் பதிவு செய்தால், எல்லாவற்றையும் சீராக்க, தரவு தர மென்பொருள் கருவிகள் கொண்டு சரி செய்வது தகவல் விஞ்ஞானியின் வேலை.

இதைப் போல, சில தரவுகளில், எதுவுமே இல்லாமலும் இருக்கும். இதனால்தான் முதல் பகுதியில் மலைத்தொடர் என்ற சொல்லை பயன்படுத்தினேன். இந்த தரவு மலைத் தொடரில், சில குன்றுகள் காணாமலே போகும்; சில இடங்களில், உயரம் குறைவாகவும், சில இடங்களில் அதிகமாகவும் இருக்கும் மலைத் தொடர் போன்ற விஷயம் ஒரு பெரிய தரவு தளத்திலிருந்து தரவை எடுத்து ஆராய்வது. Informatica, Trillium, SAS போன்ற நிறுவனங்களின் கருவிகள் இந்த தரவு சுத்திகரிப்புச் செயலை எளிதாக்குகின்றன; இவற்றில் தகவல் விஞ்ஞானிகளுக்குத் தேர்ச்சி அவசியம்.

அடிப்படை புள்ளியியல் (basic statistics)

image01

தகவல்  விஞ்ஞானியாக வெற்றி பெறப் புள்ளியியல் அறிவு மிகவும் அவசியம். பெரும்பாலும், வெற்றிப் பெற்ற தகவல் விஞ்ஞானிகள் புள்ளியியலில் முனைவர் பட்டம் பெற்றிருப்பவர்களாக இருப்பது, ஒரு தற்செயல் என்றுதான் சொல்ல வேண்டும். புள்ளியியலில் ஓரளவு தேர்ச்சி (முதுகலை அளவு) பெறுதல் அவசியம். ஏனென்றால், தரவுவிலிருந்து கிடைக்கும் பதில்களில் நிச்சயம் (deterministic) என்று எதுவும் கிடையாது, பெரும்பாலும் சாத்தியக்கூறுகள், கொத்தாக்கம் (clustering) மற்றும், ஒட்டுறவுகள் (correlation) அதிகம். சிறிய பயிற்சி தரவைக் கொண்டு, ராட்சச தரவுதளங்களில், தங்களுடைய கோட்பாடுகள் வேலை செய்கிறதா என்று ஆராய்வது தகவல் விஞ்ஞானியின் முக்கிய வேலை. R, SAS, IBM  போன்ற நிறுவனங்களின் மென்பொருள் கருவிகள், புள்ளியியல் நிபுணர்களின் நண்பன்.

எந்திரக் கற்றலியல்

நாம் இதுவரைச் சொன்ன முறைகள் அடித்துப் பிடித்து, ஒரு டெராபைட்டுகள் அளவில் உள்ள தரவுதளங்கள் வரை விஞ்ஞானியே சமாளித்து விடலாம். ஆனால், இன்றைய பெரும் வியாபாரங்கள், ஆராய்ச்சிகள், ராட்சச அளவில் தரவை தேக்கி வைத்துள்ளன. ஆரம்ப ஆராய்ச்சியை ஒரு எந்திரத்திடம் (அதாவது கணினி மென்பொருள்) விடுவதைத் தவிர வேறு வழியில்லை. அத்துடன், இன்றைய மென்பொருள் கருவிகள், பல நூறு கோடி தரவை ஆராய்ந்து சர்வ சாதாரணமாக, அருகாமை தரவு (near neighbors), கொத்து தரவு என்று பிரித்து காட்டும் வல்லமை கொண்டவை. மனித முயற்சியால், பல மாதங்கள் பிடிக்கும் இவ்வகை வேலைகளை, சில மணி நேரங்களில் எந்திரங்கள் செய்து விடுகின்றன. Apache Mahout, GraphLab, Python machine learning libraries, மற்றும் மேகக் கணிமை அமைப்புகள் வழங்கும் கருவிகளும் (Azure, Amazon, Google)  உள்ளன.  தகவல் விஞ்ஞானிக்கு இந்தக் கருவிகளில் ஒன்றிரண்டு தெரிதல் அவசியம்.

தரவு உருவாக்கம்

அழகாக வர்ணிப்பவரை, ‘அட, ஃபிலிம் காட்டுகிறார்’, என்று நாம் சொல்வதுண்டு. தகவல் விஞ்ஞானியும் தன்னுடைய ஆராய்ச்சி முடிவுகளை அழகாக வர்ணித்தல் அவசியம். இன்றைய கணினி மென்பொருள் உலகில் காட்சியளிப்புக்கு எந்தக் குறைவும் இல்லை. ஆனால், காட்சியளிப்பு மிகவும் கவனமாக உருவாக்க வேண்டும். மிக சீரியஸான முடிவுகளை எடுக்க உதவும் இவ்வகைக் காட்சியளிப்புகளில் துல்லியம் அவசியம். அத்துடன், தரவு எதை முன்வைக்கிறது, இதனால், வியாபாரம்/ஆராய்ச்சிக்கு இடர்வுகள் என்ன என்று எல்லாவற்றையும் முன் வைப்பது தகவல் விஞ்ஞானியின் கடமை. முக்கியமாக, வியாபாரம்/ஆராய்ச்சிக்கு முன் உள்ள முடிவுத் தேர்வுகள் என்னென்ன, அவற்றின் நன்மை/தீமைகள் என்னென்ன, லாப/நஷ்டங்கள் என்னென்ன என்று புரியும்படி விளக்குவதும் தகவல் விஞ்ஞானியின் திறன்.

விற்பனை/ஆராய்ச்சி பற்றிய புரிதல்

தரவு உருவாக்கம் என்பது வியாபாரம் அல்லது ஆராய்ச்சி பற்றிய ஆழமான புரிதலைச் சார்ந்தது. ஒரு வியாபாரத்தைப் புரிந்து கொள்ளுவது ஒரு வகைத் திறமை. ஆனால், ஒரு வியாபாரத்தின் தரவைப் புரிந்து கொள்ளுதல் என்பதுமுற்றிலும் வேறுபட்டது. இதற்கு, வியாபாரத்தின் ஏராளமான அன்றாட கணினிப் பயன்பாடு மற்றும் செயல்முறை பற்றிய ஆழமான அறிவு அவசியம். இந்த இரண்டும் ஒரு தகவல் விஞ்ஞானியின் ஆணிவேர். வியாபாரத்தை மட்டும் புரிந்து கொண்டவர் ஒரு வியாபார ஆய்வாளர் (business analyst) ஆகிவிடுவார். தரவை மட்டுமே புரிந்து கொள்பவர் ஒரு தரவு ஆய்வாளர் (data analyst) ஆகிவிடுவார். தகவல் விஞ்ஞானியோ, வியாபாரம், தரவு, செயல் முறைகள் மற்றும் வியாபாரத்தின் தொலைநோக்குத் தேவைகள் அனைத்தையும் புரிந்த ஒருவராக இருக்க வேண்டும். தரவு சொல்லும் கதையைப் புரிந்து கொண்டால் மட்டும் போதாது. அதை, மேலாண்மையினர் புரிந்து கொள்ளும் வகையில் அழகாக விவரிக்கவும் தெரிய வேண்டும்; அதை தரவு கூறும் சாட்சியங்களுடன் முடிவுக்காக, காட்சியளிப்பாக, முன் வைக்கவும் வேண்டும். முக்கியமாக, மேலாண்மையினர், இந்தப் புரிதலினால், லாபமடைந்தால், மேலும் அவர்களது எதிர்பார்ப்புகள் கூடிவிடும். தரவு சொல்லும் கதையை வெளியே மற்றஆலோசகர்களிடமிருந்து பெறமுடியாது; காசு கொடுத்து வாங்கவும் முடியாது.

நம்முடைய சில்லறை வியாபாரப் பிரச்னையில், அதிகமாக வாங்கப்படும் தென்னிந்தியப் பொருட்கள் எது என்பதை மட்டும் தெரிவதில் அதிகப் பயனில்லை. எந்தெந்த மையங்களில், இந்தப் பொருட்கள் அடுக்கப்படும் பகுதிகள் சேர்க்கப்பட வேண்டும், எந்த உற்பத்தியாளரிடமிருந்து இன்னும் நல்ல (அல்லது குறைந்த) விலைக்குப் பொருட்களை வாங்குவது, எப்படி லாபத்தைக் கூட்டுவது என்று கதை முழுமையடைய வேண்டும். இப்படிச் சொல்லப்படும் டேட்டாக் கதைகள் மேலும் தரவு விஞ்ஞானத்தின் தாக்கத்தைக் கூட்டும்.

அடுத்த பகுதியில், இந்தத் துறையில் முன்னேறுவதைப் பற்றி ஆராய்வோம்.

சொல்வனம் – அக்டோபர் 2016

பாதுகாப்புப் பிரச்னைகள்-கருவிகளின் இணையம் – பகுதி 21

பாதுகாப்புப் பிரச்னைகள் மற்றும் குறைகளைப் பற்றி நிறைய சொல்லிவிட்டோம். எப்படி வடிவமைத்தால், இவ்வகை தெரிந்த பாதுகாப்புப் பிரச்னைகளைத் தவிர்க்கலாம் என்று பார்ப்போம். கருவிகளின் வடிவமைப்பு அணுகுமுறை மாறுவது அவசியம். நல்ல வேளையாக இவ்வகை முயற்சிகள் உலகெங்கும் பல அமைப்புகளால் முன்வைக்கப்பட்டுள்ளன. இன்னும் சில ஆண்டுகளில், பெரும்பாண்மைத் தயாரிப்பாளர்கள் இந்த பரிந்துரைகளைப் பின்பற்றத் தொடங்குவார்கள் என்று நம்பலாம். இல்லையேல், இந்தத் துறையே வாங்குவோரின்றி முடங்க வாய்ப்புண்டு.

பாதுகாப்பு வடிவமைப்புக் குறிக்கோள்கள்

 

1சில முக்கிய வடிவமைப்பு அணுகுமுறைகளைப் பார்ப்போம்.

  1. வரும்வரை காத்திராமல் வடிவமைப்பில் பாதுகாப்பை முன்வைக்க வேண்டும். கருவிகளை வடிவமைக்கும் பொழுது, தரவுகளை விஷமிகள் திருடுவார்கள், கருவிகளையே திருடக்கூடும், தரவுகளை மாற்றி, முடிவுகளைத் திசை திருப்ப முயல என்ன வழிகளைக் கையாள்வார்கள் என்று பல சாத்தியங்களை ஆராய்ந்து கருவிகளை உருவாக்க வேண்டும். இப்படிச் செய்தாலே, விஷமிகள் புதிய வழிகளைக் கண்டுபிடித்து விடுகிறார்கள். இவ்வாறு செய்தால், குறைந்த பட்சம், சாதாரண இணையத் தாக்குதல்களைத் தவிர்க்கலாம். தீவிரத் தாக்குதல்களைக் கடினமாக்கலாம்
  2. அந்தரங்கம் பற்றிய கவலை எதுவும் இல்லாமல் பொருட்களை வடிவமைப்பது கணினி தொழிலில் ஒரு பழக்கமாகி விட்டது. பிரச்னை வந்தால் பார்த்துக் கொள்ளலாம் என்ற பழைய பல்லவி கருவி இணைய உலகில் உதவாது. பயன்பாட்டாளர்களின் அந்தரங்கம் ஆரம்பத்திலிருந்தே ஒரு வடிவமைப்புக் குறிக்கோளாக அமைய வேண்டும்
  3. இன்னொரு முக்கிய கொள்கை, ’என்னுடைய பங்கைச் சரியாக செய்து விடுவேனாக்கும்!’ போன்ற பழைய அலட்டல்கள் கருவி இணைய உலகில் வேகாது. இணைக்கப்பட்டுள்ள அத்தனை பாகங்களில் ஒன்று பாதுகாப்பற்று இருந்தால், மொத்த முயற்சியும் வீண்தான்.
  4. முக்கியமாக, கருவி இணைய உலகில் தரவுப் பாதுகாப்பு மிகவும் முக்கியமானது. சாதாரண கணினி உலகை விட இது மிகவும் மாறுபட்டது. அதாவது, சேகரிக்கப்படும் ஒவ்வொரு தரவும், அதன் சேகரிப்பு நேரத்திலிருந்து, அழிக்கப்படும் நேரம் வரை எப்படிப் பாதுகாக்கப்பட வேண்டும் என்று சிந்தித்து வடிவமைக்கப்பட வேண்டும். இங்குதான் பல மறைமுக கோளாறுகள் நேர்கின்றன. ‘நாங்கள் உயர்தர பாதுகாப்பு முறைகளை மேக சேமிப்பில் பயன்படுத்துகிறோம்’ என்று அலட்டிக் கொள்ளும் ஒவ்வொரு நிறுவனமும், தரவின் பயன் முடிந்தவுடன் என்ன செய்கின்றன என்று ஆராய்ந்தால், எந்த நிறுவனமும் தேறாது.

2

 

பாதுகாப்பு வடிவமைப்பு முறைகள்

குறிக்கோள்கள் எல்லாம் சரி – இனி, பாதுகாப்பான கருவி இணைய முயற்சி ஒன்று  எப்படி இருக்கும் என்று பார்ப்போம். அவரசரமாக காசாக்க வேண்டும் என்ற துடிப்பு அதிகம் தேவையில்லாத ஒரு நேர்மையான நிறுவனம் ஒன்று இதை உருவாக்குகிறது என்று மனதில் நினைத்துக் கொள்வோம்.3

 

  1. முதல் படி – எப்படி எல்லாம் பாதுகாப்புக்கு சமரசம் ஏற்படலாம் (threat assessment) என்பதை முழுவதுமாக அலச வேண்டும்.
    1. பொருள் சார்ந்த பாதுகாப்பு சமரசங்களைத் தவிர்ப்பது எப்படி என்பதை முதலில் ஆராய வேண்டும்.
    2. கருவி இணைய கட்டமைப்பின் ஆரம்ப அமைப்பு – யார், எதனை, எதற்காக, எப்படி, எங்கு பயன்படுத்துவார்கள் என்பதை முழுவதும் புரிந்த கொள்ள உதவும் படி இது.
    3. கருவி இணைய அமைப்பைத் தனித்தனியாகப் பிரித்து, எப்படி தரவுகள் அங்கு பயணிக்கின்றன, தேக்கப்படுகின்றன என்று பாதுகாப்பு கோணத்தில் ஆராய வேண்டும்
    4. எந்த ஒரு வடிவமைப்பிலும் குறைகள் இருக்கவே செய்யும். உருவாக்கப்பட்டக் கட்டமைப்பில் உள்ள பாதுகாப்பு குறைகள் என்னென்ன என்று பட்டியலிடப்பட வேண்டும்
    5. பட்டியலிடப்பட்ட பாதுகாப்புக் குறைகளில் அதிகமான தாக்கம் உள்ள குறை எது, அடுத்தபடி உள்ள குறை என்ன என்று ஒரு மதிப்பீடு தரப்பட வேண்டும். இப்படிச் செய்வதால், குறைந்தபட்சம் பாதுகாப்புக் குறைகளில் முதல் மூன்று அல்லது ஐந்து விஷயங்களையாவது தயாரிப்பாளர்கள் அல்லது நிரலர்கள் தங்களுடைய வடிவமைப்பில் நிவர்த்தி செய்ய முயற்சிப்பாளர்கள்4
  2. இரண்டாம் படி – பாதுகாப்பு எங்கும் நிறைந்திருக்கும் தயாரிப்பு அல்லது நிரலாக்கம். (secure development)
    1. பயன்பாட்டு சான்றளிப்பு மிகவும் பாதுகாப்பான ஒன்றாக இருக்க வேண்டும்
    2. மறைகுறியாக்க முறைகள், தரவுகளை தேக்கவும், அனுப்பவும் பயன்படுத்தப்பட வேண்டும்
    3. மற்ற பங்காளிகளின் தயாரிப்புடன் ஒரு கருவி இணைய முயற்சியை வெளிக் கொண்டு வரும் பொழுது, ஆரம்பத்திலிருந்து, கடைசிவரை பாதுகாப்பான தரவுப் போக்குவரத்திற்கு வழி வகுக்க வேண்டும். இன்று நடப்பது போல, சாக்கு போக்கு சொல்லித் தப்ப முயற்சிக்கக் கூடாது
  3. முன் பகுதியில் பார்த்தது போல, உருவாக்கப்படும் கருவி இணைய சேவையில் பல அடுக்களிலும் பாதுகாப்பு சரியாக அமைவதோடு, சோதனையும் செய்து பார்க்க வேண்டும்.
    1. வலையமைப்புப் பாதுகாப்பு மிகவும் முக்கிய விஷயம். விளிம்பில் இருக்கும் கருவிகளைத் தவிர்த்து, உள்ளே நிறுவனத்தை பாதுகாப்பது பயன் தராது
    2. பயன்பாட்டுப் பாதுகாப்பு என்பது சிக்கலான பிரச்னை. இதில் தரவுப் பாதுகாப்பும் அடங்கும்
    3. மனிதப் பயன்பாடு சார்ந்த பாதுகாப்பும் மிகவும் முக்கியம். கருவி இணையம் என்றவுடன், மனிதர்களுக்கு என்ன வேலை என்று விட்டு விட முடியாது. முக்கிய பாதுகாப்பு சமரசத்திற்கு மனிதர்களே காரணமாக உள்ளார்கள்
    4. விளிம்பில் உள்ள உணர்விப் பாதுகாப்பு இன்னொரு முக்கிய விஷயம். உணர்வி உருவாக்கும் தரவுகள் பாதுகாப்பாக மையத் தேக்கத்திற்குச் சென்றடைய வேண்டும். இதற்கான கட்டுப்பாடுகள்/வசதிகள் தயாரிப்புப் படியிலே மேற்கொள்ளப்பட வேண்டும்5
  4. நான்காம் படி – தரவுப் பாதுகாப்பு. மிகவும் நம்பகமான குறிமுறையாக்க முறைகள் (Elliptic Curve Diffie Hellman – ECDH) மற்றும் டிஜிட்டல் கையொப்ப முறைகள் பயன்படுத்தப்பட வேண்டும். தரவு என்றவுடன் இதை ஐந்து வகையாகப் பிரிக்கலாம்
    1. அசையா தரவின் பாதுகாப்பு (Data at rest security) – கருவிகளால் உருவாக்கப்படும் தரவுகள் குறிமுறையாக்க முறைகளால், பாதுகாக்கப்பட வேண்டும். மேலும், சரியான சான்றளிப்பில்லாமல், இந்த தரவுகளை யாராலும் புரிந்து கொள்ள முடியாதபடி செய்தல் வேண்டும்
    2. அசையும் தரவின் பாதுகாப்பு (data in transit security) – சரியான டிஜிட்டல் கையொப்பமின்றி தரவுகள் அனுப்பப்படக் கூடாது. இதைச் சரியாகச் செய்யவில்லையானால், அசையா தரவின் பாதுகாப்பு அர்த்தமில்லாமல் போய்விடும்
    3. பயனில் உள்ள தரவின் பாதுகாப்பு (data in use security) – பாதுகாப்பான சூழ்நிலையை கருவிகளுக்குள் அமைப்பது அவசியம். மைய தேக்கியிலிருந்து அனுப்பப்படும் தரவுகளைப் பயன்படுத்தும்பொழுது, கருவியின் நினைவகத்திலிருந்து எளிதாக தரவுகளை தவறாகப் பயன்படுத்தும் முயற்சிகளைத் தடுக்கவே இந்த வடிவமைப்பு. பல உயர்தர பயன்பாடுகள் இது போன்ற அமைப்புகளை உருவாக்கினாலும் (உதாரணம், ராணுவப் பயன்பாடுகள்), சாதாரணப் பயன்பாடுகள் செலவைக் குறைக்க இந்த வடிவமைப்பை சீரியஸாக எடுத்துக் கொள்வார்கள் என்று சொல்ல முடியாது
    4. தரவு நஷ்டப் பாதுகாப்பு (data loss prevention) – எந்த ஒரு கருவி இணைய அமைப்பும், புதிய உணர்விகள் சேர்த்த வண்ணம் இருக்கும் என்று நம்பலாம். புதிய உணர்விகளைச் சேர்த்தவுடன், பழைய கருவிகள் அனுப்பும் தரவுகள் தொலைந்து போகாமல் பார்த்துக் கொள்ள வேண்டும். ஒவ்வொரு கருவி அனுப்பும் தரவும், இன்ன கருவி அனுப்பியது என்று சரியாகச் சொல்லும் வழி இருப்பது அவசியம்
    5. தரவுத் திரள்வுப் பாதுகாப்பு (data aggregation security) – கருவி இணைய உலகில் மிகவும் முக்கியமான பாதுகாப்பு விஷயம் இது. தொழில்நுட்பப் பகுதியில் பார்த்தது போல, உணர்விகள் சேகரிக்கும் அத்தனை தரவுகளையும் மைய தேக்கத்திற்கு சிலப் பயன்பாடுகள் அனுப்புவதில்லை. மையத் தேக்கத்துடன் தொடர்பில் இருக்கும் மின்பரப்பி/வாங்கி, தரவுகளை திரட்டி, ஒரு குறிப்பிட்ட நேரத்தில், தரவுத் திரள்வை அனுப்பும். இத்தகைய திரள்வுப் பாதுகாப்பாக அனுப்பப்பட வேண்டும். குறிமுறையாக்க முறைகள் இதிலும் பின்பற்றப்பட வேண்டும், அதிகம் கவனமில்லாமல் செய்யப்படும் பாதுகாப்பு விஷயம், கருவி இணைய உலகில், தரவுத் திரள்களைக் கையாளும் முறைகள்.

 

இவ்வாறு பல வடிவமைப்பு முறைகள் இருக்கத்தான் செய்கின்றன. சற்றும் இதைப் பற்றி கவலையில்லாமல், பயன்பாட்டை மட்டுமே முன்வைக்கும் நிறுவனங்கள் இருக்கத்தான் செய்கின்றன. நுகர்வோரை வெறும் விற்பனைத் தந்திரங்கள் கொண்டு வசியம் செய்யும் நிறுவனங்கள் இருக்கத்தான் செய்யும். இப்பொருட்களை வாங்கும் நுகர்வோர், தகுந்த பாதுகாப்பு கேள்விகளை கேட்டால்தான் நிலமை சரியாகும். சந்தேகத்துடன் இந்தத் துறையில் வாங்குவது ஒரு நல்ல விஷயம் என்றே சொல்ல வேண்டும்.

 

நாம் தொழிநுட்பப் பகுதியில் பார்த்த சில கம்பியில்லா முறைகள் எந்த வகை பாதுகாப்பை அளிக்கிறது என்று பார்ப்போம்.

 

கம்பியில்லாத் தொழில்நுட்பம் பாதுகாப்பு முறைகள் கருத்துரை
CoAP –    முன் பங்கு சாவிகள் (preshared key)–    அடிப்படைப் பொது சாவிகள் (raw public key)

–    சான்றிதழ்கள் (certificate)

பலவித பாதுகாப்பு அமைப்புகள் கொண்ட நுட்பம். கருவிகளின் உரையாடல்களை பாதுகாப்பாக அனுப்பும் நுட்பம்
Zigbee –    முன் பங்கு சாவிகள் (preshared key) ஜிக்பீ நுட்பம், வலையமைப்பு மற்றும் பயன்பாட்டு அளவில் சான்றிதழ்கள் மற்றும் குறிமறையாக்க முறைகளை அளிக்கிறது
Bluetooth –    பங்கு சாவிகள் (shared key) மிகவும் பாதுகாப்பற்ற நுட்பம் இது. வெறும் பின்களை மட்டுமே நம்பும் முறை இது. இதை பேரிங் என்று அழைக்கிறார்கள். பல புளூடூத் கருவிகள் எந்த பின்னும் இல்லாமல் இன்றும் பேரிங் செய்கின்றன
Bluetooth LE –    தொடர்பு கையொப்பச் சாவி (Connection signature resolving key)–    கருவி அடையாளச் சாவி (identity resolving key) சாதாரண புளூடூத் முறையை விடப் பாதுகாப்பானது. ஆனால், தொடர்பு கையொப்பச் சாவிகள் எந்த குறிமுறையாக்க முறைகளையும் பின்பற்றுவதில்லை. சில கருவிகள் ECDH முறைகளைப் பின்பற்றி, சாவிகளை மாற்றிக் கொள்ளும் திறமையுடன் வருகின்றன

பல சாக்கு போக்குகளைத் தயாரிப்பாளர்கள் சொல்லி வருகிறார்கள். இதில் மிக முக்கியமான சாக்கு இதுதான் – கருவிகள் பல வருடங்கள் வேலை செய்ய மிக குறைந்த மின்கல சக்தியைக் கொண்டு செயல்பட வேண்டும். இவ்வாறு செயல்பட, அதிக மின் சக்தியை உறிஞ்சாத செயலிகள் தேவை. அதிக மின் சக்தியை உறிஞ்சாத செயலிகள் அதிக சக்தி வாய்ந்தவையும் அல்ல. குறிமுறையாக்க முறைகளுக்கு ஏராளமான செயலித் திறன் தேவைப்படுகிறது. மின்கல கருவி வாழ்வா அல்லது பாதுகாப்பா என்ற கேள்விக்கு பதில், இந்தத் தொடரைப் படிக்கும் ஒவ்வொரு வாசகருக்கும் புரிந்திருக்கும். நல்ல வேளை, குறைந்த சக்தியுள்ள செயலிகளில் சிக்கனமாக வேலை செய்யும் குறிமுறையாக்க வழிகளை ஆராய்ச்சியாளர்கள் உருவாக்கி வருகிறார்கள். இதைப் பற்றி பின் வரும் பகுதிகளில் பார்ப்போம்.

சொல்வனம் – ஜூலை 2016

 

பாதுகாப்புப் பிரச்னைகள் – கருவிகளின் இணையம் – பகுதி 20

OWASP (Open Web Application Security Project) என்ற அமைப்புக் கருவி இணைய முயற்சிகளின் முக்கிய 10 பாதுகாப்பு பிரச்னைகளைப் பட்டியலிட்டுள்ளது:

  1. இணையத்துடன் பாதுகாப்பற்ற தொடர்பு (insecure web interface)
  2. இணையத்துடன் தொடர்பு கொள்ளும் பொழுது தேவைக்கு குறைவான உறுதிப்பாடு/சான்றளிப்பு (authentication)
  3. பாதுகாப்பற்ற வலையமைப்பு சேவைகள் (insecure web services)
  4. தரவுகள் அனுப்பப்படும்பொழுது சரியான மறைக்குறியாக்க முறைகள் பின்பற்றப்படுவதில்லை (insecure data transport)
  5. அந்தரங்க சமரசங்கள் (privacy compromises)
  6. மேக சேமிப்புகளில் சரியான பாதுகாப்பு அமைப்புகள் இல்லாதது (insecure cloud interface)
  7. திறன்பேசி இணையத் தொடர்பில் பாதுகாப்பற்ற முறைகள் (insecure mobile interfaces)
  8. பெரும்பாலும், பாதுகாப்பு அமைப்புகள் தேவைக்கேற்ப மாற்றியமைக்கும் வசதிகள் இல்லாமை – அதாவது, எல்லா விதப் பயன்பாட்டிற்கும் ஒரே முறைகளை திணிப்பது (limited security configurability)
  9. பயன்பாடுகள் மற்றும் நிலைப்பொருள்களின் பாதுகாப்பு போதுமானதாக இல்லை (insecure apps, firmware)
  10. அதிக கவனம் செலுத்தப்படாத பொருள் சார்ந்த பாதுகாப்பு (poor physical security)

விரிவாக, இந்தப் பிரச்னைகளை அலசுவோம்.

கருவிகளின் இணையப் பாதுகாப்புப் பிரச்னைகள் நம்முடைய இன்றைய அனுபவங்களிலிருந்து மாறுபட்டது. கருவி இணைய உலகின் தனிப்பட்ட விஷயங்கள் சில:

  1. உணர்விகள், மனித நடமாட்டம் இல்லாத இடங்களில் பொருத்தப் பட்டிருக்கும்
  2. உணர்விகள், சில முக்கிய பொது இடங்களில் பொருத்தப்பட்டிருக்கும்
  3. உணர்விகள், மற்ற சில கருவிகளைச் சார்ந்து இயங்கும்
  4. உணர்விகள், சில மனித/விலங்குகளின் உடலில் பொருத்தப் பட்டிருக்கலாம்
  5. நகரும் ஊர்த்திகளில், உணர்விகள் பொருத்தப்பட்டிருக்கலாம்
  6. உணர்விகள், கருவிகளின் முக்கிய தரவுகள் எங்கோ இன்னொரு நாட்டில், ஒரு மேக சேமிப்பில் சேமிக்கப்படலாம்

அலுவலகங்களின் வலையமைப்பில் தொடர்பு கொள்ளும் கணினிகளை வைத்துத்தான் நாம் மின்னணுவியல் பாதுகாப்புப் பற்றி முதலில் சிந்திக்கத் தொடங்கினோம்.  ஆரம்ப காலத்தில், அவை எங்கும் ஓடிப் போய்விடப் போவதில்லை என்பதால் ஓரளவிற்கு கடவுச்சொல் மையமான பாதுகாப்பு (password centric security) போதுமானதாக இருந்தது. மடிக்கணினிகள் வரத் தொடங்கியவுடன், இந்தப் பிரச்னை சற்று தீவிரமாகியது. கணினிகள் ஓரிடத்தில் இருக்கும் என்று சொல்ல முடியாது. ஆனால், எங்கோ அதன் சொந்தக்காரரின் பாதுகாப்பில் இருக்கும் என்று நம்பலாம். மடிக்கணினிகள் திருட்டுப் போனால் மட்டுமே கவலை. ஆரம்ப நாட்களில், மடிக்கணினிகள் அலுவலக மற்றும் இணையத்துடன் தொடர்பில்லாமல் இருந்தன. இவை இணையத்துடன் தொடர்பு கொள்ளத் தொடங்கியவுடன், மடிக்கணினியோ, மேஜைக் கணினியோ, எதுவாக இருந்தாலும், இணைய விஷமிகளால், கடத்தப்படும்/தாக்கப்படும் வாய்ப்பு அதிகரிக்கத் தொடங்கியது. இதைக் கடினமாக்க, நமக்கு கடுமையான பாதுகாப்பு வசதிகள் தேவைப்பட்டன. வெறும் கடவுச் சொல் சமாச்சாரங்கள் உதவாமல் போகவே, எல்லாத் தொடர்புகளையும் மறைகுறியாக்க முறைகள் மூலம் (encrypted communications) பாதுகாக்க வேண்டி வந்தது. பல வணிக மையங்களும், வங்கிகளும் இணையத்தை பயன்படுத்தத் தொடங்கியவுடன், இந்த முறைகளை மேலும் கடுமையாக்க வேண்டி வந்தது.

அடுத்தபடியாக, செல்பேசி, திறன்பேசி போன்ற கருவிகள், இந்தப் பிரச்னையை மேலும் கடினமாக்கின. இக்கருவிகள் எளிதில் திருடக் கூடியவை . விஷமிகள் கையில் சிக்கினால்,  மிகவும் அந்தரங்க விஷயங்கள் பல விஷமியின் கையில் எளிதில் சிக்க வாய்ப்புகள் உள்ளன. இப்படியிருந்தும், திறன்பேசி நுகர்வோரில் அதிக கவனமின்றி  இன்றும் ஒரு 75% பேர் இயங்கி வருகிறார்கள். குறைந்த பட்சம், இவற்றை இன்னாருடைய செல்பேசி/திறன்பேசி என்றாவது   எளிதில் சொல்ல முடியும். ஆனால், கருவிகளை இப்படிக் கூடச் சொல்ல முடியாது.

  1. ஆக, மிக முக்கியமான கருவி இணைய விஷயம் பொருள் சார்ந்த பாதுகாப்பு. இது physical security என்று அழைக்கப்படுகிறது.
  2. அடுத்தபடி மிகவும் முக்கியமான கருவி இணையப் பாதுகாப்பு விஷயம் மனிதப் பயன்பாடு சார்ந்த பாதுகாப்பு. இது human layer of security. மனிதர்கள், விலங்குகளுடன் இணைக்கப்பட்டிருக்கும் கருவிகளின் பாதுகாப்பு இன்னொரு தனிப்பட்ட கருவி இணையப் பாதுகாப்பு சவால்
  3. மூன்றாவது கருவி இணையப் பாதுகாப்பு விஷயம், வலையமைப்புப் பாதுகாப்பு (network security). கருவி இணைய உலகில், கணினி, மற்றும் திறன்பேசி உலகைக் கட்டிலும் அதிக வலையமைப்புச் சிக்கல் இருப்பதால், இந்த பாதுகாப்பு விஷயம் மேலும் சிக்கலடைகிறது
  4. நான்காவது கருவி இணையப் பாதுகாப்பு விஷயம், பயன்பாட்டுப் பாதுகாப்பு (application security). கருவிகளின் பயன்பாட்டைக் கருவி இணைய உலகில் எந்த ஒரு மனிதரும் பயன்படுத்துவதில்லை. இதனால் உருவாகும் சிக்கல்கள் தனிப்பட்டவை
  5. ஐந்தாவது கருவி இணையப் பாதுகாப்பு விஷயம், கருவிப் பாதுகாப்பு. பொருள் சார்ந்த பாதுகாப்பைத் தாண்டி, கருவியின் பாதுகாப்பும் ஒரு மிக முக்கிய விஷயம்

 

Part19-Pic4

பொருள் சார்ந்த பாதுகாப்பு

எங்கு, எந்தக் கருவி மற்றும் உணர்வி நிறுவப்பட்டுள்ளது என்று ஜி.பி.எஸ். துல்லியத்துடன் செய்யப்பட வேண்டும். ஒரு ஆள் நடமாட்டமில்லாத இடத்தில் நிறுவப்பட்டுள்ள கருவியை எளிதில், செயலிழக்கச் செய்ய முடியும். மேலும் அதை விஷமிகளால் மாற்றவும் முடியும். திருடவும் முடியும். பொது இடங்களில் திருடுவது சற்று கடினமாக இருந்தாலும், மற்ற விஷமச் செயல்கள் எளிதில் செய்ய முடியும்.

  1. உதாரணத்திற்கு, எத்தனை வண்டிகள் ஒரு சந்திப்பிற்கு வருகின்றன என்பதை அளக்க ஒரு உணர்வி நிறுவப்பட்டுள்ளது என்று வைத்துக் கொள்வோம். இதை விஷமிகள் உடைத்து விடலாம், ஏன் திருடக் கூடச் செய்யலாம். அல்லது இன்னொரு அதிக வாகன போக்குவரத்து இல்லாத இடத்தில் நிறுவலாம். இந்த மூன்றில் எது நடந்தாலும் பல கணக்குகள் தப்பாகி விடும்
  2. நதியின் பிராணவாயு, காற்றளவு எத்தனை என்று அளக்கும் உணர்வி எங்கோ மலையில் யாருமில்லா இடத்தில் நிறுவப்படலாம். காட்டாற்று வெள்ளம், மிருகங்கள், திருட்டு என்று பல விஷயங்களால் காணாமல் போகலாம். மேலும் எளிதில் இதன் உணர்வியை மாற்றி, நீரில் விஷத்தன்மை கூடி விட்டதாக பீதி ஏற்படுத்துவது எளிது

எப்படி இத்தகையப் பிரச்னைகளைத் தீர்ப்பது?

  1. கருவிகளைக் கண்காணிக்க பாதுகாப்பு காமிராக்கள் அவசியம்
  2. கருவிகளின் கூடு, (sensor cage) எளிதில் விஷமிகளால் கேடு விளைவிக்க முடியாதபடி தயாரிக்கப்பட வேண்டும்
  3. கருவிகள், இடம் பெயர்ந்தால் வேலை செய்யாமல் செயலிழக்க வேண்டும்
  4. எளிதில் மின்னணு பாகங்களை மாற்றி அமைத்துச் செயல்பட விடாமல், அதன் வன்பொருளிலேயே மறைக்குறியாக்க முறைகள் செயல்படுத்தப்பட வேண்டும்

மனிதப் பயன்பாடு சார்ந்த பாதுகாப்பு

ஒரு பெரிய நிறுவனம், கருவி இணைய முயற்சிகளில் இறங்குகிறது என்று வைத்துக் கொள்வோம்.  பல தரப்பட்டவர்கள் இந்த முயற்சியில் பங்கு கொள்வார்கள்.

  1. நிறுவனத்தில் பணி புரியும் பலதரப்பட்ட ஊழியர்கள் (employees)
  2. நிறுவனத்துடன் வியாபாரம் செய்யும் வாடிக்கையாளர்கள் (customers)
  3. நிறுவனத்திற்கு பொருட்களை/சேவைகளை வழங்கும் நிறுவனங்கள் (suppliers)
  4. சில சிறிய/பெரிய வேலைகளைச் செய்யும் ஒப்பந்தக்காரர்கள் (contractors)

இந்த முயற்சியில் ஒன்று அல்லது பல தரப்பட்டவர்கள் பங்கேற்பார்கள். ஒவ்வொருவரின் பாதுகாப்புப் புரிதல் வேறு, பயன்பாட்டுக் குறிக்கோள் வேறு. இந்த மனிதச் சங்கிலியில் எங்கு வேண்டுமானாலும் பாதுகாப்புக் குறைபாடு ஏற்படலாம். இதில் எவரோ ஒருவர் பாதுகாப்பற்ற புளூடூத் மூலம் தொடர்பு கொண்டாலோ, அல்லது தரவுகளை மேலேற்றினாலோ இந்தக் கருவி இணைய முயற்சிக்கு பிரச்னைதான். தொழில்நுட்பப் பிரச்னைகளை விட மிகவும் சிக்கலானது இந்தப் பிரச்னை. இந்தப் பாதுகாப்புக் குறைபாடு அந்த நிறுவனத்தின் மிகப் பெரிய வாடிக்கையாளர் அல்லது ஒப்பந்தக்காரரிடமிருந்து வந்தால், அதைச் சமாளிப்பது மிகவும் கடினம்.

பெரிய கருவி இணைய முயற்சியில் ஈடுபடும் எந்த நிறுவனமும், சில விஷயங்களில் கறாராக இருப்பது மிகவும் அவசியம்:

  1. தொடர்புடைய (கருவி இணைய முயற்சியுடன்) மற்ற நிறுவனங்கள் தக்க பாதுகாப்பு நியமங்களைப் பின்பற்றினாலே பயன்பாடுகளைப் பயன்படுத்த முடியும் என்ற நிபந்தனையை முன் வைக்க வேண்டும்
  2. நிறுவனத்தின் ஒவ்வோர் அலுவலகத்திலும், தொழிற்சாலையிலும், ஆராய்ச்சி மையத்திலும்  தக்க பாதுகாப்பிற்காக சிலர் நியமிக்கப்பட வேண்டும். எங்கு சமரசம் நடந்தாலும் உடனே அறிய இது ஒன்றுதான் வழி
  3. பயன்பாட்டாளர்கள் அனைவருக்கும் பாதுகாப்பு சமரசங்களைப் பற்றிய அடிப்படை அறிவு புகட்டப் பட வேண்டும்

இத்தகைய முயற்சிகளை மேற்கொள்ளாததால், கருவி இணைய வசீகரத்தால் கவரப்பட்டு களத்தில் குதித்த பல நிறுவனங்கள் கையைப் பிசைந்து கொண்டு நிற்கின்றன.

வலையமைப்புப் பாதுகாப்பு

ஒரு வலையமைப்பிற்குள் ஊடுருவ பல வழிகள் இருந்தாலும் அதில் மிகவும் எளிதான வழி, மனிதர்களின்  முன் இல்லாத, கருவி அல்லது உணர்வி என்பது தெளிவு. ஒரு கருவியைக் கைப்பற்றினால், மேலும் புதிய வழிகள் மூலம் ஒரு வலையமைப்பிற்குள் புகுந்து விஷமம் செய்வது எளிது. வழக்கமான ஒரு வலையமைப்பில் உள்ள ஒரு கணினியைக் கைப்பற்றி மேலும் பல கணினிகளுக்கு, சேமிப்புக்கு தீங்கு விளைவிப்பது என்பது இன்றைய உலகில் சாத்தியம். கருவிகள் மூலம் புதிய முறைகளில் எதிர்பாராத தரவுகள், அல்லது மற்ற கருவிகள் பற்றிய தவறான தகவல்கள் என்று பல விதத்திலும் தொந்திரவு கொடுக்க இயலும்.

பொதுவாக எந்த ஒரு வலையமைப்பிற்கும் ஃபயர்வால் (firewall)  என்ற ஒரு மென்பொருள் அமைப்பு உண்டு. இன்னும் பிரத்யேகமான மென்பொருள்கள், வலையமைப்பிற்குள் வரும் ஒவ்வொரு தரவுப் பொட்டலத்தையும் ஆராய்ந்து, அதில் விஷமக் குறிக்கோள் இருக்கிறதா என்று முடிவு செய்ய இயலும். ஆனால், கருவிகளிலிருந்து வரும் தரவுப் பொட்டலங்களில் இந்த அணுகுமுறை செல்லாது. ஏனென்றால், விஷமத் தரவுப் பொட்டலங்களிலிருந்து (mischievous data packets) எந்த விஷமக் குறிக்கோளையும் கண்டுபிடிக்க முடியாது. ஒரு சந்திப்பில் இருக்கும் வாகனங்களை எண்ணும் கருவி கடத்தப்பட்டால், அதிலிருந்து தவறான எண்ணிக்கை வந்தால், அதை வைத்து ஒன்றும் செய்ய முடியாது. உதாரணத்திற்கு, எப்பொழுதுமே இரண்டு வாகனங்கள் வருவதாக அது சொல்லி வந்தால், அதில் உள்ள விஷமத்தை கண்டுபிடிக்க முடியாது. ஏனெனில், அதிகாலை 3 மணிக்கு,  இரண்டு வாகனங்கள் அந்தச் சந்திப்பில் கடந்தால், அது சரியான எண்ணிக்கைதானே.

இதையும் தாண்டி, துறைகள் திறந்திருக்கிறதா (open ports) என்றும் கண்காணிக்க வேண்டும். மேலும், ஒவ்வொரு கருவியின் அடையாளமும் கண்காணிக்கப்பட வேண்டும். கருவி இணைய விஷயத்தில், கருவி அடையாளம் என்பது ஒரு சிக்கலான விஷயம். ஏனெனில், எல்லா கருவிகளும் ஒரு கணினி தரவு மையத்திற்குத் தரவுகள் அனுப்புவதில்லை. பல அருகாமையில் இருக்கும் கருவிகளுக்கு, ஒரு இணையத் தொடர்பு மின்பரப்பி/வாங்கி (electronic transceiver) செய்கிறது என்று முன் பகுதிகளில் பார்த்தோம். முறைகேடாக ஊடுருவி மாற்றப்பட்ட ஒரு கருவியிடமிருந்து மின்பரப்பி/வாங்கி எந்தத் தரவையும் அனுப்ப/வாங்கக் கூடாது. இது மிக முக்கிய பாதுகாப்புத் தடுப்பு முறை.

கருவிகள் அனுப்பும் தரவுகள் ரகசியமானதாக இல்லாவிட்டாலும், அவை மறைக்குறியாக்க முறைகள் பயன்படுத்தப்பட வேண்டும். எங்கு கம்பியில்லாத் தொடர்பு இருந்தாலும் WPA முறைகள் பின்பற்றப்பட வேண்டும்.

இவை யாவும் தெரிந்தும் பல தயாரிப்பாளர்கள் தங்களது விலையை வசீகரமாக்குவதற்காக பாதுகாப்பைக் கோட்டை விடத் தயங்குவதில்லை.

 

Part19-Pic6

பயன்பாட்டுப் பாதுகாப்பு

இதுவரை நாம் பார்த்த பலவகை கருவி இணையப் பயன்பாடுகளிலிருந்து இது எவ்வளவு விரிவான  விஷயம் என்று தெளிவாகியிருக்கும். உதாரணத்திற்கு,

  • ஒரு அணிக்கருவியிலிருந்து மிகவும் சீரியஸான நோயாளியின் உடல்நிலை பற்றிய தரவுகள் அவருக்கு உதவ வந்த முதலுதவி உதவியாளருக்கு (paramedics) எந்த விதப் பாதுகாப்புடன் மாற்றப்படுகிறது? அதே போல, முதலுதவி வண்டியிலிருந்து மருத்துவமனையில் உள்ள மருத்துவருக்கு எந்த விதப் பாதுகாப்புடன் மாற்றப்படுகிறது? இரண்டும் உயிர்காக்க உதவும் முக்கிய வழிகள். ஆனால், பயன்பாட்டுப் பாதுகாப்பு என்பது மிகவும் முக்கியமான விஷயம். தவறான கைகளில் இந்த விஷயம் சிக்கினால், இதன் விளைவுகள் விபரீதமாகிவிடும்.
  • ஒரு முக்கிய சாலைச் சந்திப்பில் நிறுவப்பட்டுள்ள காமிராவின் தரவு போக்குவரத்துத் துறைக்கு மட்டுமே பயன்பட வேண்டும்.  குற்றவாளிகளின் கையில் இந்த காமிராவின் வீடியோ தரவு சிக்கினால், அதன் பயனே வேறாகிவிடும்
  • இந்தத் தொடரின் ஆரம்பத்தில் நாம் பார்த்த காரின் சகல விஷயங்களையும் இணையம் மூலம் விஷமிகள் தங்கள் கட்டுப்பாட்டிற்குள் கொண்டு வந்தால், ஓட்டுனர்கள் கதி என்னாவது?
  • ஒருவருடைய உடலுக்குள் பொருத்தப்பட்டுள்ள கருவிக்கு கட்டளைகள் எங்கிருந்து வர வேண்டும்? உதாரணத்திற்கு, இதய முடுக்கி (pacemaker) என்ன இணையத்துடன் இணைக்க வேண்டிய விஷயமா?
  • ஒரு மருந்து நிறுவனம், மருந்து செலுத்தும் பம்புகள் பற்றிய முக்கிய அறிக்கையை தகுந்த நோயாளிகளுக்குப் பாதுகாப்பாக, மருந்தாளுனர் (pharmacist) மூலம் கொண்டு சேர்ப்பது முக்கியம்.  தவறான கைகளில் இந்த விஷயம் சிக்கினால், நோயாளியின் உடல்நலம் மட்டுமல்ல, உயிருக்கே ஆபத்து வரலாம்
  • குழந்தைகளைக் கண்காணிக்க உதவும் பல அணிக் கருவிகளில் சரியான பாதுகாப்பு இல்லையேல், அது கண்காணிக்கப்படும் குழந்தைக்கே ஆபத்தாகிவிடும்
  • எல்லாவற்றையும் படம் எடுக்கும் திறன்பேசி கலாச்சாரம் நம்மில் மிகவும் பரவியுள்ளது. பல புதிய கருவிகள் இந்த பலவீனத்தைப் பயன்படுத்தி தேவையோ இல்லையோ, ஒரு காமிராவையும் அள்ளி வீசுகிறார்கள். இதனால், பலரின் அந்தரங்கம் சமரசப்படுத்தப்படுகிறது. அத்துடன், இத்தகைய படங்கள் தவறான நபர் கையில் சிக்கினால், விளைவுகள் மோசமாகவே இருக்கும்

இப்படி, பயன்பாடுகள் மாறுபட்டாலும், பாதுகாப்பு என்பது மிகவும் கவனமாக இருக்க வேண்டிய விஷயம். சற்று தவறினால் கூட விளைவுகள் மிகவும் மோசமாக இருக்கும். பயன்பாடுகள் இந்த தொழில்நுட்பத்தின் நல்முகத்தை மட்டுமே வெளிச்சம் போட்டுக் காட்டுகின்றன. பயன்பாட்டாளர்கள் முக்கியமாக, எந்த ஒரு கருவி இணையப் பயன்பாட்டையும் ஒரு சந்தேகத்துடனே அணுக வேண்டும். எங்கு, எந்த வகையான சமரசம் செய்யப்பட்டுள்ளது என்பதை மிகவும் ஆராய்ந்துதான் இவ்வகை தொழில்நுட்பங்களை ஆதரிக்க வேண்டும். பயன்பாட்டாளர்கள் மாறாதவரை, பயன்பாடுகளை உருவாக்குபவர்கள், பாதுகாப்பு சமரசங்களை மறைக்கத்தான் செய்வார்கள். பயன்பாட்டாளர்கள், வாங்கும் முன் கேட்க வேண்டிய சில கேள்விகள்:

  1. எப்படித் திறன்பேசி, கருவியுடன் தொடர்பு கொள்ளும்? அதன் பாதுகாப்பு பலவீனங்கள் என்ன?
  2. எப்படிக் கருவி, இணையத்துடன் தொடர்பு கொள்ளும்?
  3. பொது இணைய மையங்களிலிருந்து (WiFi Hotspot) எப்படி இந்தக் கருவியுடன் தொடர்பு நடக்கிறது?
  4. திறன்பேசியின் புளூடூத் இணைப்பின் மூலம், எங்கெல்லாம் கருவியோடு தொடர்பு கொள்ளக் கூடாது?
  5. கருவியை இன்னொருவர் (நண்பர், உறவினர்) எப்படிப் பாதுகாப்பாக சில நாட்கள் பயன்படுத்தலாம்?
  6. கருவியுடன் தொடர்பு மறைக்குறியாக்க முறையில் நடக்கிறதா? அப்படியென்றால், மறைக்குறியாக்க முறையின் பலம் (encryption strength) என்ன?
  7. இணையத்தில் சேமித்து வைக்கப்படும் தரவுகள் மறைக்குறியாக்க முறையில் நடக்கிறதா? அப்படியென்றால், மறைக்குறியாக்க முறையின் பலம் (encryption strength) என்ன?
  8. கருவி பழுதானல், அதை எப்படி அப்புறப்படுத்துவது? நாம் பல ஆண்டுகளாக, வன்தட்டு தேக்கிகளை (hard drives) சரியான முறையில் அப்புறப்படுத்துவதை அலட்சியம் செய்து வருகிறோம். இன்று, நம் அந்தரங்கத்தின் மீதான பல அத்து மீறல்களுக்கு வழி வகுப்பது இந்த மனப்போக்குதானே தவிர, கருவிகள் அல்ல

கருவிப் பாதுகாப்பு

கருவிகளின் பொருள் சார்ந்த பாதுகாப்பு தவிர மிக முக்கியப் பாதுகாப்பு பிரச்னை, கருவியின் நிலைப்பொருளை (firmware) எப்படி மாற்றத்திற்கேற்பப் புதுப்பிப்பது என்பது. பல நூறு கருவிகள் ஒரு அமைப்பின் கீழ் இருந்தால், அவை இருக்கும் ஒவ்வொரு இடத்திற்கும் சென்று புதுப்பிப்பது என்பது இயலாத ஒன்று. உதாரணத்திற்கு, ஒரு சுரங்க நிறுவனத்தின் சுரங்கங்கள் ஆள் நடமாட்டமில்லாத இடங்களில் பனி மூடப்பட்ட நிலையில் இருக்கலாம். அங்குள்ள ஒரு கருவியின் நிலைப்பொருளைப் புதுப்பிக்க ஒருவரை அனுப்பினால், கருவியின் விலையை விட அதிகம் செலவாகும். புதுப்பிப்பதற்காக, சில துறைகளைத் திறந்து வைத்தாலும், விஷமிகள் கையில் எளிதில் கருவி அகப்பட்டு விடும். இவ்வகை நிலைப்பொருளைப் புதுப்பிப்பது, என்பது பல அடுக்கு பாதுகாப்பு உடைய விஷயமாக இருக்க வேண்டும். திறந்த துறைக்குள் நுழைய மின்பரப்பி/வாங்கி வழியாகத்தான் செல்ல வேண்டியபடி வடிவமைக்க வேண்டும். மேலும், இந்த நிலைப்பொருளை நிறுவ கடவுச்சொல் மற்றும் சில விசேடத் தகுதிகள் இருந்தால் மட்டுமே முடிய வேண்டும்.

புளூடூத் இணைப்பு எங்கிருந்தாலும், அதன் அடிப்படை பின்னை மாற்ற வேண்டும். இந்த ஒரு செயல், பல வகை அடிப்படைத் தாக்குதல்களிலிருந்து தப்பிக்க வழி செய்யும்.

பொதுவாக, கடவுச்சொல் அமைப்பு கடுமையாக்கப்பட வேண்டும். சும்மா, 1234 போன்ற கடவுச்சொல்கள் அனுமதிக்கப்படக் கூடாது.

கருவிகளின் பாதுகாப்பு விஷயத்தில் உள்ள ஒரு மிகப் பெரிய சவால், கருவியிலேயே உள்ளது. மறைக்குறியாக்க முறைகளை பின்பற்ற, மிக அதிக சக்தி வாய்ந்த செயலிகள் தேவை. அத்துடன் சக்தி வாய்ந்த செயலிகள் ஏராளமான மின்கலன் சக்தியையும் உறிஞ்சி விடும். சக்தி வாய்ந்த செயலிகளைப் பயன்படுத்தினால், விலையும் கூடிவிடும். இதனால், விலையை வசீகரமாக்குவதற்காக பல தயாரிப்பாளர்களும் பாதுகாப்பு சமரசங்களை செய்த வண்ணம் இருக்கிறார்கள். இன்னும் சில ஆண்டுகளில், கருவிகளில் பயன்படும் செய்லிகளின் சக்தியும் கூடி, விலையும் குறையும் என்று நம்புவோம்.

அடுத்த பகுதியில், கருவிகளின் இணையப் பாதுகாப்பு எப்படி இருக்க வேண்டும் என்று பார்ப்போம். உடனே இது செயலாக்கப்படாவிட்டாலும், இதற்கான முயற்சிகள் இன்று தொடங்கியுள்ளது, நல்ல விஷயம்.

 

சொல்வனம் – ஜூன் 2016

பாதுகாப்புப் பிரச்னைகள் – கருவிகளின் இணையம் – பகுதி 19

கருவிகளின் இணையம் பற்றி இத்தனை பகுதிகளிலும் அதன் நல்முகத்தைப் பற்றி எழுதி வந்தவர், எப்படி பல்டி அடித்து இப்படித் தாக்குகிறார் என்று உங்களுக்கு தோன்று முன், முதலிலேயே சொல்லி விடுகிறேன். எல்லா புதுத் தொழில்நுட்பங்களிலும் குறைகள் இருக்கத்தான் செய்யும். பல ஊடகங்கள் அதன் குறைகளை ஆரம்ப நாட்களில் பெரிது படுத்துவதில்லை. பரவலாக அந்தத் தொழில்நுட்பம் பயனில் வந்த பின்புதான் அதன் குறைகள் மக்களுக்குப் புரிய வரும். ஊடகங்களும் புரிந்து கொள்ள முயற்சி செய்யும். இதுவே நடைமுறை. 2007 –ல் ஐஃபோன் வெளி வந்தவுடன், ‘திருஷ்யம்’ போன்ற மலையாளப் படங்கள் அதன் தீய முகத்தை ஒன்றும் வெளிச்சம் போட்டுக் காட்டவில்லை. 2014 –ல், பரவலாக திறன்பேசி பயனில் வந்தவுடன் இப்படிப்பட்ட ஒரு தீய பயன்பாடு, சமூகத்தைச் சீர்கெடுக்கும் சக்தியை, சினிமா ஒரு மையமாக எடுத்துக் கொண்டுள்ளது.

கடந்த 10 ஆண்டுகளாக திறன்பேசிகள் வெகு வேகமாக வளர்ந்து வந்துள்ளன. ஆனால், நாம் திறன்பேசிகளை எதற்குப் பயன்படுத்துகிறோம்? தொலைப்பேசியாக அவசியம் பயன்படுத்துகிறோம். ஆனால், அதைவிட முக்கியமாக காமிராவாகப் பயன்படுத்துகிறோம். உதாரணத்திற்கு, கனடாவின் சி.பி.சி. ஜூலை-2015 –ல் ஒரு திடுக்கிடும் ஆய்வு முடிவு ஒன்றை வெளியிட்டது.

2010 முதல் 2015 வரை திறன்பேசிகளில் ஏறக்குறைய 250,000 கோடி புகைப்படங்கள் எடுக்கப்பட்டுள்ளன. இதில் 80% எந்த மனிதனாலும் பார்க்கப்படாதவை.

இந்தக் கணக்கில் விடியோக்கள் அடங்காது. இந்த 250,000 கோடி புகைப்படங்களில், குறைந்தபட்சம் 180,000 கோடி புகைப்படங்கள் எங்கோ ஒரு மேக சேமிப்பில் உறங்குகிறது. ஒவ்வொரு ஆண்ட்ராய்டு மற்றும் ஐ.ஓ.எஸ் கருவிகளிலும் மேக சேமிப்பில் திறன்பேசியில் நுகர்வோர் பதிவு செய்யும் ஒவ்வொரு தரவும் பின் பயனுக்காக மேக சேமிப்பிற்கு அனுப்பப்படுகிறது. வாட்ஸ் ஆப் போன்ற பயன்பாடுகளில் பரிமாற்றிக் கொள்ளப்படும் புகைப்படங்கள் மற்றும் விடியோக்களும் இதில் அடங்கும்.

 

Part18-Pic2

சரி, இதிலென்ன பெரிய விஷயம்? நம் சமூகத்தின் பாதுகாப்பைப் பற்றிய பொறுப்பற்ற செயலின் ஒரு சின்ன வெளிப்பாடு இது. அப்படி என்ன பொறுப்பற்ற செயல்? நீங்கள் திறன்பேசியில் எடுக்கும் ஒவ்வொரு புகைப்படத்திலும், எந்த நேரம் நீங்கள் அந்தப் படத்தை எடுத்தீர்கள், எங்கு எடுத்தீர்கள் போன்ற விஷயங்கள் அடக்கம். புகைப்படம் காட்டும் விஷயங்கள், இன்னொரு விஷயம். மேக சேமிப்பில், உங்களது புகைப்படங்கள் இணைய விஷமிகள் கையில் சிக்கினால், உங்களின் ஒவ்வொரு அசைவும் அவர்களுக்கு அத்துபடி. உதாரணத்திற்கு;

  1. ஜனவரி 6, 2015 மாலை 4 மணி – குமரன், சென்னை கடற்கறைக்குச் சென்றார்
  2. ஜனவரி 7, 2015 மாலை 7 மணி – குமரன், சென்னை தேவி தியேட்டரில் சினிமாவுக்கு 4 நண்பர்களுடன் சென்றார்
  3. ஜனவரி 9, 2015 இரவு 9 மணி – குமரன், ராயபேட்டையில் உள்ள ஹோட்டலில் ஒரு பிறந்த நாள் விழாவிற்குச் சென்றார்
  4. ஜனவரி 14, 2015 காலை 6 மணி – குமரன், பொங்கலுக்காகச் சென்னை அருகே உள்ள திருவள்ளூர் சென்றார்
  5. ஜனவரி 15, 2015 மாலை 7 மணி – குமரன், சென்னை சென்ட்ரல் ரயில் நிலையத்தில் சில நண்பர்களைச் சந்தித்தார்
  6. ஜனவரி 18, 2015 இரவு 9 மணி – குமரன் சென்னையில் புகழ்பெற்ற ஒரு உணவகத்தில் சிக்கன் 65 உண்டார்
  7. ஜனவரி 20, 2015 காலை 11 மணி – குமரன் சென்னை பார்க் ஷெரடன் விடுதியில் முக்கியமான ஒரு வியாபாரச் சந்திப்புக்குச் சென்றார்

இப்படி அடுக்கிக் கொண்டே போகலாம். பொறுமையாகத் தேடினால், நம் ஒவ்வொருவரின் ஜாதகமும் இணையத்தில் உள்ளது. சந்தித்தால் புகைப்படம், சாப்பிட்டால் புகைப்படம், சாலையில், அலுவலகத்தில், கலை நிகழ்ச்சிகளில், விளையாட்டுக்களில், என்று, எதையும் விட்டு வைக்கவில்லை. இதற்குக் காரணம்,  நம் (பாதுகாப்பு பற்றிய) பொறுப்பற்ற திறன்பேசிப் பயன்பாடு என்றுதான் சொல்ல வேண்டும்.

நாம் விடியோ விளையாட்டுக்கள் மற்றும் பயன்பாடுகளை தேவையோ இல்லையோ நம் திறன்பேசிகளில் தரவிறக்கம் செய்கிறோம். ஆனால் ஒவ்வொரு பயன்பாட்டை நாம் தரவிறக்கம் செய்து நிறுவும் போதும், சில முக்கிய விஷயங்களை சற்றும் தயக்கமின்றி ஒப்புக் கொள்ளுகிறோம். பயன்பாட்டைப் பயன்படுத்த அத்தனை அவசரம்!

  • உங்களுடைய மின்னஞ்சல்
  • உங்களுடைய இருப்பிடம் (location)
  • உங்களுடைய திறன்பேசியின் பல உணர்விகளின் இயக்கம்
  • உங்களது திறன்பேசியில் உள்ள காமிரா
  • உங்களது குரல்

இப்படிப் பல சொந்த விஷயங்களைக் கோட்டை விட நாம் தயாராகி விட்டோம். இதில் நாம் மட்டும் பொறுப்பற்றவர்களா? இவ்வகை பயன்பாடுகளைத் தயாரிப்பவர்கள் ரொம்பப் பொறுப்பானவர்களா? அதுவும் இல்லை. இரு சாராரும் சேர்ந்து உருவாக்கிய ஒரு இமாலயப் பாதுகாப்புப் பிரச்னை இன்று ‘திருஷ்யம்’ வரை வந்துள்ளது. கருவி இணைய உலகம் இந்தப் பிரச்னையை மேலும் சூரியன் அளவிற்குப் பெரிது படுத்தும் சக்தி வாய்ந்தது. கருவி இணையப் பாதுகாப்புப் பிரச்னையைப் பற்றிப் பெரிதாக அலசுமுன், இன்று நாம் இந்தப் பிரச்னையை எப்படி உருவாக்கினோம் என்பதை அறிவது முக்கியம். சுருக்கமாகச் சொல்லப் போனால்,

“பயன்பாட்டின் வசீகரமா, அல்லது பாதுகாப்பா என்று வந்தால், எப்பொழுதும் பாதுகாப்பு தோற்றுப் போகிறது”

  1. வீட்டில் பயன்படுத்துவதற்காக விற்கப்படும் கம்பியில்லா ரெளடர்களில் (wireless routers) 80% பாதுகாப்பில் சமரசம் செய்யப்பட்டவை
  2. சொன்னால் நம்ப மாட்டீர்கள். ஒரு ஆய்வில், ஐ.டி. துறையில் பணிபுரியும் 30% ஆசாமிகள் கூட, தங்களுடைய நிர்வாக கடவுச்சொல்லை (administrator password) மாற்றுவதில்லை! ஊருக்கு உபதேசம் செய்பவர்கள்!
  3. சாதாரண பயன்பாட்டாளர்களில் ஒரு 46%  தங்களுடைய நிர்வாக கடவுச்சொல்லை (administrator password) மாற்றுவதில்லை என்று அதே ஆய்வு சொல்லுகிறது

சற்று பின்நோக்கி, நாம் இணையத்தை எப்படி வீட்டிலும், அலுவலகத்திலும் பயன்படுத்துகிறோம் என்று பார்ப்போம். பாதுகாப்பு பிரச்னை என்பது இணையத்திலிருந்து ஆரம்பமாகிறது.

 

Part18-Pic3

பாதுகாப்பற்ற ரெளடர்கள்

இணையத்துடன் தொடர்பு கொள்ள நாம் அனைவரும் பயன்படுத்துவது ரெளடர் என்னும் கருவி. மிகவும் அலட்சியமாக நாம் செயல்படுவதும் இந்த ரெளடர் விஷயத்தில்தான். யாராவது தொழில்நுடப ஆசாமியிடம் இதன் முழுப் பொறுப்பையும் ஒப்படைத்து விட்டு எல்லாம் சரியாகவே இருக்கிறது என்று நம்புகிறோம். இதில் மேற்குலக முறைகள் சரியா அல்லது இந்திய முறைகள் சரியா என்றால், என் பார்வையில்,  இரண்டிலும் பிரச்னைதான். இந்திய முறைகளில், தொழில்நுட்ப ஆசாமியிடம், முழு நம்பிக்கை வைக்கிறோம்.  இந்த நம்பிக்கையில், தொழில்நுட்ப ஆசாமியின் பாதுகாப்பு அறிவும் அடங்கும். அங்குதான் பிரச்னை. இந்தியாவில் தொழில்நுட்பம் அறிந்த அளவிற்கு பாதுகாப்பு பற்றிய அறிவு இல்லை என்பது கசப்பான உண்மை. மேற்குலகில், எல்லாவற்றையும் நுகர்வோரே செய்து முடிக்க வேண்டும். இது இந்திய முறைகளை விட மோசமானது. நுகர்வோருக்கோ, இணையத்தின் பயன்பாட்டின் மீது மோகம் – இணையப் பாதுகாப்பின் மீது அல்ல.

கடைசில் என்ன நடக்கிறது? இரு உலகிலும், ரெளடரின் பாதுகாப்பு மிகவும் அடிப்படை அளவிலேயே விடப்படுகிறது. பெரும்பாலும் அனைத்து ரெளடர்களிலும் நிர்வாகக் கடவுச் சொல் admin  என்றே விடப்படுகிறது. மிக எளிதில் ஊடுருவக் கூடிய ஒரு பாதுகாப்பற்ற அமைப்பு இது.

  • இக்கட்டுரையைப் படித்து விட்டு உங்கள் ரெளடரின் நிர்வாகக் கடவுச் சொல்லை மிகச் சிக்கலான, நீங்கள் மட்டுமே அறிந்த ஒன்றாக தயவு செய்து மாற்றுங்கள். இல்லையேல், உங்களது இணைப்பில் நடக்கும் ஒவ்வொரு அசைவையும் கண்காணிக்க முடியும்.
  • தயவு செய்து, உங்கலது WiFi முறையை WPA –வுக்கு மாற்றவும். இன்று நம்மிடம் உள்ள WiFi  முறைகளிலேயே மிகவும் பாதுகாப்பான முறை இதுதான்
  • உங்களது ரெளடரில் விருந்தினருக்கான (guest account/password) கடவுச்சொல்லையும் கடினமாக்குங்கள். சிலர், மேலே சொன்ன இரு விஷயங்களையும் செய்து விட்டு, விருந்தினருக்கான கடவுச்சொல்லை எளிதாக விட்டு விடுகிறார்கள். என்றும் ஒன்றை மறக்க வேண்டாம் – உங்களது வேண்டாத விருந்தாளி இணைய விஷமிகள்!

 

இந்த கட்டுரையின் இறுதியில் ஒரு பாதுகாப்பு நிபுணரின் விடியோ ஒன்றை இணைத்துள்ளேன். எந்த முப்பது வீதிகள் கொண்ட ஒரு குடியிருப்புப் பகுதியை எடுத்துக் கொண்டாலும், இன்றும், பல பாதுகாப்பற்ற ரெளடர்கள் இருக்கத்தான் செய்கின்றன என்கிறார் இவர். இதைவிட மோசமான விஷயம் என்னவென்றால், பல அலுவலகங்கள், மற்றும் தொழிற்சாலைகள், இந்த அளவிலே இயங்குவதுதான்!

இந்தப் பிரச்னையின் இன்னொரு முக்கிய அங்கம், ரெளடர் தயாரிப்பாளர்கள். தங்களது தயாரிப்புகள் மிகவும் பாதுகாப்பானவை என்று பறை சாற்றும் இவர்கள், கூடவே, தங்களுடைய தயாரிப்புகள் மிகவும் எளிமையானவை என்றும் சொல்லுபவர்கள். இதில் ‘எளிமை’ என்று எதைச் சொல்லுகிறார்கள்?  அவர்களுடைய தயாரிப்பை நிறுவுவது என்பதைத்தான். எப்படி நிறுவுவதை எளிமையாக்குவது? நிர்வாகக் கடவுச் சொல்லை admin  என்று வைத்தால், நிறுவுவது எளிமையாகி விடுகிறது. பயன்பாடு வசீகரமாகி பாதுகாப்பு அடிபடுகிறது!

 

Part18-Pic4

 

பாதுகாப்பற்ற காமிராக்கள்

கடந்த சில ஆண்டுகளாக டிஜிட்டல் விடியோ காமிராக்கள் மிகவும் மலிவாகி விட்டன. துல்லியமாக படம் மற்றும் ஒலியைப் பதிவு செய்வது மற்றும் ஒலி/ஒளிபரப்புவது எளிதாகி விட்டது. பல மேற்குலக வீடுகளில், இவ்வகை கலர் விடியோ காமிராக்கள் வீட்டின் பாதுகாப்பிற்காக நிறுவப்பட்டுள்ளன. பாதுகாப்பு நிறுவனங்களால் இவை நிறுவப்படுவதால், நுகர்வோர் இவற்றை மிகவும் பாதுகாப்பான கருவிகள் என்று நம்பி விடுகிறார்கள். கூடவே, இந்த பாதுகாப்பு நிறுவனங்கள், இவ்வகை கருவிகளை நுகர்வோரின் திறன்பேசியுடன் இணைக்கும் வசதியும் செய்து தருகிறார்கள். இணையம் மூலம் விடியோ மற்றும் ஒலி குறிகைகளைப் பெற்று வீட்டில் என்ன நடக்கிறது என்று கண்காணிக்க முடியும். அட, இதில் என்ன பிரச்னை இருக்கப் போகிறது, என்று தோன்றலாம். பெரும்பாலும், இந்த விடியோ மற்றும் ஒலி குறிகைகள் எந்த மறைகுறியாக்க (encryption) முறைகளும் பின்பற்றாமல் ஒளி/ஒலிபரப்பப்படுகின்றன. இவற்றை எளிதில் ஒரு பொது இடத்தில் விஷமிகள் எளிதாக (Wifi hotspot) பார்க்க முடியும். இதனால், பல வீடுகளின் பாதுகாப்பு சமரசமாகியுள்ளது. விஷமிகள் சில படிகள் மேலே போய், உங்களது காமிராக்களை சுற்றவிட்டு உங்களது வீட்டில் என்ன பொருடகள் எங்கு வைக்கப்பட்டுள்ளன என்று இருந்த இடத்திலிருந்தே தெரிந்து கொண்டு, அவர்களது திருட்டை முழுவதும் திட்டமிடலாம்!

இக்கட்டுரையைப் படிக்கும் உங்களது வீட்டில் இவ்வகை விடியோ அமைப்புகள் நிறுவப்பட்டிருந்தால். பாதுகாப்பான உங்களது அலுவலகத்திலிருந்து கண்காணியுங்கள் – பொது இடங்களிலிருந்து அல்ல.

பாதுகாப்பற்ற புளூடூத்

திறன்பேசிகள் வந்த பிறகு, நுகர்வோருக்கு புளூடூத் மீது ஒரு தீரா மோகம் என்றுதான் சொல்ல வேண்டும். நம்முடைய காரில் திறன்பேசியில் பேச புளூடூத் மிகவும் பயன்படுகிறது. நாம் அணியும் கடிகாரம், மற்றும் இதரக் கருவிகள் நம் திறன்பேசியுடன் தொடர்பு கொண்டு தரவுகளை அனுப்ப சரியான விஷயம் புளூடூத் (இதிலும், பல பாதுகாப்பு அபாயங்கள் இருப்பது மறுக்க முடியாதது). அதே போல, நம் இசைக் கருவியை இயக்க, நம் காமிராக்களுடன் தொடர்பு கொள்ள புளூடூத் மிகவும் வசதியான தொழில்நுட்பம். இதையும் தாண்டி, இந்த பாதுகாப்பற்ற தொழில்நுட்பத்தை பயன்படுத்தத் தொடங்கினால் பிரச்னைதான்.

இன்றைய புளூடூத் கருவிகளில் பெரிதாக எந்த பாதுகாப்பும் இல்லை. பல தொழில்கள், தனியார், இக்கருவிகளின் பின்னை (device pin)  மாற்றுவதே இல்லை. இதனால், இணைய விஷமிகள் எளிதாக உங்களது கருவியை கடத்தி பல விஷமங்கள் செய்ய முடியும். அட, எப்படி இணைய விஷமிகளுக்கு இவ்வகைக் கருவிகளின் பின் பற்றித் தெரியும்? சொன்னால் நம்ப மாட்டீர்கள் – இதற்காகவே சில இணைய தளங்கள் இருக்கின்றன. எந்த கருவிகளில் தயாரிப்பாளர்கள் எந்த பின்னை பயன்படுத்தி பொருளை சந்தைக்குக் கொண்டு வருகிறார்கள் என்று பட்டியலையே வெளியிடுகிறார்கள்!

இதுவரை நாம் பார்த்தது, வெறும் இன்றைய பயன்பாடுகளைப் பற்றி மட்டும்தான். இன்று வெறும் 100 கோடி கருவிகளின் நிலை இது. 25,000 கோடி கருவிகள் இன்னும் 5 ஆண்டுகளில் உலகில் நிறுவப்பட உள்ளன. இந்த பாதுகாப்புப் பிரச்னை மிகவும் பெரிய ஒன்றாக மாற வாய்ப்புள்ளது. இன்றைய நிலையைப் பற்றி விரிவாக எழுதக் காரணம், நாளைய கருவிகளைப் பயன்படுத்தும் நுகர்வோர் அதே மனிதர்கள் தான். சற்றும் சிந்திக்காமல் தங்களுடைய அந்தரங்கங்களை இணையத்தில் மிதக்க விடும் நாம், மாற வேண்டும். ஆரம்பத்தில், தொழில்நுட்பம் புரியாமல் செய்த தவறுகள் என்று வைத்துக் கொண்டாலும், நாளைய வசதிகளுக்கு நாம் கொடுக்கப் போகும் விலை மிகவும் பெரிதாக இருக்கும். ஆரம்பத் தவறுகளைப் புரிந்து கொண்டு, நுகர்வோர் மற்றும் தயாரிப்பாளர்கள், மற்றும் சேவை நிறுவனங்கள் இந்த விஷயத்தில் தீவிரம் கட்டினால்தான் சமூகத்திற்கு நல்லது.

அடுத்த பகுதியில், கருவி இணைய உலகிற்கே தனியான பல பாதுகாப்புப் பிரச்னைகளைப் பற்றி ஆராய்வோம். இன்றைய இணையப் பாதுகாப்பு பற்றிய அருமையான விடியோ இங்கே:

சொல்வனம் – மே 2016

ராணுவ மற்றும் பாதுகாப்பு உலகம் – கருவிகளின் இணையம் – பகுதி 18

ராணுவம் என்றவுடன், உடனே நம் மனதில் தோன்றுவது வீரர்கள், டாங்குகள், பீரங்கிகள் போர் விமானம் மற்றும் போர் கப்பல்கள். இந்த காட்சி சரியாக இருந்தாலும், கடந்த 25 ஆண்டுகளாக, தொழில்நுட்பம் மேற்குலகப் போர்களில் மிக முக்கிய பங்கு வகிக்க ஆரம்பித்துள்ளது.

  • 1990 –ல் நடந்த முதல் வளைகுடா போரில், அமெரிக்கா மேற்சொன்ன தளவாடங்களை மட்டும் பயன்படுத்தி வெற்றி பெறவில்லை. இதில் பெரும் பங்கு, தகவல் தொடர்பு தொழில்நுட்பம் மற்றும் பல புதிய மின்னணுவியல் கருவிகள் துணை போனது. லேசர்களால், வழிநடத்தப்பட்ட ஏவுகணைகள், அகச்சிவப்பு பைனாகுலர்கள் மற்றும் உணர்விகள் என்று தொழில்நுட்பத்தை அள்ளி வீசி எதிரிகளை திக்கு முக்காட வைத்தனர்
  • 2003 –ல் நடந்த இரண்டாம் வளைகுடா போர், அமெரிக்காவுக்கு வெற்றியைத் தராவிட்டாலும், ஈராக்கிலும், ஆஃப்கானிஸ்தானிலும் பல புதிய தொழில்நுட்ப முயற்சிகள் மேற்கொள்ளப் பட்டன. 2003 இரண்டாம் வளைகுடாப் போரில், முதன் முதலாக, ஒவ்வொரு அமெரிக்க ராணுவ வீரருக்கும் ஒரு இணைய முகவரி அளிக்கப்பட்டது. உலகின் முதல் பெரிய கருவி இணைய முயற்சி இதுவாகத்தான் இருக்க வேண்டும். கத்தாரில் உள்ள கட்டுப்பாடு மையத்திலிருந்து, ஒவ்வொரு ராணுவ வீரரும் கண்காணிக்கப்பட்டார்
  • ஆப்கானிஸ்தானில் சிறுவர்களுக்கு கூட அமெரிக்க போர் முறையின் கருவி இணையச் செயல்பாடுகள் தெரியும் – இவர்கள் அடிக்கடி பார்த்தது, தானியங்கி குண்டு வீசும் குட்டிப் போர் விமானங்கள் (aerial automatic drone bombers). வளைகுடா போரில் செங்கடலிலிருந்து லேசர் வழிநடத்தப்பட்ட டோமோஹாக் ஏவுகணைகள் தாக்கியது போல, ஆஃப்கானிஸ்தான் போரில், எங்கோ அமெரிக்க நிவேடா பாலைவனத்திலிருந்து இணையம் மூலம் ஒரு உயரே பறக்கும் விமானத்திலிருந்து, தானியங்கிக் குட்டிப் போர் விமானங்கள் (unmanned aerial vehicles or UAVs) அதிரடித் தாக்குதல்கள் நடத்தின. இவ்வகை தாக்குதல்கள் பெரும் கண்டனத்துக்கு உள்ளாகியது

ஒன்று மட்டும் நிச்சயம் – போரில் ஈடுபடும் அரசாங்கங்கள், மிகவும் அச்சப்படும் விஷயம், வீரர்களின் சடல எண்ணிக்கை. மக்களவையில் சடல எண்ணிக்கை அதிகமானால், எதிர்கட்சிகள் கிழித்து விடுவார்கள். உயிர்சேதமற்ற போர் முறைகள் இதனால் மிகவும் ஊக்குவிக்கப்படுகின்றன. இனிமேல், சினிமாவில்தான் துப்பாக்கி, கத்திச் சண்டை எல்லாம். மற்றபடி போர் என்பதும் ஒரு இணைய, அதுவும் கருவி இணைய விஷயமாகிவிடும்.

 

Part17-Pic2

சாதாரணர்கள் இன்று பயன்படுத்தும் விடியோ காமிராக்கள், ராணுவ பயன்பாடுகளின் பாக்கியாகும். ராணுவப் பயன்பாடுகள் பெரும்பாலும் மிகவும் சக்தி வாய்ந்த விடியோ காமிராக்கள் (பின் லாடெனைக் கண்காணித்த வகை) மற்றும் அகச்சிவப்பு காமிராக்கள் (infrared cameras). மேலும், பலவகை உணர்விகளை ராணுவப்  போர் விமானங்கள், மற்றும் ஊர்த்திகள் பல்லாண்டுகளாகப் பயன்படுத்தி வந்துள்ளன. தானியங்கி பறக்கும் ஊர்த்திகளில் பெரும்பாலானவை கண்காணிப்பு வகையைச் சேரும். இவற்றில் சக்தி வாய்ந்த காமிராக்கள், படம் பிடித்து ஒரு கட்டுப்பாட்டு மையத்திற்கு டிஜிட்டல் தரவுகளாக அனுப்பிய வண்ணம் பறக்கும். இவற்றைத் தவிர, பூமிக்கு மேலே பறக்கும் ராணுவ செயற்கைக் கோள்கள், பகை நாட்டின் நிலப்பறப்பை துல்லிய காமிரா மூலம் கண்காணித்த வண்ணம் உள்ளன. கருவி இணைய விஷயங்கள் அனைத்தும் ராணுவத்தில் ஆரம்பமானவைதான்.

’சொல்வனத்தில்’, ‘நேரம் சரியாக’ என்ற தொடரில், ரகசிய ஜி.பி.எஸ். பற்றி எழுதியிருந்தேன். ராணுவ கருவி இணைய அமைப்பில் ரகசிய ஜி,பி.எஸ் –ம் ஒரு முக்கிய கருவி. ஒரு ராணுவ வீரரின் சரியான இருப்பிடம் (நாம் பயன்படுத்தும் ஜி.பி.எஸ். நம் இருப்பிடத்தை யார் வேண்டுமானாலும் எளிதில் அறிந்து கொள்ளலாம்) எதிரி நாட்டிற்குத் தெரியக்கூடாது.

ஆக, ராணுவக் கண்கள் பல வடிவங்களில் வரும்:

  1. வானில் பறக்கும் தானியங்கி பறக்கும் ஊர்த்திகள்
  2. ராணுவ செயற்கை கோள்கள்
  3. போர் விமானங்கள்
  4. ரகசிய ஜி.பி.எஸ்

இவை அனைத்தும் டிஜிட்டல் குறிகைகளால் (digital signals) , பாதுகாப்பான முறையில் கட்டுப்பாட்டு மையத்துடன் உடனுக்குடன் தொடர்பு கொள்ளும் சக்தி வாய்ந்தவை.

இன்று அமெரிக்க ராணுவ முயற்சிகள், கட்டுப்பாட்டு மையத்துடன் நிற்காமல், எதிரி நாட்டில் உள்ள ராணுவ வீரருக்கு எப்படி இவ்வகைச் சிக்கலான, மற்றும் ஏராளமான கண்காணிப்பு தரவுகளை (விடியோக்கள், வெப்பப் படங்கள், ஜி.பி.எஸ். தரவுகள்) உடனே கொண்டு சேர்ப்பது என்பது. நம்முடைய 5-ஜி திறன்பேசி முறைகள் பாதுகாப்பற்றவை. இவற்றின் வேகமும் தேவை, மற்றும் பாதுகாப்பும் தேவை. வெற்றிக்கும் தோல்விக்கும் உடனுக்குடன் கிடைக்கும் எதிரி முயற்சிகளின் விடியோக்கள், மற்றும் எதிரி இருப்பிட மற்றும் ராணுவ அமைப்பு பற்றிய தரவுகள் மிகவும் முக்கியம். யுத்த பூமியில் இவ்வகைத் துல்லிய கருவி இணைய தொழில்நுட்பம் மிகவும் முக்கியமான தேவை.

 

Part17-Pic3

ஒரு வினோதமான விஷயம் என்னவென்றால், நான் இதுவரை இந்தத் தொடரில் பார்த்த தொழில்நுட்பங்கள் ராணுவத் துறையால் ஊக்குவிக்கப்பட்டு வளர்க்கப்பட்ட ஒன்று. ஆனால், இன்று ராணுவ மையங்கள் இந்தத் தொழில்நுட்பங்களை முற்றிலும் தவிற்கின்றன! உடைகளில் உணர்விகள், மற்றும் திறன்பேசியில் எதையாவது திருடும் மென்பொருள் என்ற எதையும் ராணுவ மையங்களில் எடுத்துச் செல்ல அனுமதி இல்லை. இன்றைய பாதுகாப்பு உலகின் மிகப் பெரிய கவலை, எப்படி ஒரு நோக்கத்துடன் உருவாக்கப்பட்ட ஒரு தொழில்நுட்பத்தை, வேறு ஒரு பாதுகாப்பு பிரச்னையை உருவாக்க பயன்படுத்துவார்களோ என்ற அச்சம். உதாரணத்திற்கு, ஒரு  ரகசிய ராணுவ மையத்தில் இருக்கும் எல்.ஈ.டி. மின் விளக்கு பழுதானதை இணையத்தில் அறிவிக்கிறது என்று வைத்துக் கொள்வோம். இதை எளிய முறையில், இணைய விஷமிகள், இந்த ரகசிய ராணுவ மையம் இருக்கும் இடத்தை அறியப் பயன்படுத்தலாம். ஒரு மிக உயரக் கட்டிடத்தில் உள்ள காற்று மாசு அளக்கும் கருவி, எத்தனை உயரத்தில் தடைகள் இல்லாமல் அந்த நகரின் மேல் தானியங்கி பறக்கும் ஊர்த்தி பறக்க வேண்டும் என்பதையும் சொல்லிவிடப் பயன்படுத்தலாம்.

மிகவும் போரடிக்கும் போர் பயன்பாடு

சொன்னால் நம்ப மாட்டீர்கள். ராணுவ கருவி இணையப் பயன்பாடுகளின் மிகப் பெரிய பயன்பாடு – பொருட்களின் இருப்புப் பட்டியல். பொதுவாக, ராணுவமாகட்டும், விமான படையாகட்டும், கப்பற்படையாகட்டும், யாவுமே மிகவும் விலையுயர்ந்த எந்திரங்களைப் பயன்படுத்தும் அமைப்புகள். ஒரு போர் விமானம் பல கோடி ரூபாய் மதிப்புள்ளது. ஒவ்வொரு ஆண்டும் தூக்கிப் போட்டுவிட்டு இன்னொன்று வாங்க ஒன்றும் திறன்பேசியல்ல. பல வருடங்கள், இவ்வகை எந்திரங்கள் பராமரிக்கப்பட வேண்டும். பராமரிப்பு என்பது பாதுகாப்பு படையினரின் மிகப் பெரிய பிரச்னை.

RFID தொழில்நுட்பம் மிகவும் முக்கியமான ஒன்று. ராணுவ தளவாடங்களின் பல கோடி உதிரி பாகங்களின் இருப்பை கண்காணிக்க வேண்டியது ராணுவ, விமான, கப்பல்துறையின் முக்கிய வேலை. கோடிக் கணக்கில் விலை உயர்ந்த உதிரி பாகங்களை கண்காணிக்க RFID  மிகவும்  உதவும் – ஒரு உதிரி பாகம் எந்த டிப்போவில் உள்ளது என்பதோடு நிற்காமல், டிப்போவின் எந்த தளத்தில், எந்த அலமாரியில் உள்ளது என்று எங்கிருந்து வேண்டுமானாலும் துல்லியமாக தெரிந்து கொள்ளலாம். ஒரு ராணுவ எந்திரம் அல்லது ஊர்த்தி பயன்படும் வகையில் இருக்க இவ்வகைச் செயல்திறன் மிகவும் அவசியம்.

உதிரி பாகங்களைத் தயாரிக்கும் நிறுவனத்திற்கும், இது மிகவும் தோதான விஷயம். பல தரமான ராணுவ காண்ட்ராக்டர்கள், உதிரி பாக்ங்களை, உடனுக்குடன் தயாரித்து ராணுவத் தேவையை பூர்த்தி செய்யவும் உதவுகிறது. இவ்வகை RFID தாங்கிய பாகங்களை ரோபோக்கள் கொண்டு கையாளவும் பயன்படும்.

இவ்வகை பராமரிப்பு வேலைகளில் உதிரி பாகங்களை வைப்பில் வைத்திருப்பது, மாற்றுவது என்பது பழைய முறை. இன்று, மேற்குலகில், பழுது அடையுமுன், எப்படி இவற்றை மாற்றி எந்திரத்தை தயார் நிலையில் வைத்திருப்பது என்று கருவி இணைய முறைகளைப் பயன்படுத்தத் தொடங்கியுள்ளனர். உதிரி பாகங்களின் இயக்க நேரத்தை அளவிடுவது, அவற்றின் சூழல் அளவுகளை அளப்பது (வெப்பம், அழுத்தம், உராய்வு) போன்ற கருவி இணைய முயற்சிகள், தகுந்த நேரத்தில், பாகங்களை மாற்றப் பயன்படுகிறது.

 

 ராணுவத் திறன் ரோபோக்கள்

கன்னிவெடிகளைத் தகர்ப்பது என்பது ராணுவத்தில் நிகழும் அன்றாட செயல். மிகவும் அபாயமான இச்செயலை ரோபோக்கள் மிகவும் எளிதில், அதிக சேதமின்றி செய்ய கருவி இணைய முயற்சிகள் உதவுகின்றன. இவ்வகை ரோபோக்களில், சில முக்கிய உணர்விகள் உதவுகின்றன;

  1. தூரத்தை அளக்கும் துல்லிய காமிரா
  2. கரடு முரடான பாதையைக் கடக்க உதவும் நிலை உணர்விகள்
  3. துல்லியமாக நகர உதவும் ஜி,பி.எஸ். உணர்விகள்
  4. சரியாக கன்னிவெடியைக் குறி பார்க்க உதவும் உணர்விகள்

பாதுகாப்பான தூரத்திலிருந்து கம்பியில்லா தொடர்புமூலம் இவ்வகை ரோபோக்களை இயக்கலாம். கார்பன் நாறுகளால் செய்யப்பட்டிருப்பதால், குண்டு வெடித்து உருவாகும் வெப்பத்தை தாங்கக் கூடிய வகையில் உருவாக்கப்பட்ட ரோபோக்கள் இவை.

 Part16-Pic4

 

இணையப் பாதுகாப்பு அச்சுறுத்தல்கள்

கருவி இணைய பாதுகாப்பு முயற்சிகளைப் பற்றி எழுதும் பொழுது, இணையப் பாதுகாப்பு முயற்சிகளைப் பற்றி சொல்லியே ஆக வேண்டும். 21 –ஆம் நூற்றாண்டின் மிகப் பெரிய பின்னேற்றம் நிழல் போர்கள். எதிரி யாரென்று தெரியாமலே போர் நிகழ்த்துவது இந்த மின்னணுவியல் யுகத்தின் ஒரு அலாதியான விஷயம். இன்று, இந்த நிழல் போர், இணையத்தில் நிகழ்த்தப்படுகிறது.

  1. நிழல் போர்களை உணர்வது என்பது முதற்படி. பெரும்பாலும், இவை, ஒரு நாட்டிற்கு எதிரான தீவிர இணைய டிஜிட்டல் பிரச்சாரம்
  2. இந்த பிரச்சாரத்திற்குப் பின்னால், பல பயங்கரவாத அமைப்புகள், சாதாரணர்களை பிரச்சாரத்தால் மயக்கி ஆயுதம் ஏந்தச் செய்யும் முயற்சிகள்
  3. இவ்வகை நிழல் போர்களைத் தகர்ப்பது மிகவும் கடினமான ஒன்று. எங்கிருந்து இவ்வகைப் பிரச்சாரங்கள் உருவாகின்றன, இந்த அமைப்புகளின் கட்டமைப்பு எப்படிப்பட்டது என்பதெல்லாம் கண்டறிய ஏராளமான மனிதத் திறன் தேவை
  4. இவ்வகை முயற்சிகளை தகர்த்து எறிய கருவி இணைய தொழில்நுட்பம் எப்படி உதவும்? நாம் இதுவரை பார்த்த நம்மால் தொடக்கூடிய கருவிகள் இங்கு பயன்படாது. உலகில் உள்ள அத்தனை நிழல் போராளிகளையும் கண்காணிக்க போதுமான அளவு மனிதவளமும், பயிற்சியும் எந்த அரசாங்கத்திடமும் இல்லை
  5. இதனால், இவ்வகை முயற்சிகளை, சில தேர்ந்த திறமையாளர்களின் முறைகளை, கணினி செயற்கை புத்திசாலி நிரல்கள் கொண்டு (அதாவது, நிழல் கருவிகள்) இணையம் முழுவதும் ஒவ்வொரு நாளும் முளைக்கும் நிழல் அமைப்புகளை தகர்க்க அமெரிக்க பாதுகாப்பு அமைப்புகள் முயன்று வருகின்றன

ராணுவக் கருவி இணைய முயற்சிகள் ரகசியமானவை. இவற்றை உருவாக்கும் பல ஒப்பந்த நிறுவனங்களும் இந்த முயற்சிகள் பற்றி அதிகம் பொதுவெளியில் எதுவும் சொல்வதில்லை. பல மேற்குலக ராணுவங்களின் அடுத்த 25 ஆண்டு திட்டங்கள் பொதுவெளியில் இருந்தாலும், இதில் அதிக விவரங்கள் இருப்பதில்லை. ரகசிய ஜி.பி.எஸ்.,புதிய உணர்விகள்,  தானியங்கி பறக்கும் ஊர்த்திகள் மற்றும் வீரரின் பாதுகாப்பிற்கான புது முயற்சிகள் என்று மேலெழுந்தவாரியாக இந்தத் திட்டங்கள் விளக்கும். ஆனால், உருவாக்கப்படும் கருவிகளின் உண்மையான செயல்பாடுகள், மற்றும் சக்தி பாதுகாப்பு காரணங்களுக்காக அதிகம் விளக்கப்படுவதில்லை.

சொல்வனம் – ஏப்ரல் 2016