डाटा का खेल : बड़े धोखे हैं इस राह में
प्रवीण कुमार
डाटा हमारी जिंदगी का अहम हिस्सा बन चुका है। जाहिर है हमारी तमाम आर्थिक जानकारी, संपर्क सूत्र, बॉयोमेट्रिक पहचान, घर और दफ्तर का पता, हमारी दैनिक गतिविधियों पर कुछ खास संस्थानों की नजर होंगी। हाल में कुछ ऐसी रिपोर्ट्स सामने आईं जिनमें कहा गया कि गूगल पर मेरा आधार, मेरी पहचान सर्च करने पर कथित तौर पर आधार की पीडीएफ फाइल उपलब्ध हो जाती है। इसके बाद आधार कार्ड जारी करने वाली संस्था भारतीय विशिष्ट पहचान प्राधिकरण (यूआईडीएआई) ने लोगों को किसी भी सेवा का लाभ लेने के लिए इंटरनेट पर आधार जैसी अपनी व्यक्तिगत जानकारी साझा करते समय सावधानी बरतने के लिए कहा है। इसके अलावा पिछले दिनों दुनिया के तीन सर्वाधिक प्रसिद्ध अखबार- द न्यूयॉर्क टाइम्स, द गार्डियन और द ऑब्जर्वर में प्रकाशित खबरों ने यह खुलासा किया कि एक अंतरराष्ट्रीय डाटा कंसल्टेंसी कंपनी कैंब्रिज एनालिटिका ने जो उपभोक्ताओं के बिहेवियर को बदलने में व्यवसाय करने वाली कंपनियों और राजनीतिक दलों की मदद करती है, करोड़ों फेसबुक उपभोक्ताओं के डाटा पर हाथ साफ किया है। ऐसे में सवाल यह उठता है कि हमारा जो भी डेटा (पहचान, पता-ठिकाना आदि) साइबर संसार में यहां-वहां बिखरा पड़ा है, वह कितना सुरक्षित है और उसे कैसे सुरक्षित रखा जा रहा है।
भारत में सोशल मीडिया की पहुंच अपेक्षाकृत कम है। देश की कुल आबादी का करीब 20 प्रतिशत हिस्सा ही फेसबुक का इस्तेमाल करता है और इस देश में आज भी लाखों गांव हैं जहां बिजली नहीं पहुंची है। बावजूद इसके फेसबुक उपयोगकर्ताओं की संख्या भारत में 24 करोड़ की सीमा को पार कर चुकी है और आज फेसबुक के सबसे ज्यादा उपयोगकर्ता भारत में ही हैं। डाटा सुरक्षा को लेकर हमारे यहां जागरूकता का घोर अभाव है। वे सभी चीजें हम अपने उन आभासी मित्रों के साथ साझा करते हैं जिनमें से कुछ के साथ हम सिर्फ एकाध बार मिले हैं या कभी नहीं मिले हैं। जाहिर है ऐसे में कोई तीसरा पक्ष इन चीजों का इस्तेमाल कर ही सकता है। नए फेसबुक अकाउंट में गोपनीयता संबंधी सेटिंग में डिफॉल्ट आपके मित्र को आपकी कुछ जानकारियां तीसरे पक्ष के ऐप के साथ साझा करने का मौका देता है और संभव है कि आपको या आपके मित्र को इसकी कोई सूचना न हो कि क्या हो रहा है और साझा किए गए डाटा आपके प्रोफाइल पोस्टों से परे जाता है जिसमें आप कब लॉग ऑन रहते हैं इसकी जानकारी के साथ मित्रों की सूची के विवरण भी शामिल होते हैं। अपने पुराने मित्रों और परिवार के साथ वास्तविक समय बिताने के बजाय जब आप जान-बूझकर या गलती से अपनी छुट्टी की अंतरंग जानकारियां साझा करते हैं तो आप वास्तव में डाटा व्यवसाय के एक बड़े खेल में खुद को मोहरा बनाकर पेश करते हैं। इसके कई परिणाम होते हैं। पहली बात तो यह है कि अगर आप आभासी दुनिया के किसी मित्र पर ज्यादा समय खर्च करते हैं तो आपके वास्तविक जीवन के संबंध प्रभावित हो सकते हैं। दूसरी बात यह कि आपको यह अच्छी तरह से समझ में आनी चाहिए कि जीवन में कुछ भी मुफ्त नहीं मिलता है। फेसबुक, ट्विटर, इंस्टाग्राम आदि को आप भले ही मुफ्त समझते हों, लेकिन ये भी वास्तव में मुफ्त नहीं हैं। उनका व्यवसायिक मॉडल उन सभी सूचनाओं का उपयोग करता है जिन्हें आप और हम अपने, हमारे मित्रों, परिवारों के बारे में मुफ्त में डाल रहे हैं। यह डाटा बन जाता है और संभावित रूप से व्यावसायिक या अन्य उद्देश्यों के लिए इसका इस्तेमाल किया जा सकता है अथवा जैसा कि किसी ने कहा है कि यदि आप उत्पाद के लिए भुगतान नहीं कर रहे हैं तो आप खुद उत्पाद हैं। ऐसे में बड़ा सवाल यही उठता है कि हमारा डाटा चोरी न हों इसके लिए क्या किया जाए? इस सवाल का जवाब जानने से पहले हमें साइबर वर्ल्ड और डाटा एन्क्रिप्शन से संबंधित कुछ अहम तथ्य जानने जरूरी हैं।
क्रिप्टोग्राफी क्या है?
क्रिप्टोग्राफी मूल रूप से एक ग्रीक शब्द है, जो गुप्त और लिखावट का मिला-जुला अर्थ देता है। यह एक प्रकार का कूट-लेखन (इनकोड) है, जिसमें भेजे गये संदेश या जानकारी को सांकेतिक शब्दों में बदल दिया जाता है। इसे भेजने वाला या पाने वाला ही पढ़ सकता या खोल सकता है। क्रिप्टोग्राफी का संबंध डाटा की सुरक्षा और उससे संबंधित विषयों, विशेषकर एनक्रिप्शन से होता है। वर्तमान में जो क्रिप्टोसिस्टम हम देखते हैं, उसकी शुरुआत 1970 के दशक में हुई थी। तब अमेरिकी सरकार ने डाटा एन्क्रिप्शन स्टैंडर्ड तैयार किया था जिसमें 56 बिट की सीक्रेट-की का इस्तेमाल होता था। इसकी सीमाओं को देखते हुए जल्द ही एडवांस एन्क्रिप्शन स्टैंडर्ड सामने आया, जिसमें कम-से-कम 126 बिट की सीक्रेट-की का इस्तेमाल होता था। आज यह इंटरनेट जगत में सबसे अधिक उपयोग में लाया जाने वाला क्रिप्टोसिस्टम है। यह एक बहुविषयक विषय है, जो कई क्षेत्रों से जुड़ा होता है। कुछ दशकों पहले तक क्रिप्टोग्राफी मूल रूप से भाषा से जुड़ी होती थी, पर वर्तमान डिजिटल दौर में क्रिप्टोग्राफी में मैथमैटिक्स, नंबर थ्योरी, इंफॉर्मेशन थ्योरी, कंप्यूटेशनल कॉम्प्लेक्सिटी, स्टैटिस्टिक्स और कॉम्बिमेटोरिक्स का भरपूर प्रयोग होता है। क्रिप्टोग्राफी कम्प्यूटर और नेटवर्क सिक्योरिटी के लिये प्रयुक्त की जाती है।
क्या है डाटा एन्क्रिप्शन?
कंप्यूटर पर हम सामान्यतया जिस फाइल में काम करते हैं, उसे टेक्स्ट फॉर्मेट फाइल कहते हैं, जिसे कोई भी पढ़ या समझ सकता है। लेकिन जब हम यह चाहते हैं कि फाइल में जो लिखा है उसे कोई अन्य पढ़ न पाए तो उसे एन्क्रिप्ट करना होता है। इसके बाद इसमें लिखा हुआ टेक्स्ट कुछ इस तरह दिखाई देता है जिसे पढ़ना लगभग असंभव होता है। इस प्रक्रिया को डाटा एन्क्रिप्शन कहते हैं। इंटरनेट पर डेटा को सुरक्षित रखने के लिए एन्क्रिप्शन किया जाता है, जो इसे हैक होने से बचाता है और उसका गलत प्रयोग होने की आशंका नहीं रहती। एन्क्रिप्शन एक ऐसी तकनीक है जो इंफार्मेशन को एक अपठनीय कोड भाषा में परिवर्तित कर देता है, जिसे एक्सेस करना कठिन होता है। डाटा या इंफार्मेशन को एन्क्रिप्ट करने के लिए एक की का प्रयोग होता है जो सेंडर और रिसीवर के पास सुरक्षित होती है। डेटा को एक एल्गोरिथम द्वारा एन्क्रिप्ट किया जाता है जिसे Cipher कहते हैं। इससे एन्क्रिप्टेड जानकारी मिलती है और एन्क्रिप्ट की गई जानकारी या सूचना को Ciphertext कहते हैं। एन्क्रिप्ट होने के बाद डाटा पूरी तरह से सुरक्षित हो जाता है। एन्क्रिप्ट की गई जानकारी को फिर से पढ़ने योग्य बनाने की प्रक्रिया को डिक्रिप्शन कहा जाता है। इस प्रक्रिया में भी उसी की का प्रयोग होता है, जिससे डाटा एन्क्रिप्ट किया गया था।
डाटा को 100 प्रतिशत सुरक्षित करने की प्रक्रिया को एंड-टू-एंड एन्क्रिप्शन कहा जाता है। अर्थात् ऐसे डाटा को केवल भेजने वाले और जिसके लिये ये मैसेज होगा (रिसीवर) वही देख सकते हैं। एंड-टू-एंड एन्क्रिप्शन लागू होने के बाद कोई तीसरा इसे देख, पढ़ या समझ नहीं सकता और इसे कोई ट्रेस भी नहीं कर सकता। ऐसे भेजे हुए सभी मैसेज, फोटो, वीडियो, फाइल और वॉयस मैसेज, सूचनाएं तथा अन्य सभी जानकारियां 100 प्रतिशत सुरक्षित हो जाते हैं। एंड-टू-एंड एन्क्रिप्शन के बाद साइबर अपराधी और हैकर्स भी इसे नहीं पढ़ सकते क्योंकि यह 256 बिट स्ट्रॉन्ग होता है, जिसे हैकर्स ब्रूट फोर्स मेथड से भी क्रैक नहीं कर सकते।
पब्लिक और प्राइवेट की क्या है?
एन्क्रिप्शन में डाटा एन्क्रिप्ट करने के लिये एल्गोरिथम का उपयोग किया जाता है और इसे केवल एक विशेष की के उपयोग से डिक्रिप्ट किया जा सकता है। व्यापक रूप से प्रयुक्त एन्क्रिप्शन विधियों में से प्राइवेट की एन्क्रिप्शन और पब्लिक की एन्क्रिप्शन हैं। प्राइवेट की एन्क्रिप्शन में सेंडर और रिसीवर डेटा को एन्क्रिप्ट करने के लिये समान की साझा करते हैं। अर्थात् दोनों पक्ष एक ही की को डेटा के एन्क्रिप्शन और डिक्रिप्शन के लिए उपयोग करते हैं। पब्लिक की एन्क्रिप्शन में दो भिन्न, लेकिन गणित से संबंधित की का उपयोग किया जाता है। पब्लिक की एन्क्रिप्शन में आपको लॉक करने के लिये एक की और अनलॉक करने के लिये एक अन्य की चाहिये होती है। एक की को दूसरे के स्थान पर इस्तेमाल नहीं किया जा सकता।
आधार का क्रिप्टोसिस्टम
आधार का बायोमेट्रिक सॉफ्टवेयर बाहर से मंगाया गया है, लेकिन डाटा नियंत्रण यूआईडीएआई के पास है। एक आधार कार्ड पर आने वाली लागत एक डॉलर से भी कम है और आधार के 6000 सर्वर इंटरनेट से नहीं जुड़े हैं। आधार का सारा बॉयोमेट्रिक डाटा 2048 बिट एनक्रिप्शन से सुरक्षित है और इसे चुरा पाना किसी के लिए भी असंभव है। इसके लिए इस समय दुनिया में मौजूद सबसे उन्नत एन्क्रिप्शन पब्लिक की PKI 2048 और AES 256 का इस्तेमाल किया जा रहा है। ये 248 और 256 बिट सिस्टम पर काम करते हैं। इसकी एन्क्रिप्शन-की (तीन अंकों का सुरक्षित लॉकिंग सिस्टम) को तीन सुपरकंप्यूटर भी अनंत काल तक नहीं तोड़ सकते। यूआईडीएआई आधार से जुड़ी कोई भी जानकारी किसी से साझा नहीं करता, सिर्फ केवाईसी के लिए ही निजी जानकारी दी जाती है। यदि किसी आधार कार्ड से कोई लेन-देन होता है तो यूआईडीएआई लोकेशन या लेन-देन के उद्देश्य को इकट्ठा नहीं करता। बिग डाटा एक ऐसी प्रक्रिया है जिसके तहत डाटा के विशाल समूह एकत्रित किये जाते हैं और उनका विश्लेषण किया जाता है। वर्तमान युग डाटा का युग है और बिग डाटा और उसके विश्लेषण के माध्यम से दिये हुए पैटर्न को जानने, बाज़ार एवं उपभोक्ताओं के रुख का विश्लेषण करने का प्रयास किया जाता है। यही कारण है कि आर्थिक क्रियाकलापों में एवं अन्य विभिन्न क्षेत्रों में बिग डाटा का महत्त्वपूर्ण स्थान है। बिग डाटा अर्थव्यवस्था के विभिन्न क्षेत्रों को प्रभावित करने की क्षमता रखता है। इस संबंध में सबसे महत्त्वपूर्ण जरूरत ऐसी व्यवस्था बनाने की है जिससे डाटा की सुरक्षा की जा सके।
मेरे डाटा का मालिक कौन?
इस सवाल में यदि आप डाटा को किसी भौतिक वस्तु (जैसे-कार अथवा घर) से प्रतिस्थापित कर देते हैं तो इसका उत्तर बेशक मैं होगा। लेकिन डिजिटल वर्ल्ड में स्वामित्व की अवधारणा में कई परिवर्तन हुए हैं। सामग्री पर स्वामित्व के अलावा भी डाटा से संबंधित डाटा संरक्षण के कई ऐसे मंच हैं जो आपकी (व्यक्तिगत डाटा) और आपसे संबंधित डाटा (जिसका सृजन आपको, आपकी सामग्री और आपकी गतिविधियों को देखकर किया गया) की पहचान करते हैं। ये सभी इस बात पर जोर देते हैं कि आपके विषय में प्राप्त सूचनाओं जैसे- आपका नाम, पत्राचार का पता, फोन, ई-मेल, संपर्क प्राथमिकताएं और डेबिट/क्रेडिट कार्ड सूचनाओं को इन मंचों के माध्यम से उनकी सहयोगी कंपनियों, सामरिक भागीदारों अथवा अन्य सेवा प्रदाताओं के साथ साझा किया जा सकता है। इन डेटा में आपके व्यवसाय, भाषा, पिन कोड, क्षेत्र कोड, अद्वितीय डिवाइस पहचानकर्ता, यूआरएल, स्थान और समय, क्षेत्र जैसी सूचनाओं के साथ कुछ में मित्रों और पारिवारिक सदस्यों के विषय में जानकारियां भी शामिल हो सकती हैं। इसके अतिरिक्त आपका भौतिक स्थान और ऑनलाइन गतिविधियों को भी कई तकनीकी माध्यमों का उपयोग करके ट्रैक किया जा सकता है जबकि आप इनसे अनभिज्ञ रहते हैं। इन मंचों पर आपके डाटा पर पूर्ण स्वामित्व स्थापित कर लिया जाता है, जबकि वास्तविक स्वामी का अपने डाटा पर कोई अधिकार नहीं रह जाता।
बहरहाल, कंप्यूटर, मोबाइल और इंटरनेट इन तीन शब्दों में देश-दुनिया का ज्ञान, सामान, सेवाएं, जानकारियां, मनोरंजन, सूचनाएं समा गई हैं और आज इनके बिना जीवन की कल्पना नहीं की जा सकती। इन तीनों का डाटा से कुछ वैसा ही रिश्ता है, जो सांसों का हमारे शरीर के साथ है। आम आदमी की चिंता यह है कि उसका जो भी डाटा अंतहीन साइबर संसार में बिखरा पड़ा है, वह सुरक्षित रहे और इस मामले में उसकी सबसे बड़ी परेशानी यह है कि विज्ञान और तकनीक की भाषा उसकी समझ से बाहर है। सरकारी योजनाओं का फायदा लेने के लिए केंद्र ने आधार को जरूरी किया है। इसके खिलाफ तीन अलग-अलग याचिकाओं पर सुप्रीम कोर्ट में सुनवाई चल रही है, जिनमें आधार की कानूनी वैधता, डाटा सुरक्षा और इसे लागू करने के तरीकों को चुनौती दी गई है। वैसे भी इंटरनेट और मशीन के साथ कभी भी कोई समस्या आ सकती है। ऐसे में जरूरी है कि बायोमेट्रिक के अलावा प्रमाणीकरण की कोई अन्य व्यवस्था भी की जाए। फिलहाल ऐसी कोई व्यवस्था नहीं है, जिसके तहत अगर किसी के बायोमेट्रिक्स का मिलान न हो, तो ऐसे लोगों को ज़रूरी सेवाओं के लाभ से वंचित न किया जाए। वैसे आधार अधिनियम की धारा-7 में ऐसी ही दिक्कतों से निपटने की बात की गई है। भारत में आज 46 करोड़ से ज़्यादा इंटरनेट यूजर्स हैं और वे किसी-न-किसी रूप में डिजिटल सेवाओं से जुड़े हैं। इंटरनेट पर उनका डाटा किसी न किसी रूप में मौजूद है और यह सुनिश्चित करने वाला कोई नहीं है कि वह डाटा किस हद तक सुरक्षित है। इसलिए यह सुनिश्चित करने के लिए कि डाटा के स्वामी का अपने डाटा पर पूर्ण नियंत्रण है तथा वह प्रत्येक मंच जो डाटा का अनुसरण अथवा इसका उपयोग करता है, उसके लिये व्यापक स्वरूप में स्वीकार्य नोटिस, पसंद और सहमति, संग्रह सीमा, उद्देश्य सीमा, पहुंच और संशोधन मानदंड, सूचना मानकों का खुलासा, सुरक्षा, स्पष्टता और जवाबदेहिता पर भी पूर्ण नियंत्रण रखने के लिए एक तकनीकी ढांचे की अतिशीघ्र जरूरत है। जबतक यह तकनीक हमारे पास नहीं है तबतक के लिए डाटा एक नया ईंधन है- इस बात को अपने संबंध में जानकारी साझा करते वक्त कभी भूलना नहीं चाहिए। हमें सूचना के वैश्विक आदान प्रदान से काफी फायदा होता है जिसे फेसबुक और अन्य इंटरनेट प्लेटफॉर्म संभव बनाते हैं। लेकिन याद रखने की जरूरत है कि ये प्लेटफॉर्म पहले की तुलना में हमारे बारे में बहुत कुछ जानते हैं। निश्चित रूप से तकनीक से जिंदगी को काफा लाभ होता है लेकिन इसका एक पहलू जोखिम वाला भी होता है और इसमें यही ध्यान रखने की बात है कि जोखिम और लाभ के बीच कितना संतुलन बिठाकर आप आगे बढ़ते हैं।
कैंब्रिज एनालिटिका के पास है भारत के हर गांव का डाटा
डाटा लीक के आरोपों का सामना कर रही ब्रिटिश कंपनी कैंब्रिज एनालिटिका (सीए) के पास भारत के 600 जिलों व 6 लाख से अधिक गांवों के आंकड़े हैं। सीए के पूर्व रिसर्च प्रमुख क्रिस्टोफर वाइली की मानें तो कंपनी इन आंकड़ों को लगातार अपडेट करती है। वाइली के मुताबिक, सीए ने भारत में राजनीतिक दलों को जातिगत आंकड़ा भी मुहैया कराया है। इसके अलावा पार्टियों को वोटिंग पैटर्न के बारे में भी जानकारी बेची गई है। सीए भारत में स्ट्रैटजिक कम्युनिकेशंस लेबोरेटरी (एससीएल) के जरिये सक्रिय थी। जेडीयू नेता केसी त्यागी के बेटे अमरीश त्यागी अससीएल इंडिया के प्रमुख थे। एससीएल इंडिया का मुख्यालय गाजियाबाद स्थित इंदिरापुरम में है। इसके अलावा कटक, पटना, पुणे, गुवाहाटी, हैदराबाद, इंदौर, कोलकाता, अहमदाबाद और बेंगलुरु में क्षेत्रीय कार्यालय है। वाइली के मुताबिक, कैंब्रिज एनालिटिका एससीएल की पैरेंट कंपनी है और इसने 2003 से 2012 तक भारत के कई चुनावों में काम किया है।