نيٽ ورڪ پيڪٽ بروکر ۾ ڊيٽا ماسڪنگ ٽيڪنالاجي ۽ حل ڇا آهي؟

1. ڊيٽا ماسڪنگ جو تصور

ڊيٽا ماسڪنگ پڻ سڏيو ويندو آهي ڊيٽا ماسڪنگ. حساس ڊيٽا کي تبديل ڪرڻ، تبديل ڪرڻ يا ڍڪڻ جو هڪ ٽيڪنيڪل طريقو آهي جيئن ته موبائل فون نمبر، بئنڪ ڪارڊ نمبر ۽ ٻي معلومات جڏهن اسان ماسڪنگ جا ضابطا ۽ پاليسيون ڏنيون آهن. هي ٽيڪنڪ بنيادي طور تي استعمال ڪيو ويندو آهي حساس ڊيٽا کي سڌو سنئون ناقابل اعتماد ماحول ۾ استعمال ٿيڻ کان روڪڻ لاء.

ڊيٽا ماسڪنگ اصول: ڊيٽا ماسڪنگ کي اصل ڊيٽا جي خاصيتن، ڪاروباري ضابطن، ۽ ڊيٽا جي مطابقت کي برقرار رکڻ گهرجي انهي کي يقيني بڻائڻ لاءِ ته ايندڙ ترقي، جانچ ۽ ڊيٽا جي تجزيي کي ماسڪنگ کان متاثر نه ڪيو ويندو. ماسڪنگ کان اڳ ۽ بعد ۾ ڊيٽا جي مطابقت ۽ صحيحيت کي يقيني بڻايو وڃي.

2. ڊيٽا ماسڪنگ جي درجه بندي

ڊيٽا ماسڪنگ کي ورهائي سگھجي ٿو جامد ڊيٽا ماسڪنگ (SDM) ۽ متحرڪ ڊيٽا ماسڪنگ (DDM).

جامد ڊيٽا ماسڪنگ (SDM): جامد ڊيٽا ماسڪنگ جي ضرورت آهي هڪ نئين غير پيداوار ماحول واري ڊيٽابيس جي قيام جي پيداوار جي ماحول کان الڳ ڪرڻ لاء. حساس ڊيٽا کي پيداوار جي ڊيٽابيس مان ڪڍيو ويندو آهي ۽ پوء غير پيداوار ڊيٽابيس ۾ ذخيرو ٿيل آهي. هن طريقي سان، غير حساس ٿيل ڊيٽا پيداوار جي ماحول کان الڳ ٿي وئي آهي، جيڪو ڪاروباري ضرورتن کي پورو ڪري ٿو ۽ پيداوار جي ڊيٽا جي حفاظت کي يقيني بڻائي ٿو.

ايس ڊي ايم

متحرڪ ڊيٽا ماسڪنگ (DDM): اهو عام طور تي پيداوار جي ماحول ۾ استعمال ڪيو ويندو آهي حقيقي وقت ۾ حساس ڊيٽا کي غير حساس ڪرڻ لاء. ڪڏهن، مختلف حالتن ۾ ساڳئي حساس ڊيٽا کي پڙهڻ لاءِ ماسڪنگ جي مختلف سطحن جي ضرورت پوندي آهي. مثال طور، مختلف ڪردار ۽ اجازتون مختلف ماسڪنگ اسڪيمون لاڳو ڪري سگھن ٿيون.

ڊي ڊي ايم

ڊيٽا رپورٽنگ ۽ ڊيٽا مصنوعات ماسڪنگ ايپليڪيشن

اهڙن منظرنامن ۾ خاص طور تي شامل آهن اندروني ڊيٽا مانيٽرنگ پراڊڪٽس يا بل بورڊ، خارجي سروس ڊيٽا پروڊڪٽس، ۽ رپورٽون ڊيٽا جي تجزيي جي بنياد تي، جهڙوڪ ڪاروباري رپورٽون ۽ پروجيڪٽ جو جائزو.

ڊيٽا رپورٽنگ پيداوار ماسڪنگ

3. ڊيٽا ماسڪنگ حل

عام ڊيٽا ماسڪنگ اسڪيمن ۾ شامل آهن: باطل ڪرڻ، بي ترتيب قيمت، ڊيٽا متبادل، سميٽرڪ انڪرپشن، اوسط قدر، آفسيٽ ۽ گولنگ وغيره.

باطل ٿيڻ: غلطيءَ مان مراد حساس ڊيٽا جي انڪرپشن، ٽرنڪشن، يا لڪائڻ. هي اسڪيم عام طور تي حقيقي ڊيٽا کي خاص علامتن سان تبديل ڪري ٿو (جهڙوڪ *). آپريشن سادو آهي، پر صارف اصل ڊيٽا جي فارميٽ کي نٿا ڄاڻن، جيڪو شايد ايندڙ ڊيٽا ايپليڪيشنن کي متاثر ڪري سگھي ٿو.

بي ترتيب قدر: بي ترتيب قدر حساس ڊيٽا جي بي ترتيب واري متبادل ڏانهن اشارو ڪري ٿو (انگن اکرن کي تبديل ڪري ٿو، اکر کي اکرن کي تبديل ڪري ٿو، ۽ اکرن کي اکرن کي تبديل ڪري ٿو). هي ماسڪنگ جو طريقو هڪ خاص حد تائين حساس ڊيٽا جي فارميٽ کي يقيني بڻائيندو ۽ ايندڙ ڊيٽا ايپليڪيشن کي آسان بڻائيندو. ڪجهه معنيٰ وارا لفظ، جهڙوڪ ماڻهن ۽ هنڌن جا نالا، لاءِ ڊڪشنري کي ماسڪنگ جي ضرورت پئجي سگھي ٿي.

ڊيٽا مٽائڻ: ڊيٽا جي بدلي null ۽ random قدرن جي نقاب ڪرڻ سان ملندڙ جلندڙ آهي، سواءِ ان جي ته خاص اکر يا random values ​​استعمال ڪرڻ بدران، masking ڊيٽا کي هڪ مخصوص قدر سان تبديل ڪيو ويندو آهي.

Symmetric Encryption: Symmetric encryption هڪ خاص reversible masking طريقو آهي. اهو حساس ڊيٽا کي انڪرپشن ڪيز ۽ الگورتھم ذريعي انڪرپٽ ڪري ٿو. ciphertext فارميٽ منطقي قاعدن ۾ اصل ڊيٽا سان مطابقت رکي ٿي.

سراسري: سراسري اسڪيم اڪثر شمارياتي منظرنامي ۾ استعمال ٿيندو آهي. عددي انگن اکرن لاءِ، اسان پھريائين انھن جي معنيٰ کي ڳڻون ٿا، ۽ پوءِ بي ترتيبيءَ سان مطلب جي چوڌاري غير حساس قدرن کي ورهايو، اھڙيءَ طرح ڊيٽا جو مجموعو برقرار رکيو وڃي.

آفسيٽ ۽ گولنگ: هي طريقو بي ترتيب واري شفٽ ذريعي ڊجيٽل ڊيٽا کي تبديل ڪري ٿو. آفسٽ گولنگ ڊيٽا جي حفاظت کي برقرار رکڻ دوران رينج جي تقريبن صداقت کي يقيني بڻائي ٿي، جيڪا اڳئين اسڪيمن جي ڀيٽ ۾ حقيقي ڊيٽا جي ويجهو آهي، ۽ وڏي ڊيٽا جي تجزيي جي منظرنامي ۾ وڏي اهميت رکي ٿي.

ML-NPB-5660-数据脱敏

تجويز ڪيل ماڊل "ML-NPB-5660"ڊيٽا ماسڪنگ لاءِ

4. عام طور تي استعمال ٿيل ڊيٽا ماسڪنگ ٽيڪنڪس

(1). شمارياتي ٽيڪنڪس

ڊيٽا جي نموني ۽ ڊيٽا گڏ ڪرڻ

- ڊيٽا جو نمونو: ڊيٽا سيٽ جي نمائندي سبسيٽ کي منتخب ڪندي اصل ڊيٽا سيٽ جو تجزيو ۽ جائزو ڊي-شناختي ٽيڪنالاجي جي اثرائتي کي بهتر ڪرڻ لاء هڪ اهم طريقو آهي.

- ڊيٽا جو مجموعو: انگن اکرن جي مجموعن جي طور تي (جهڙوڪ مجموعو، ڳڻپ، اوسط، وڌ ۾ وڌ ۽ گهٽ ۾ گهٽ) مائڪروڊيٽا ۾ خاصيتن تي لاڳو ڪيو ويو آهي، نتيجو اصل ڊيٽا سيٽ ۾ سڀني رڪارڊ جو نمائندو آهي.

(2). Cryptography

Cryptography هڪ عام طريقو آهي desensitize يا desensitization جي اثرائتي کي وڌائڻ لاءِ. مختلف قسم جا انڪرپشن الگورٿمس مختلف غير حساسيت اثرات حاصل ڪري سگھن ٿا.

- Deterministic encryption: هڪ غير بي ترتيب سميٽرڪ انڪرپشن. اهو عام طور تي ID ڊيٽا کي پروسيس ڪري ٿو ۽ جڏهن ضروري هجي ته اصل ID ڏانهن ciphertext کي ڊڪرپٽ ۽ بحال ڪري سگهي ٿو، پر اهم کي صحيح طور تي محفوظ ڪرڻ جي ضرورت آهي.

- Irreversible encryption: هيش فنڪشن ڊيٽا کي پروسيس ڪرڻ لاءِ استعمال ڪيو ويندو آهي، جيڪو عام طور تي ID ڊيٽا لاءِ استعمال ٿيندو آهي. اهو سڌو سنئون ڊريڪٽ نه ٿو ٿي سگهي ۽ ميپنگ رشتي کي محفوظ ڪيو وڃي. ان کان سواء، هيش فنڪشن جي خاصيت جي ڪري، ڊيٽا جي ٽڪراء ٿي سگھي ٿي.

- Homomorphic encryption: ciphertext homomorphic algorithm استعمال ڪيو ويندو آهي. ان جي خاصيت اها آهي ته ciphertext آپريشن جو نتيجو ساڳيو ئي هوندو آهي جيڪو decryption کان پوءِ پلين ٽيڪسٽ آپريشن جو. تنهن ڪري، اهو عام طور تي عددي شعبن کي پروسيس ڪرڻ لاء استعمال ڪيو ويندو آهي، پر اهو ڪارڪردگي سببن لاء وڏي پيماني تي استعمال نه ڪيو ويو آهي.

(3). سسٽم ٽيڪنالاجي

دٻائڻ واري ٽيڪنالاجي ڊيٽا جي شين کي حذف ڪري ٿو يا محفوظ ڪري ٿو جيڪي رازداري تحفظ کي پورا نه ڪن، پر انهن کي شايع نه ڪن.

- ماسڪنگ: اهو سڀ کان عام desensitization طريقو ڏانهن اشارو ڪري ٿو وصف قدر کي نقاب ڪرڻ لاءِ، جهڙوڪ مخالف نمبر، شناختي ڪارڊ ستاري سان نشان لڳل آهي، يا پتو ڪٽيو ويو آهي.

- مقامي دٻاءُ: مخصوص وصف قدرن (ڪالمن) کي حذف ڪرڻ جي عمل ڏانهن اشارو ڪري ٿو، غير ضروري ڊيٽا فيلڊ کي هٽائڻ؛

- رڪارڊ دٻائڻ: مخصوص رڪارڊ (قطار) کي ختم ڪرڻ جي عمل ڏانهن اشارو ڪري ٿو، غير ضروري ڊيٽا رڪارڊ کي ختم ڪرڻ.

(4). تخلص ٽيڪنالاجي

Pseudomanning هڪ غير سڃاڻپ واري ٽيڪنڪ آهي جيڪا هڪ تخلص استعمال ڪندي سڌي سڃاڻپ ڪندڙ (يا ٻيو حساس سڃاڻپ ڪندڙ) کي تبديل ڪرڻ لاءِ. تخلص جي ٽيڪنڪ هر فرد جي معلوماتي مضمون لاءِ منفرد سڃاڻپ ڪندڙ ٺاهي ٿي، بجاءِ سڌي يا حساس سڃاڻپ ڪندڙ.

- اهو آزاد طور تي بي ترتيب قدر پيدا ڪري سگھي ٿو اصل ID سان ملندڙ، ميپنگ ٽيبل کي محفوظ ڪري، ۽ ميپنگ ٽيبل تائين پهچ کي سختي سان ڪنٽرول ڪري سگھي ٿو.

- توهان تخلص پيدا ڪرڻ لاءِ انڪرپشن پڻ استعمال ڪري سگهو ٿا، پر ڊيڪرپشن ڪيٻي کي صحيح رکڻ جي ضرورت آهي؛

هي ٽيڪنالاجي وڏي تعداد ۾ آزاد ڊيٽا استعمال ڪندڙن جي صورت ۾ وڏي پيماني تي استعمال ٿئي ٿي، جهڙوڪ OpenID کليل پليٽ فارم جي منظرنامي ۾، جتي مختلف ڊولپرز هڪ ئي صارف لاءِ مختلف Openids حاصل ڪندا آهن.

(5). عام ڪرڻ جي ٽيڪنڪس

جنرلائيزيشن ٽيڪنڪ هڪ ڊي-سڃاڻپ ٽيڪنڪ ڏانهن اشارو ڪري ٿو جيڪا ڊيٽا سيٽ ۾ چونڊيل خاصيتن جي گرينولرٽي کي گھٽائي ٿي ۽ ڊيٽا جي وڌيڪ عام ۽ تجريدي وضاحت فراهم ڪري ٿي. عام ٽيڪنالاجي کي لاڳو ڪرڻ آسان آهي ۽ رڪارڊ-سطح جي ڊيٽا جي صداقت جي حفاظت ڪري سگهي ٿي. اهو عام طور تي ڊيٽا جي شين يا ڊيٽا رپورٽن ۾ استعمال ٿيندو آهي.

- گول ڪرڻ: منتخب ٿيل وصف لاءِ گولنگ جو بنياد چونڊڻ شامل آھي، جھڙوڪ مٿاھينءَ يا ھيٺيون فارنڪس، حاصل ڪندڙ نتيجا 100، 500، 1K، ۽ 10K

- مٿيون ۽ هيٺيون ڪوڊنگ ٽيڪنڪ: قدرن کي تبديل ڪريو مٿي (يا هيٺيون) حد جي حد سان جيڪو مٿين (يا هيٺيون) سطح جي نمائندگي ڪري ٿو، نتيجو حاصل ڪري ٿو "مٿي X" يا "هيٺ X" جو نتيجو.

(6). randomization ٽيڪنڪس

هڪ قسم جي ڊي-سڃاڻپ ٽيڪنڪ جي طور تي، randomization ٽيڪنالاجي جو حوالو آهي randomization ذريعي هڪ خاصيت جي قدر کي تبديل ڪرڻ، ته جيئن randomization کان پوءِ جو قدر اصل حقيقي قدر کان مختلف هجي. اهو عمل هڪ حملي ڪندڙ جي صلاحيت کي گهٽائي ٿو هڪ خاصيت جي قيمت حاصل ڪرڻ لاءِ ساڳئي ڊيٽا رڪارڊ ۾ ٻين خاصيتن جي قدرن مان، پر نتيجن جي ڊيٽا جي صداقت کي متاثر ڪري ٿو، جيڪا پيداوار ٽيسٽ ڊيٽا سان عام آهي.


پوسٽ ٽائيم: سيپٽمبر-27-2022