1. Têgeha Masking Data
Maskekirina daneyan wekî maskkirina daneyan jî tê zanîn. Ew rêbazek teknîkî ye ku ji bo veguheztin, guheztin an vegirtina daneyên hesas ên wekî nimreya têlefona desta, nimreya qerta bankê û agahdariya din dema ku me rêgez û polîtîkayên maskkirinê dane. Ev teknîkî di serî de tê bikar anîn da ku pêşî li daneyên hesas bigire ku rasterast di hawîrdorên nebawer de werin bikar anîn.
Prensîba Maskirina Daneyê: Pêdivî ye ku maskkirina daneyê taybetmendiyên daneya orîjînal, rêzikên karsaziyê, û pêwendiya daneyê biparêze da ku pê ewle bibe ku pêşkeftina paşîn, ceribandin û analîza daneyê dê ji maskkirinê bandor nebe. Berî û piştî maskekirinê hevgirtin û rastbûna daneyan piştrast bikin.
2. Dabeşkirina Masking Data
Maskekirina daneyê dikare di maskeya daneya statîk (SDM) û maskkirina daneya dînamîkî (DDM) de were dabeş kirin.
Maskekirina daneya statîk (SDM): Maskekirina daneya statîk ji bo veqetandina ji hawîrdora hilberînê pêdivî bi damezrandina databasek nû ya ne-hilberînê heye. Daneyên hesas ji databasa hilberînê têne derxistin û paşê di databasa ne-hilberînê de têne hilanîn. Bi vî rengî, daneyên desensitized ji hawîrdora hilberînê tê veqetandin, ku hewcedariyên karsaziyê bicîh tîne û ewlehiya daneyên hilberînê peyda dike.
Maskekirina Daneyên Dînamîk (DDM): Bi gelemperî di hawîrdora hilberînê de tê bikar anîn da ku daneyên hesas di wextê rast de nehêle. Carinan, astên cûda yên maskkirinê hewce ne ku di rewşên cûda de heman daneyên hesas bixwînin. Mînakî, rol û destûrên cûda dibe ku nexşeyên cûda yên maskkirinê bicîh bînin.
Raporkirina daneyê û serîlêdana maskkirina hilberên daneyê
Senaryoyên bi vî rengî bi gelemperî hilberên çavdêriya daneya hundurîn an billboard, hilberên daneyên karûbarê derveyî, û raporên li ser bingeha analîzkirina daneyê, wekî raporên karsaziyê û vekolîna projeyê vedigirin.
3. Çareseriya Masking Data
Bernameyên maskeya daneya hevpar ev in: betalkirin, nirxa rasthatî, veguheztina daneyê, şîfrekirina sîmetrîk, nirxa navîn, veqetandin û dorpêçkirin, hwd.
Betalkirin: Betalkirin şîfrekirin, qutkirin, an veşartina daneyên hesas e. Ev nexşe bi gelemperî daneyên rastîn bi sembolên taybetî (wek *) diguhezîne. Operasyon hêsan e, lê bikarhêner nikarin forma daneya orîjînal zanibin, ku dibe ku bandorê li ser sepanên daneya paşîn bike.
Nirxa Random: Nirxa bêserûber bi veguheztina rasthatî ya daneyên hesas vedibêje (hejmar li şûna jimareyan, tîp li şûna tîpan, û tîp li şûna karakteran digirin). Ev rêbaza maskkirinê dê forma daneyên hesas heya radeyekê misoger bike û serlêdana daneya paşîn hêsantir bike. Dibe ku ji bo hin peyvên watedar, wek navên mirovan û cihan, ferhengên maskekirinê pêwîst bin.
Guhertina daneyan: Veguheztina daneyan dişibihe maskekirina nirxên nûl û random, ji bilî ku li şûna ku tîpên taybetî an nirxên rasthatî bikar bînin, daneya maskekirinê bi nirxek taybetî tê guheztin.
Şîfrekirina Symmetric: Şîfrekirina sîmetrîk rêbazek maskkirina vegerê ya taybetî ye. Ew daneyên hesas bi bişkok û algorîtmayên şîfrekirinê şîfre dike. Forma şîfretextê di qaîdeyên mentiqî de bi daneyên orîjînal re hevaheng e.
Navoser: Pîlana navîn pir caran di senaryoyên îstatîstîkî de tê bikar anîn. Ji bo daneyên hejmarî, em pêşî navgîniya wan dihejmêrin, û dûv re bi rasthatinî nirxên bêhesasî li dora navîn belav dikin, bi vî rengî berhevoka daneyê domdar dihêlin.
Offset û Rounding: Ev rêbaz daneyên dîjîtal bi guheztina rasthatî diguherîne. Dorpêçkirina dorhêl rastbûna nêzîkê rêzê piştrast dike di heman demê de ku ewlehiya daneyê diparêze, ku ji pileyên berê nêzikî daneyên rastîn e, û di senaryoya analîza daneya mezin de xwedî girîngiyek mezin e.
Modela Pêşniyar "ML-NPB-5660" ji bo Masking Data
4. Bi gelemperî Teknîkî Masking Data
(1). Teknîkên Îstatîstîkî
Nimûnekirina daneyan û berhevkirina daneyan
- Nimûnekirina daneyan: Vekolîn û nirxandina berhevoka daneya orîjînal bi hilbijartina binekomek nûner a berhevoka daneyê rêgezek girîng e ji bo baştirkirina bandorkeriya teknîkên jihevnasînê.
- Kombûna daneyan: Wekî berhevokek teknîkên îstatîstîkî (wek berhevkirin, hejmartin, navînî, herî zêde û hindiktirîn) ku li ser taybetmendiyên mîkrodaneyê têne sepandin, encam nûneriya hemî tomarên di berhevoka daneya orîjînal de ye.
(2). Cryptography
Cryptography rêbazek hevpar e ku ji bo hestiyarkirin an zêdekirina bandorkirina hestiyariyê ye. Cûreyên cûda yên algorîtmayên şîfrekirinê dikarin bandorên cûda yên desensitîzasyonê bi dest bixin.
- Şîfrekirina diyarker: Şîfrekirineke sîmetrîk a ne-random. Ew bi gelemperî daneyên ID-ê pêvajoyê dike û dema ku hewce bike dikare şîfretextê li nasnameya orîjînal deşîfre bike û vegerîne, lê pêdivî ye ku mift bi rêkûpêk were parastin.
- Şîfrekirina bêveger: Fonksiyona hash ji bo pêvajokirina daneyan, ku bi gelemperî ji bo daneyên ID-ê têne bikar anîn, tê bikar anîn. Ew rasterast nayê deşîfrekirin û pêdivî ye ku pêwendiya nexşeyê were hilanîn. Wekî din, ji ber taybetmendiya fonksiyona hash, dibe ku lihevhatina daneyan çêbibe.
- Şîfrekirina homomorfîk: Algorîtmaya homomorfîk a şîfretextê tê bikaranîn. Taybetmendiya wê ev e ku encama operasyona şîfretextê wekî ya operasyona deştê ya piştî deşîfrekirinê ye. Ji ber vê yekê, ew bi gelemperî ji bo pêvajoyên qadên hejmarî tê bikar anîn, lê ji ber sedemên performansê bi berfirehî nayê bikar anîn.
(3). System Technology
Teknolojiya tepisandinê tiştên daneyan ên ku bi parastina nepenîtiyê re nagirin jê dike an jî diparêze, lê wan naweşîne.
- Maskekirin: ew rêbaza herî gelemperî ya bêhesibandinê vedibêje da ku nirxa taybetmendiyê veşêre, wek mînak jimara dijber, qerta nasnameyê bi stêrkek tê nîşankirin, an navnîşan tê qut kirin.
- Tepeserkirina herêmî: pêvajoya jêbirina nirxên taybetmendiyê (stûnan), rakirina zeviyên daneya ne-bingehîn vedibêje;
- Tepeserkirina tomarê: behsa pêvajoya jêbirina tomarên taybetî (rêzan), jêbirina tomarên daneya ne-bingehîn dike.
(4). Pseudonym Technology
Pseudomanning teknolojiyek jinavbirinê ye ku navdêrekê bikar tîne da ku li şûna nasnameyek rasterast (an nasnameyek din a hesas) bigire. Teknîkên pseudonym ji bo her mijarek agahdariya kesane, li şûna nasnameyên rasterast an hesas, nasnameyên yekta diafirînin.
- Ew dikare nirxên bêserûber bi rengek serbixwe biafirîne ku bi nasnameya orîjînal re têkildar be, tabloya nexşeyê hilîne, û gihîştina tabloya nexşeyê bi hişkî kontrol bike.
- Her weha hûn dikarin şîfrekirinê bikar bînin da ku paşnavan hilberînin, lê pêdivî ye ku mifteya deşîfrekirinê bi rêkûpêk bigire;
Ev teknolojiyê bi berfirehî di doza hejmareke mezin a bikarhênerên daneya serbixwe de tê bikar anîn, wek OpenID di senaryoya platforma vekirî de, ku pêşdebirên cihêreng ji bo heman bikarhêner Openidên cihêreng digirin.
(5). Teknîkên giştîkirin
Teknolojiya giştîkirinê teknolojiyek jinavbirinê vedibêje ku hûrguliya taybetmendiyên hilbijartî di komek daneyê de kêm dike û ravekirinek gelemperî û razbertir a daneyan peyda dike. Teknolojiya gelemperîkirinê hêsan e ku meriv bicîh bike û dikare rastiya daneyên asta tomar biparêze. Ew bi gelemperî di hilberên daneyan an raporên daneyê de tê bikar anîn.
- Rounding: ji bo taybetmendiya hilbijartî hilbijartinek bingehek dorpêvekirî ye, wek edlî ya jor an berjêr, ku encamên 100, 500, 1K, û 10K dide.
- Teknîkên kodkirina jor û jêr: Nirxên li jor (yan jêr) tixûbê bi bendek ku asta jorîn (an jêrîn) temsîl dike, biguhezînin, û encamek "jor X" an "li jêr X" derkeve.
(6). Teknîkên Randomization
Wekî cûreyek teknîka de-nasnameyê, teknolojiya randomîzasyonê bi guheztina nirxa taybetmendiyekê bi riya rasthatiniyê vedibêje, da ku nirxa piştî rasthatiniyê ji nirxa rastîn a orîjînal cûda be. Ev pêvajo şiyana êrîşkerek kêm dike ku di heman tomara daneyê de nirxek taybetmendiyê ji nirxên din ên taybetmendiyê derxîne, lê bandorê li rastiya daneyên encam dike, ku bi daneyên ceribandina hilberînê re hevpar e.
Dema şandinê: Sep-27-2022