1. Têgeha Maskekirina Daneyan
Maskekirina daneyan wekî maskkirina daneyan jî tê zanîn. Ew rêbazek teknîkî ye ji bo veguherandin, guhertin an veşartina daneyên hesas ên wekî jimara telefona desta, jimara karta bankê û agahdariyên din dema ku me qaîde û polîtîkayên maskkirinê dane. Ev teknîk bi giranî ji bo pêşîgirtina li rasterast bikaranîna daneyên hesas di jîngehên ne pêbawer de tê bikar anîn.
Prensîba Maskekirina Daneyan: Maskekirina daneyan divê taybetmendiyên daneyên orîjînal, rêzikên karsaziyê û girîngiya daneyan biparêze da ku pê ewle bibe ku pêşveçûn, ceribandin û analîza daneyan a paşê ji hêla maskkirinê ve nayê bandorkirin. Berî û piştî maskkirinê yekrengî û derbasdariya daneyan misoger bikin.
2. Dabeşkirina Maskekirina Daneyan
Maskkirina daneyan dikare wekî maskkirina daneyên statîk (SDM) û maskkirina daneyên dînamîk (DDM) were dabeş kirin.
Maskkirina daneyên statîk (SDM)Maskkirina daneyên statîk ji bo veqetandina ji jîngeha hilberînê, avakirina databaseke nû ya jîngeha ne-hilberînê hewce dike. Daneyên hesas ji databasa hilberînê têne derxistin û dûv re di databasa ne-hilberînê de têne hilanîn. Bi vî rengî, daneyên bêhesas ji jîngeha hilberînê têne veqetandin, ku ev yek hewcedariyên karsaziyê pêk tîne û ewlehiya daneyên hilberînê misoger dike.
Maskekirina Daneyên Dînamîk (DDM)Bi gelemperî di jîngeha hilberînê de tê bikar anîn da ku daneyên hesas di wextê rast de bêhesas bike. Carinan, ji bo xwendina heman daneyên hesas di rewşên cûda de astên cûda yên maskekirinê hewce ne. Mînakî, rol û destûrên cûda dikarin şêwazên maskekirinê yên cûda bicîh bînin.
Raporkirina daneyan û serîlêdana maskkirina berhemên daneyan
Senaryoyên weha bi giranî berhemên çavdêriya daneyên navxweyî an jî panoyên reklamê, berhemên daneyên karûbarên derveyî, û raporên li ser bingeha analîza daneyan, wekî raporên karsaziyê û nirxandina projeyê, vedihewîne.
3. Çareseriya Maskekirina Daneyan
Şêwazên maskkirina daneyan ên hevpar ev in: betalkirin, nirxa rasthatî, guheztina daneyan, şîfrekirina sîmetrîk, nirxa navînî, dûrketin û dorvekirin, û hwd.
NederbaskirinNederbaskirin tê wateya şîfrekirin, kurtkirin, an veşartina daneyên hesas. Ev şêwaz bi gelemperî daneyên rastîn bi sembolên taybetî (wek *) diguherîne. Operasyon hêsan e, lê bikarhêner nikarin formata daneyên orîjînal bizanibin, ku dibe ku bandorê li ser sepanên daneyên paşîn bike.
Nirxa RasthatîNirxa rasthatî behsa guhertina rasthatî ya daneyên hesas dike (hejmar li şûna reqeman, tîp li şûna tîpan, û karakter li şûna tîpan digirin). Ev rêbaza maskekirinê dê heta radeyekê formata daneyên hesas misoger bike û sepandina daneyên paşê hêsan bike. Dibe ku ji bo hin peyvên watedar, wek navên mirovan û cihan, ferhengên maskekirinê hewce bin.
Guhertina DaneyanGuhertina daneyan dişibihe maskekirina nirxên vala û bêserûber, lê li şûna karanîna tîpên taybet an nirxên bêserûber, daneyên maskekirinê bi nirxek taybetî têne guheztin.
Şîfrekirina SîmetrîkŞîfrekirina sîmetrîk rêbazeke taybet a maskekirinê ya berevajîkirî ye. Ew daneyên hesas bi rêya mifteyên şîfrekirinê û algorîtmayan şîfre dike. Formata nivîsa şîfrekirî bi daneyên orîjînal ên di rêzikên mantiqî de lihevhatî ye.
NavoserNexşeya navînî pir caran di senaryoyên îstatîstîkî de tê bikar anîn. Ji bo daneyên hejmarî, em pêşî navînîya wan hesab dikin, û dûv re nirxên bêhesasiyetkirî bi awayekî rasthatî li dora navînî belav dikin, bi vî rengî berhevoka daneyan sabît dihêlin.
Veqetandin û ÇerxkirinEv rêbaz daneyên dîjîtal bi guheztina rasthatî diguherîne. Gerandina dûrbûnê rastbûna texmînî ya rêzê misoger dike di heman demê de ewlehiya daneyan diparêze, ku ji nexşeyên berê nêzîktirê daneyên rastîn e, û di senaryoya analîza daneyên mezin de xwedî girîngiyek mezin e.
Modela Pêşniyarkirî"ML-NPB-5660"ji bo maskkirina daneyan
4. Teknîkên Maskekirina Daneyan ên Bi Gelemperî Têne Bikaranîn
(1). Teknîkên Îstatîstîkî
Nimûnegirtina daneyan û berhevkirina daneyan
- Nimûnegirtina daneyan: Analîz û nirxandina koma daneyên orîjînal bi hilbijartina komeke nûner a koma daneyan rêbazeke girîng e ji bo baştirkirina bandora teknîkên bênasnamekirinê.
- Berhevkirina daneyan: Wekî berhevokek teknîkên îstatîstîkî (wek berhevkirin, jimartin, navînîkirin, herî zêde û herî kêm) ku li ser taybetmendiyên di mîkrodaneyan de têne sepandin, encam nûnertiya hemî tomarên di koma daneyên orîjînal de dike.
(2). Krîptografî
Krîptografî rêbazeke gelemperî ye ji bo bêhesasiyetkirin an jî zêdekirina bandora bêhesasiyetkirinê. Cureyên cûda yên algorîtmayên şîfrekirinê dikarin bandorên bêhesasiyetkirinê yên cûda bi dest bixin.
- Şîfrekirina diyarker: Şîfrekirineke sîmetrîk a ne-tesadufî. Bi gelemperî daneyên nasnameyê pêvajo dike û dikare şîfrenivîsê deşîfre bike û dema ku pêwîst be vegerîne nasnameya orîjînal, lê mifte divê bi rêkûpêk were parastin.
- Şîfrekirina bêveger: Fonksiyona haşê ji bo pêvajoya daneyan tê bikar anîn, ku bi gelemperî ji bo daneyên nasnameyê tê bikar anîn. Ew rasterast nayê şîfrekirin û divê têkiliya nexşeyê were tomar kirin. Wekî din, ji ber taybetmendiya fonksiyona haşê, dibe ku pevçûna daneyan çêbibe.
- Şîfrekirina Homomorfîk: Algorîtmaya homomorfîk a nivîsa şîfrekirî tê bikaranîn. Taybetmendiya wê ew e ku encama operasyona nivîsa şîfrekirî piştî şîfrekirinê wekî operasyona nivîsa sade ye. Ji ber vê yekê, ew bi gelemperî ji bo pêvajoya qadên hejmarî tê bikar anîn, lê ji ber sedemên performansê bi berfirehî nayê bikar anîn.
(3). Teknolojiya Sîstemê
Teknolojiya tepeserkirinê daneyên ku ne li gorî parastina nepenîtiyê ne jê dibe an jî diparêze, lê wan çap nake.
- Maskekirin: ew rêbaza bêhesasiyetê ya herî gelemperî ye ji bo maskkirina nirxa taybetmendiyê, wekî jimara dijber, nasnameya ku bi stêrkekê hatiye nîşankirin, an navnîşan hatiye kurtkirin.
- Tepeserkirina herêmî: behsa pêvajoya jêbirina nirxên taybetmendiyên taybetî (stûn), rakirina qadên daneyên ne-esasî dike;
- Tepeserkirina tomarê: behsa pêvajoya jêbirina tomarên (rêzên) taybetî, jêbirina tomarên daneyên ne-esasî dike.
(4). Teknolojiya Navên Bingehîn
Pseudomanning teknîkek ji-nasnameyê ye ku navekî derewîn bikar tîne da ku li şûna nasnameyek rasterast (an nasnameyek din a hesas) bigere. Teknîkên navekî derewîn ji bo her mijara agahdariya takekesî nasnameyên bêhempa diafirînin, li şûna nasnameyên rasterast an hesas.
- Ew dikare nirxên rasthatî bi serbixwe çêbike da ku bi nasnameya orîjînal re têkildar be, tabloya nexşeyê hilîne, û gihîştina tabloya nexşeyê bi hişkî kontrol bike.
- Her wiha hûn dikarin şîfrekirinê ji bo çêkirina navên derewîn bikar bînin, lê pêdivî ye ku mifteya şîfrekirinê bi rêkûpêk biparêzin;
Ev teknoloji bi berfirehî di rewşa hejmareke mezin ji bikarhênerên daneyên serbixwe de tê bikar anîn, wekî OpenID di senaryoya platforma vekirî de, ku pêşdebirên cûda ji bo heman bikarhêner Openidên cûda bi dest dixin.
(5). Teknîkên Giştîkirinê
Teknîka giştîkirinê behsa teknîkek ji-nasnameyê dike ku hûrguliya taybetmendiyên bijartî di komek daneyan de kêm dike û ravekek gelemperîtir û berfirehtir a daneyan peyda dike. Teknolojiya giştîkirinê bicîhanîna wê hêsan e û dikare rastbûna daneyên asta tomarê biparêze. Ew bi gelemperî di hilberên daneyan an raporên daneyan de tê bikar anîn.
- Çerxandin: hilbijartina bingehek çerxandinê ji bo taybetmendiya bijartî vedihewîne, wekî lêkolîna jor an jêr, ku encamên 100, 500, 1K, û 10K dide.
- Teknîkên kodkirina jorîn û jêrîn: Nirxên li jor (an jî li jêr) a eşikê bi eşikek ku asta jorîn (an jî jêrîn) temsîl dike biguherînin, encamek wekî "li jor X" an "li jêr X" dide.
(6). Teknîkên Tesadufîkirinê
Wekî cureyek teknîka nenaskirinê, teknolojiya rasthatinî behsa guhertina nirxa taybetmendiyekê bi rêya rasthatinîkirinê dike, da ku nirxa piştî rasthatinîkirinê ji nirxa rastîn a orîjînal cuda be. Ev pêvajo şiyana êrîşkarek ji bo derxistina nirxek taybetmendiyê ji nirxên taybetmendiyên din ên di heman tomarê daneyan de kêm dike, lê bandorê li rastbûna daneyên encam dike, ku ev yek bi daneyên testa hilberînê re hevpar e.
Dema weşandinê: 27ê Îlonê, 2022