Texte längenkongruent verschlüsseln

08/01/2010 - 10:41 von Olaf Podendorf | Report spam
Sehr geehrte DG,

zum Zwecke der Anonymisierung von Daten (Texten), suche ich einen Weg,
(Konzept) um Texte LÄNGENKONGRUENT und möglichst eindeutig zu verschlüsseln.

Die Notwendigkeit der Làngenkongruenz ist darin begründet, dass ich die
anonymisierten Daten in die gleichen Datenbankfelder drücken möchte, wie die
Originaldaten. Also die verschlüsselten Daten dürfen auf keinen Fall lànger
werden.

Außerdem müssen die verschlüsselten Daten druckbar/anzeigbar sein. Da sehe
ich schon das Problem, dass eine Base64 - Konvertierung Texte auf 8/6 -tel
verlàngert.

Vielen Dank für gute Gedanken

Olaf Podendorf
 

Lesen sie die antworten

#1 Thomas Scheidegger
08/01/2010 - 13:42 | Warnen spam
Hallo Olaf

wàre mir gerade nichts fertiges (in C#) bekannt,
aber einige Gedanken dazu...

müssen die verschlüsselten Daten druckbar/anzeigbar sein.



nur (7-bit!) Ascii Text?
eine 'heikle' Frage ist dann jeweils, ob TABs, CR/LF (und ggf DEL) auch
gelten!

Weiter làuft dies wohl typisch auf Code-Positions-Tabellen hinaus...

LÄNGENKONGRUENT und möglichst eindeutig zu verschlüsseln



Für eine (performante, aber primitive) 'Verschleierung' würde es genügen,
die 'Positionen' in jener Tabelle einfach zu 'verwürfeln'.
(Buchstaben werden 1:1 ausgetauscht)

Falls starke Verschlüsselung:
damit kommt die entscheidende Frage, wieviele 'Positionen' in jener Tabelle
belegt werden:
entspricht dies nicht zufàllig gerade einer Zweierpotenz,
(gàngige Crypto-Algos arbeiten ja binàr, byte-wise)
muss wohl sowas wie eine Zahlensystem Umrechung (nur zB Base95 => Base256)-
stattfinden.
Bei typ 'byte-wise' Crypto könnte aber wohl weiter ein 'Überhang' von bis 7
Bit entstehen,
also am Ende ggf ~2 Zeichen lànger.

Ein anderer Ansatz könnte u.U auch die Theorie von Huffman
http://en.wikipedia.org/wiki/Huffman_coding
liefern (mit fixer Tabelle, statistisch optimiert [aber halt
sprachabhàngig]),
wobei da je nach Eingangs-Texte sogar kürzere Làngen entstehen könnten.

P.S.
Falls die DB-Felder Unicode zulassen und du dessen erweiterte Codes als
'druckbar' akzeptierst,
gàbe es viel mehr 'binàren Spielraum'.



Thomas Scheidegger - 'NETMaster'
http://dnetmaster.net/

Ähnliche fragen