Forums Neueste Beiträge
 

difference liefert seltsame Ergebnisse

19/06/2008 - 12:24 von Achim Domma | Report spam
Hallo,

ich versuche via soundex und difference eine unscharfe Suche auf
Familiennamen zu implementieren. Laut Doku sollte das nicht so schwer
sein, aber meine Ergebnisse sind seltsam. Angeblich sind z.B. 'Maier'
und 'Mittelstedt' sehr àhnlich. Ich hab' das Problem soweit reduziert,
daß für die Statements

select difference('M464','M600')
select difference('M464','M200')

jeweils ein Level von 4 'raus kommt, was laut Doku Unsinn ist!? Hat
jemand eine Idee wo das Problem liegt? Soviel kann man da ja nicht
falsch machen, oder!?

Gruß,
Achim
 

Lesen sie die antworten

#1 Stefan Hoffmann
19/06/2008 - 13:14 | Warnen spam
hallo Achim,

Achim Domma schrieb:
ich versuche via soundex und difference eine unscharfe Suche auf
Familiennamen zu implementieren. Laut Doku sollte das nicht so schwer
sein, aber meine Ergebnisse sind seltsam. Angeblich sind z.B. 'Maier'
und 'Mittelstedt' sehr àhnlich. Ich hab' das Problem soweit reduziert,
daß für die Statements


Das Problem liegt daran, das Soundex/Difference für die Englische
Sprache entwickelt wurde.

http://microsoft.apress.com/index.php?idr

Für dich interessanter ist eventuell die Levenshtein-Distanz:

z.B.

http://code.filehungry.com/product/..._functions


mfG

Ähnliche fragen