Levenshtein-Damerau-Distanz

Mit diesem Programm können Sie ähnliche und unähnliche Wörter gemäß der Levenshtein-Damerau-Distanz aus einem Korpus von 8780 Wörtern des Deutschen ermitteln. Das Korpus entstammt der 10k-Frequenz-Wortliste von Peter Kolb.

Zusätzlich wird der durschnittliche Abstand des gesuchten Wortes zu allen anderen Wörtern im Korpus ermittelt. Das Wort mit dem geringsten durchschnittlichen Abstand zu allen anderen Wörtern ist mit einem Wert von circa 6,06 das Wort "seien". Das Wort mit der größten durschnittlichen Distanz (ca. 21,45) ist "Fußball-Weltmeisterschaft". Diese Werte werden in großem Maße durch die durchschnittliche Stringlänge von ca. 7,71 beeinflusst.

Der durchschnittliche Wert aller durchschnittlichen Abstände beträgt ca. 2,74.

Zuletzt aktualisiert am 29. April 2009