Das Phonetische Verfahren

<< Click to Display Table of Contents >>

Navigation:  Die Menüleiste mit Ihren Unterordnern > Dubletten/Verkartung > Phonetik und Dubletten > Phonetik >

Das Phonetische Verfahren

Soundex

 

1.1 Allgemeines

In der Genealogie ist das Finden gleicher Personen bzw. Personen, die zu einer Familie gehören, einer der wichtigsten Aufgaben. Aber gerade die unterschiedlichen Schreibweisen machen das Auffinden von gleichen Namen schwierig. Dieses gilt insbesondere dann, wenn man die Daten nicht selber erfasst hat, sondern von Anderen zugeliefert bekommt und per GEDCOM einliest.

1.2 Bewertung der Verfahren

Die Bewertung der unterschiedlichen Verfahren kann anhand der Trefferquote (gefundenen richtigen Werte) und Fehlerquote (gefundenen Werte, die nicht zutreffen) bewertet werden. Die Wahl des richtigen Verfahrens kann von der Sprache, der Region oder von der Datenmenge abhängen. Bei einer großen Datenmenge sollte z.B. die Fehlerquote gering sein (z.B. Daitch-Mokotoff) bei historisch unheitlichen Lauten sollte keine genaue Lautmethode (PHONEM) eingesetzt werden. Es ist sinnvoll, für sich selber ein paar relevante Namen zu prüfen, um zum richtigen Verfahren zu kommen. Bei einer kleinen Datenmenge kann z.B. die Fehlerquote nicht so relevant sein, da könnte man sich daher für das Kölner Verfahren entscheiden.

2.1 Soundex

Das ist das einfachste und am meisten eingesetzte Verfahren. Es wird der erste Buchstabe genommen und es werden die Konsonanten berücksichtigt. Dabei werden die Konsonanten in Klassen geteilt und als Zahlen dargestellt (von 1..6).Dieses Verfahren kommt aus dem amerikanischen Umfeld und hat eine hohe Trefferquote aber auch eine hohe Fehlerquote.

2.2 Extended-Soundex

Das ist ein Verfahren, wass im wesentlichen vom Soundexverfahren abgeleitet ist. Die Konsonanten werden hierbei in 9 Klassen geteilt und in Zahlen 1..9 dargestellt. Der Anfangsbuchstabe wird nicht eigens berücksichtigt. Dieses Verfahren hat eine hohe Trefferquote aber auch eine hohe Fehlerquote. Die Fehlerquote kann in Abhängigkeit vom Datenmaterial höher sein als bei dem Soundexverfahren.

2.3 Kölner Verfahren

Dieses Verfahren ist ein vom Soundexverfahren abgeleitetes Verfahren, welches auf die Deutsche Sprache ange-passt wurden. Dabei werden u.U. einzelne Buchstaben im Kontext berücksichtigt, um die Laute genauer zu ermitteln. Dieses Verfahren hat eine hohe Trefferquote aber auch wesentlich kleinere Fehlerquote als die Soundex-Verfahren.

2.4 PHONEM

Das Phonemverfahren ersetzt einzelne Buchstaben durch Lautbuchstaben. Hierbei werden bestimmte Buchstaben-gruppen (PF=F=W) berücksichtigt. Unterberücksichtigung der deutschen Vokale hat dieses Verfahren eine gute, aber keine hohe Trefferquote, aber auch eine sehr kleine Fehlerquote.

2.5 Double Metaphone 1 + 2

Dieses Verfahren ist eine Kontextsensitive Methode, die die Vokale wenig berücksichtigt. Der erste Buchstabe wird wie im Soundex-Verfahren extra dargestellt. Das Ergebnis wird in Konsonanten dargestellt. Die Verfahren 1 + 2 unter-scheiden sich in wenigen Lautersetzungen, was u.U. bei einigen Regionen bedeutsam ist. Sie liefern im Wesentlichen das gleiche Ergebnis. Das Verfahren liefert eine gute Trefferquote und eine kleine Fehlerquote

2.6 Daitch-Mokotoff

Dieses Verfahren ist vom Soundex-Verfahren abgeleitet, hat aber viele Regel, um speziell die Deutsche Sprache, aber auch die jüdische und die osteuropäischen Sprachen zu berücksichtigen. Als Ergebnis wird eine 6-stellige Zahlenfolge geliefert. Das Verfahren liefert eine sehr gut Trefferquote und eine kleine Fehlerquote.


GESW-2000 Online-Hilfe © Genealogie EDV-Service