Begriff | Definition |
---|---|
Jaccard-Koeffizient | Der Jaccard-Koeffizient wurde nach dem Schweizer Botaniker Paul Jaccard (1868–1944) benannt. Er beschreibt die Ähnlichkeit von Mengen. Im Bereich des Information Retrievals wird der Jaccard-Koeffizient eingesetzt, um die Ähnlichkeit von Wörtern oder Termen zu messen. Ein Einsatzgebiet ist das Vorschlagen von verwandten Suchanfragen oder von Korrekturvorschlägen. Beispiel: Ein Nutzer gibt eine Suchanfrage mit einem Rechtschreibfehler ein. Die Suchmaschine liefert als Verbesserungsvorschläge alle Einträge aus einem Wörterbuch, die einen Jaccard-Koeffizienten mit einer bestimmten Mindestgröße besitzen, die also eine Mindestähnlichkeit zum eingegebenen Suchbegriff aufweisen. Der Jaccard-Koeffizient berechnet sich aus dem Quotienten der Schnittmenge zweier Mengen A und B und deren Vereinigungsmenge. Er hat immer einen Wert zwischen null und eins. Zur Bestimmung des Jaccard-Koeffizienten im Information Retrieval werden die Wörter häufig in so genannte N-Grams oder K-Grams zerlegt - das sind Wortbestandteile aus n bzw. k Zeichen. Diese einzelnen Wortbestandteile werden dann verglichen und deren Schnittmenge ermittelt. |
Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.