Hier könnte Ihre Werbung stehen. Weitere Infos und Mediadaten finden Sie hier.

SEO-News

PatentFür Suchmaschinen ist es wichtig, sich auf die wesentlichen Bestandteile der Suchanfragen zu konzentrieren. Begriffe, die für die Aussage von Suchanfragen nicht relevant sind, müssen zuvor aussortiert werden, um Ressourcen zu sparen. Google besitzt für das Erkennen so genannter Stopwords ein Patent.

Suchanfragen bestehen oft aus mehreren Wörtern. Ein Teil dieser Wörter ist für die Interpretation der Anfragen wichtig, weil sie das Thema oder die Kategorie bestimmen. Andere Wörter dagegen tragen nichts oder nur wenig zur Interpretation dabei. Es geht hier um die so genannten Stopwords, die so häufig auftreten, dass ihre Aussagekraft nur gering ist. Betrachtet man zum Beispiel die Suchanfrage: "Vegane Restaurants in Karlsruhe", so ist klar, dass die Begriffe "vegan", "Restaurant" und "Karlsruhe" wichtig sind, um die Bedürfnisse des Nutzers zu verstehen. Dagegen ist das Wort "in" für die Anfrage weniger bedeutend, denn die Intention der Suchanfrage lässt sich bereits durch die Verarbeitung der übrigen Begriffe herauslesen.

 

Stopword-Listen

Der gängige Ansatz zur Verarbeitung von Stopwords besteht darin, die Suchanfragen zuerst mit Stopword-Listen abzugleichen und alles zu entfernen, was auf diesen Listen enthalten ist. Solche Listen gibt es inzwischen für die meisten Sprachen, und sie lassen sich auch einfach in eigene Suche-Projekte integrieren, die zum Beispiel auf Apache Solr basieren.

 

Googles erweiterte Stopword-Erkennung

Auch Google arbeitet im Grunde mit Stopword-Listeb, geht jedoch noch einen Schritt weiter. Es kann nämlich sein, dass ein vermeintliches Stopword doch einen Effekt auf die zurückgelieferten Ergebnisse hat. So unterscheiden sich zum Beispiel die Suchanfragen "der See" und "die See" deutlich. Während im ersten Fall nach einem Binngewässer gesucht wird, steht bei der zweiten Suchanfrage das Meer im Blickpunkt. Da jedoch sowohl "der" als auch "die" normalerweise als Stopwords betrachtet würden, ginge der Unterschied zwischen diesen beiden Suchanfragen bei einer Kürzung der Suchanfrage verloren.Google: Beschreibung des Prozesses zur Erkennung von Stopwords

Deshalb erweitert Google den Prozess der Stopword-Erkennung wie folgt:

  1. Potentielle Stopwords werden anhand von Listen ermittelt.
  2. Es werden mehrere Suchanfragen erzeugt: sowohl mit als auch ohne die ermittelten Stopwords.
  3. Zu diesen Suchanfragen werden Kontext-Dokumente abgerufen (Suchergebnisse und / oder Kategorien)
  4. Diese Kontext-Dokumente werden verglichen.
  5. Sind die Kontext-Dokumente gleich oder ähnlich, handelt es sich bei den entfernten Begriffen um unwesentliche Stopwords. Sind die Dokumente verschieden, spielen die Stopwords eine inhaltliche Rolle.

Auf diese Weise kann Google vermeiden, Suchbegriffe zu entfernen, die für die Auswertung der Suchanfragen eine wichtige Rolle spielen.

 

Titelbild © aurora - Fotolia.com

 



SEO-Checkliste

SEO-Checkliste

 

Anzeige

SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Sprecher auf

Auszeichnungen

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest English website

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2016

SEO-Kalender 2015

 

SEO- und Suchmaschinenblogs

Werbung

SEO-Tipps und SEO-Tricks

IMAGE Der interne PageRank: eine der am meisten unterschätzten SEO-Kennzahlen
Sonntag, 24. April 2016
Die interne Verlinkung von Webseiten spielt eine bedeutende Rolle für das Ranking in Google und... Weiterlesen...
IMAGE Zu klein für Google Top-10: Yelp hilft
Montag, 19. Januar 2015
Für viele kleine Webseiten, die es aus eigener Kraft nicht schaffen, unter die Top-10 bei Google... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE Nur der KSC!
Montag, 01. Juni 2015
Schluss. Aus. Vorbei. Der KSC spielt auch in der kommenden Saison in der zweiten Liga. Einsatz,... Weiterlesen...
IMAGE SEO: Können 'Ausverkauft'-Seiten in Online-Shops positive Rankingeffekte haben?
Sonntag, 01. Februar 2015
Wie geht Google eigentlich mit Seiten aus Online-Shops um, die nicht mehr lieferbare Produkte... Weiterlesen...
IMAGE Vorsicht bei Verwendung von Stockfotos auf Facebook
Montag, 25. April 2016
Wer Bilder aus Foto-Archiven, sogenannten Fotostocks, verwendet, sollte aufpassen, wenn es um das... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy

Verbinden

Social Networks und RSS-Feed