SEO-News

PatentFür Suchmaschinen ist es wichtig, sich auf die wesentlichen Bestandteile der Suchanfragen zu konzentrieren. Begriffe, die für die Aussage von Suchanfragen nicht relevant sind, müssen zuvor aussortiert werden, um Ressourcen zu sparen. Google besitzt für das Erkennen so genannter Stopwords ein Patent.

Suchanfragen bestehen oft aus mehreren Wörtern. Ein Teil dieser Wörter ist für die Interpretation der Anfragen wichtig, weil sie das Thema oder die Kategorie bestimmen. Andere Wörter dagegen tragen nichts oder nur wenig zur Interpretation dabei. Es geht hier um die so genannten Stopwords, die so häufig auftreten, dass ihre Aussagekraft nur gering ist. Betrachtet man zum Beispiel die Suchanfrage: "Vegane Restaurants in Karlsruhe", so ist klar, dass die Begriffe "vegan", "Restaurant" und "Karlsruhe" wichtig sind, um die Bedürfnisse des Nutzers zu verstehen. Dagegen ist das Wort "in" für die Anfrage weniger bedeutend, denn die Intention der Suchanfrage lässt sich bereits durch die Verarbeitung der übrigen Begriffe herauslesen.

 

Stopword-Listen

Der gängige Ansatz zur Verarbeitung von Stopwords besteht darin, die Suchanfragen zuerst mit Stopword-Listen abzugleichen und alles zu entfernen, was auf diesen Listen enthalten ist. Solche Listen gibt es inzwischen für die meisten Sprachen, und sie lassen sich auch einfach in eigene Suche-Projekte integrieren, die zum Beispiel auf Apache Solr basieren.

 

Googles erweiterte Stopword-Erkennung

Auch Google arbeitet im Grunde mit Stopword-Listeb, geht jedoch noch einen Schritt weiter. Es kann nämlich sein, dass ein vermeintliches Stopword doch einen Effekt auf die zurückgelieferten Ergebnisse hat. So unterscheiden sich zum Beispiel die Suchanfragen "der See" und "die See" deutlich. Während im ersten Fall nach einem Binngewässer gesucht wird, steht bei der zweiten Suchanfrage das Meer im Blickpunkt. Da jedoch sowohl "der" als auch "die" normalerweise als Stopwords betrachtet würden, ginge der Unterschied zwischen diesen beiden Suchanfragen bei einer Kürzung der Suchanfrage verloren.Google: Beschreibung des Prozesses zur Erkennung von Stopwords

Deshalb erweitert Google den Prozess der Stopword-Erkennung wie folgt:

  1. Potentielle Stopwords werden anhand von Listen ermittelt.
  2. Es werden mehrere Suchanfragen erzeugt: sowohl mit als auch ohne die ermittelten Stopwords.
  3. Zu diesen Suchanfragen werden Kontext-Dokumente abgerufen (Suchergebnisse und / oder Kategorien)
  4. Diese Kontext-Dokumente werden verglichen.
  5. Sind die Kontext-Dokumente gleich oder ähnlich, handelt es sich bei den entfernten Begriffen um unwesentliche Stopwords. Sind die Dokumente verschieden, spielen die Stopwords eine inhaltliche Rolle.

Auf diese Weise kann Google vermeiden, Suchbegriffe zu entfernen, die für die Auswertung der Suchanfragen eine wichtige Rolle spielen.

 

Titelbild © aurora - Fotolia.com

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen






Verwandte Beiträge


SEO-Checkliste

SEO-Checkliste

 

Anzeigen







SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Schulung 2019

SEO-Schulung

Ganztägige Schulung "SEO-Grundlagen". Jetzt anmelden

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE SEO: Linkbuilding gehört dazu
Donnerstag, 09. August 2018
Ohne den konstanten und nachhaltigen Aufbau hochwertiger Links bringen die besten Onpage-Maßnahmen... Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE Neuer SEO-Contest: Punktesystem soll für mehr Fairness und Chancen sorgen
Montag, 30. Juli 2018
Im Rahmen eines neuen SEO-Contests kämmpfen wieder zahlreiche Publisher und Webseitenanbieter um... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed