.

SEO-News


PatentFür Suchmaschinen ist es wichtig, sich auf die wesentlichen Bestandteile der Suchanfragen zu konzentrieren. Begriffe, die für die Aussage von Suchanfragen nicht relevant sind, müssen zuvor aussortiert werden, um Ressourcen zu sparen. Google besitzt für das Erkennen so genannter Stopwords ein Patent.

Suchanfragen bestehen oft aus mehreren Wörtern. Ein Teil dieser Wörter ist für die Interpretation der Anfragen wichtig, weil sie das Thema oder die Kategorie bestimmen. Andere Wörter dagegen tragen nichts oder nur wenig zur Interpretation dabei. Es geht hier um die so genannten Stopwords, die so häufig auftreten, dass ihre Aussagekraft nur gering ist. Betrachtet man zum Beispiel die Suchanfrage: "Vegane Restaurants in Karlsruhe", so ist klar, dass die Begriffe "vegan", "Restaurant" und "Karlsruhe" wichtig sind, um die Bedürfnisse des Nutzers zu verstehen. Dagegen ist das Wort "in" für die Anfrage weniger bedeutend, denn die Intention der Suchanfrage lässt sich bereits durch die Verarbeitung der übrigen Begriffe herauslesen.

 

Stopword-Listen

Der gängige Ansatz zur Verarbeitung von Stopwords besteht darin, die Suchanfragen zuerst mit Stopword-Listen abzugleichen und alles zu entfernen, was auf diesen Listen enthalten ist. Solche Listen gibt es inzwischen für die meisten Sprachen, und sie lassen sich auch einfach in eigene Suche-Projekte integrieren, die zum Beispiel auf Apache Solr basieren.

 

Googles erweiterte Stopword-Erkennung

Auch Google arbeitet im Grunde mit Stopword-Listeb, geht jedoch noch einen Schritt weiter. Es kann nämlich sein, dass ein vermeintliches Stopword doch einen Effekt auf die zurückgelieferten Ergebnisse hat. So unterscheiden sich zum Beispiel die Suchanfragen "der See" und "die See" deutlich. Während im ersten Fall nach einem Binngewässer gesucht wird, steht bei der zweiten Suchanfrage das Meer im Blickpunkt. Da jedoch sowohl "der" als auch "die" normalerweise als Stopwords betrachtet würden, ginge der Unterschied zwischen diesen beiden Suchanfragen bei einer Kürzung der Suchanfrage verloren.Google: Beschreibung des Prozesses zur Erkennung von Stopwords

Deshalb erweitert Google den Prozess der Stopword-Erkennung wie folgt:

  1. Potentielle Stopwords werden anhand von Listen ermittelt.
  2. Es werden mehrere Suchanfragen erzeugt: sowohl mit als auch ohne die ermittelten Stopwords.
  3. Zu diesen Suchanfragen werden Kontext-Dokumente abgerufen (Suchergebnisse und / oder Kategorien)
  4. Diese Kontext-Dokumente werden verglichen.
  5. Sind die Kontext-Dokumente gleich oder ähnlich, handelt es sich bei den entfernten Begriffen um unwesentliche Stopwords. Sind die Dokumente verschieden, spielen die Stopwords eine inhaltliche Rolle.

Auf diese Weise kann Google vermeiden, Suchbegriffe zu entfernen, die für die Auswertung der Suchanfragen eine wichtige Rolle spielen.

 

Titelbild © aurora - Fotolia.com

 


Christian KunzVon Christian Kunz+Mehr Infos hier.





Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen





SEO-Checkliste

SEO-Checkliste

 

Anzeige

SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Wissenstest

SEO-Wissenstest

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Sprecher auf

Partner

15 Prozent sparen!
Euer Rabatt-Code lautet SEOSWSMX

Auszeichnungen

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest English website

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2016

SEO-Kalender 2015

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Werbung

Anzeige

SEO-Tipps und SEO-Tricks

IMAGE Tipps zum Umgang mit der .htaccess-Datei
Montag, 15. August 2016
Die .htaccess-Datei ist ein mächtiges und gleichzeitig einfach zu bedienendes Werkzeug zur... Weiterlesen...
IMAGE Zu klein für Google Top-10: Yelp hilft
Montag, 19. Januar 2015
Für viele kleine Webseiten, die es aus eigener Kraft nicht schaffen, unter die Top-10 bei Google... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE Nur der KSC!
Montag, 01. Juni 2015
Schluss. Aus. Vorbei. Der KSC spielt auch in der kommenden Saison in der zweiten Liga. Einsatz,... Weiterlesen...
IMAGE SEO: Können 'Ausverkauft'-Seiten in Online-Shops positive Rankingeffekte haben?
Sonntag, 01. Februar 2015
Wie geht Google eigentlich mit Seiten aus Online-Shops um, die nicht mehr lieferbare Produkte... Weiterlesen...
IMAGE Die SMX 2017: Wieder viele hochkarätige Speaker an Bord (Sponsored Post)
Dienstag, 18. Oktober 2016
Es sind zwar noch fast fünf Monate bis zur Eröffnung der SMX 2017, doch bereits jetzt stehen... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy

Verbinden

Social Networks und RSS-Feed