Information Retrieval

Apache SolrApache Solr erfreut sich einer immer größeren Beliebtheit, wenn es um den Aufbau von Suche-Indizes geht. Ein Vorteil von Solr ist, dass es sehr gut skaliert und sich auf verschiedene Weisen konfigurieren lässt. Um die optimale Konfiguration für Apache Solr zu finden, ist jedoch die Messung der Systemperformance unerlässlich. Dazu gibt es ein einfach zu bedienendes Tool, das sowohl die Query- als auch die Indexierungsleistung messen und darstellen kann.

Zwei Dinge sind bei jedem Sucheprodukt entscheidend, wenn es um die Performance geht: Die benötigte Zeit für Abfragen (Queries) und für die Aufnahme neuer Dokumente (Indexierung). Je nachdem, wie groß die Zahl des Indexes ist, wie viele Dokumente neu hinzukommen und nach welcher Zeit diese Dokumente verfügbar und abrufbar sein sollen, muss eine entsprechende Konfiguration der Komponenten gewählt werden.

Eines der am weitesten verbreiteten Produkte für den Aufbau von Sucheportalen und Suchmaschinen ist Apache Solr, das auf den Bibliotheken von Apache Lucene basiert. Der Vorteil von Solr, der zugleich auch Nachteil ist: Es gibt unzählige Möglichkeiten, das System zu kongfigurieren. Das beginnt bei der Konfiguration des Speichers für die Virtual Machine (JVM) und der Wahl der richtigen Garbage-Collection-Strategie, führt über das Setzen der richtigen Cache-Größe und der passenden Cache-Erneuerungs-Stratgie über Filter etc.

 

Solrmeter einfach einrichten

Gut, wenn man in der Lage ist, die Auswirkungen verschiedener Konfigurationen schnell zu testen und die Ergebnisse vergleichen zu können. Viele Tools gibt es dazu noch nicht, doch eines ist sehr empfehlenswert: solrmeter. Dabei handelt es sich um eine Java-Anwendung, die Requests gegen eine definierte Solr-Instanz schickt und die Ergebnisse in Form von verschiedenen Reports, Grafiken und Diagrammen ausliefert. Getestet werden können sowohl Queries (Suchanfragen), Updates (Indexierung) als auch Optimizes. Letztere werden dann ausgeführt, wenn die Zahl der Index-Segmente zu groß geworden ist, so dass eine Zusammenführung zu größeren Blöcken notwendig wird.

Das Einrichten von solrmeter ist sehr einfach: Entweder verwendet man das .jar-File oder man kompiliert sich selbst eine lauffähige Datei. Sowohl das .jar als auch der Quellcode sind hier verfügbar. Das .jar kann dann einfach durch den Aufruf java -jar solrmeter-0.3.0.jar gestartet werden. Parameter sind keine nötig. Solrmeter lässt sich übrigens sowohl mit Solr-Cloud-Installationen als auch mit Master-Slave-Systemen nutzen. Im Test wurde solrmeter mit einer Solr 4.10-Installation angewandt.

Nach dem Aufruf von solrmeter wird der Startbildschirm angezeigt. Im oberen Bereich sieht man die vier Hauptbereiche "Query Console" "Update Console", "Commit Console" und "Optimize Console", die für die einzelnen Requests an Solr stehen. Noch allerdings sind die Tests nicht ausführbar, denn vorher muss noch die zu testende Solr-Instanz eingetragen werden. Das kann im Menü unter "Edit/Settings" getan werden. Dort kann man auch die für die Queries zu verwendenden Dateien festlegen. In diesen Dateien stehen die Abfragen, die von solrmeter an Solr geschickt werden sollen. Der Nutzer hat die Wahl, ob er den Query-Mode "Standard" oder "Ecternal" wählen möchte.Solrmeter: Einstellungen

Je nach verwendetem Query-Request-Handler können die Queries in einem unterschiedlichen Format angegeben werden. Für den LuceneQueryParser würde das zum Beispiel so aussehen:
text:(ipod OR ipad) AND cat:technology
text:(lucene) AND cat:books AND title:(action)
text:display AND cat:technology

Für den DismaxQueryParser würde dieses Format passen:
ipod ipad
lucene in action
display
technology

Sobald die nötigen Daten eingetragen sind, kann der Test gestartet werden. Hierbei kann noch gewählt werden, wieviele Requests solrmeter pro Minute an die Solr-Instanz schicken soll. Sobald der Test läuft, werden auch schon die ersten Ergebnisse angezeigt. Dabei hat man die Wahl zwischen verschiedenen Diagrammarten und Listendarstellungen. Auch eine Logausgabe ist möglich, um mögliche Fehler erkennen und beurteilen zu können.Solrmeter: Testergebnisse

In den verschiedenen Ansichten erkennt man vor allem, welche Requests wie lange gedauert haben und wie die Verteilung der Dauer auf die Zahl der Requests aussieht.

In ähnlicher Weise lässt sich auch die Performance beim Update des Indexes messen. Auch hier muss eine Quelldatei mit den entsprechenden Requests definiert werden. Zudem kann man bestimmen, nach wie vielen Updates ein Commit stattfinden soll. Da bei einem Hard Commit die Daten auf die Platte geschrieben werden, führen häufigere Commits zu einer insgesamt längeren Verarbeitungszeit.


Fazit

Insgesamt ist solrmeter ein einfach zu bedienendes Tool, mit dem man schnell die Leistungsfähigkeit einer Solr-Installation messen kann. Das ist vor allem dann hilfreich, wenn es darum geht, Optimierungspotentiale aufzudecken und mit verschiedenen Konfigurationen zu experimentieren.

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen






Verwandte Beiträge

SEO-Checkliste

SEO-Checkliste

 

Anzeigen







SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Schulung 2019

SEO-Schulung

Ganztägige Schulung "SEO-Grundlagen". Jetzt anmelden

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE SEO: Linkbuilding gehört dazu
Donnerstag, 09. August 2018
Ohne den konstanten und nachhaltigen Aufbau hochwertiger Links bringen die besten Onpage-Maßnahmen... Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE Neuer SEO-Contest: Punktesystem soll für mehr Fairness und Chancen sorgen
Montag, 30. Juli 2018
Im Rahmen eines neuen SEO-Contests kämmpfen wieder zahlreiche Publisher und Webseitenanbieter um... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed