Yahoo stellt seinen Crawler Anthelion als Open Source-Projekt unter Apache zur Verfügung. Anthelion kann in HTML eingebettete strukturierte Daten erkennen und Seiten mit strukturierten Daten bevorzugt besuchen und funktioniert als Plugin des Crawlers Apache Nutch.