Der Konzern IBM wird sein Framework SystemML für maschinelles Lernen (ML) als Open-Source-Software bei Apache veröffentlichen. Damit folgt das Unternehmen zwei aktuellen Trends: der Nutzung von ML-Techniken und der Bereitstellung der entsprechende Software.
Maschinelles Lernen (ML) ist derzeit eines der wichtigsten Themen in der Informationstechnologie. Mit Hilfe von ML-Systemen können zum Beispiel Muster erkannt, Dokumente geclustert und kategorisiert sowie bekannten Entitäten zugeordnet werden. Dabei wird zwischen Systemem mit (überwachtes Lernen) und ohne menschliche Rückmeldung (unüberwachtes Lernen) unterschieden.
Vor allem für Suchmaschinen stellt ML eine große Chance dar, die Bedürfnisse der Nutzer besser verstehen und entsprechende Ergebnisse liefern zu können. Zuletzt hatte Google mit der Veröffentlichung des RankBrain-Algorithmus für Aufsehen gesorgt, der mit Hilfe von ML bisher noch unbekannte Suchanfragen interpretieren und zuordnen soll.
IBM hat ebenfalls ein Framework zur Unterstützung von ML geschaffen. Die Software mit dem Namen SystemML umfasst sowohl eine Programmiersprache mit dem Namen Declarative Machine Learning (DML), mit der verschiedene Funktionen und Konstrukte für die Erstellung von ML-Algorithmen geschaffen werden können. Zu SystemML gehört außerdem die automatische Optimierung auf Basis der Eigenschaften der zugrunde liegenden Daten und Cluster. Das verhilft zu einer höheren Effizienz und erleichtert die Skalierbarkeit. SystemML setzt eine MapReduce-Umgebung wie zum Beispiel Apache Hadoop voraus. MapReduce ist ein Verfahren zur verteilten Berechnung großer Datenmengen. Alternativ kann auch eine Spark-Umgebung genutzt werden.
Derzeit befindet sich SystemML in der sogenannten Inkubator-Phase innerhalb des Apache-Projekts. In dieser Phase wird die Software auf Einhaltung der Apache-Richtlinien überprüft. Eine Dokumentation zu SystemML ist hier zu finden.
Auch Google hatte zuletzt ein ML-Framework veröffentlicht: TensorFlow. Das System basiert auf der Berechnung von Datenflussgraphen, Rechenoperationen sowie deren Verbindungen mit Ein- und Ausgabepunkten. Laut Google lässt sich TensorFlow zum Beispiel für die Spracherkennung nutzen.
Titelbild © AGPhotography - Fotolia.com