Google hat mitgeteilt, dass der neue SMITH-Algorithmus zum Verstehen größerer Texte und Dokumente nicht live ist. Unklar ist außerdem, ob er jeweils live genommen wird.
Wie vor einigen Tagen berichtet gibt es ein recht aktuelles wissenschaftliches Dokument, das im Kontext von Google erschienen ist und in dem ein neuer Algorithmus zum Verstehen längerer Suchanfragen, Texte und ganzer Dokumente beschrieben wird. Der Name des Algorithmus lautet SMITH, eine Abkürzung für "Siamese Multi-depth Transformer-based Hierarchical Encoder for Long-Form Document Matching". SMITH ähnelt BERT, kann aber auch längere Textstellen verarbeiten bzw. vergleichen und ist in vielen Fällen leistungsfähiger.
Unklar war bisher, ob SMITH bereits in Betrieb ist. Solchen Spekulationen erteilte jetzt Danny Sullivan von Google eine Absage. Er schrieb, Google veröffentliche eine Vielzahl von Dokumenten, die sich auf Dinge beziehen, welche nicht in der Suche verwendet werden. Er werde nicht jede dieser Spekulationen beantworten, denn das sei sehr aufwändig. Zudem habe man darüber bereits gesprochen. Zusammengefasst: SMITH ist nicht live:
"We publish a lot of papers about things not used in Search. I won't be making a habit of confirming each one someone might speculate about because it's time consuming & more important, we have tended to proactively talk about this stuff already. That said. No. We did not."
Beobachtungen von veränderten Rankings, die von manchen der Einführung von SMITH zugeschrieben werden, haben also offensichtlich andere Ursachen.
Ob und wann SMITH live gehen wird, ist derzeit nicht bekannt. Aufgrund der beschriebenen Eigenschaften und der genannten Vorteile gegenüber BERT ist es aber durchaus möglich, dass Google SMITH zumindest mittelfristig einsetzen wird.