Auf dem Weg zum Semantischen Web

Die Semantik ist die Lehre von der Bedeutung der Wörter bzw. der Sprache. Wichtig im Hinblick auf das Internet: Google & Co. 'verstehen' Suchanfragen anders als Menschen.

Von lernenden Suchmaschinen, strukturierten Daten und JSON-LD

Sucht jemand nach 'Jaguar', kann eine Suchmaschine nicht entscheiden, ob die Raubkatze gemeint ist oder das Auto gleichen Namens. Menschen dagegen wissen etwas über den Gesprächspartner (Autoliebhaber), ziehen den Kontext mit heran, achten auch auf nonverbale Signale und kommen so meist auf die intendierte Bedeutung.

Bei Suchmaschinen wie Google arbeitet man daran, Suchanfragen besser zu 'verstehen'. Hat Google z.B. Informationen über den Suchenden, weil es aus dessen Verhalten bei anderen Suchanfragen und auch beim Surfen im Web 'weiß', dass es sich um einen Autoliebhaber handelt, kann die Suchmaschine passende Informationen in den Vordergrund stellen.

Ein nächster Schritt in der Entwicklung zeichnet sich ab: Bei Google z.B. arbeitet man am sog. RankBrain, einem selbstlernenden Algorithmus. RankBrain soll nicht nur Synonyme von Begriffen erkennen – etwa dass mit 'Sneaker' Sportschuhe gemeint sind - , sondern auch implizite Zusammenhänge. Als Beispiel wird angeführt, dass im amerikanischen Google auf die Suchfeldeingabe: „when was the wife of Obama born“ als erstes Ergebnis der Name von Michelle Obama und ihr Geburtsdatum angezeigt wird. - Wenn man hierbei allerdings berücksichtigt, dass Googles 'Knowledge Graph', eingeführt 2012, eine große semantische Datenbank darstellt, die Informationen verschiedenster Quellen (u.a. Wikipedia) zu einer Person oder einem Thema bereit stellt, dann kann man annehmen, dass RankBrain vermutlich nicht wirklich bei Null beginnt zu lernen. Zu einer 'künstlichen Intelligenz' ist es wohl noch ein weiter Weg. Aber wenn RankBrain tatsächlich selbstlernend funktioniert, dann darf man neugierig auf die Zukunft dieses Algorithmus' sein.

Auf der einen Seite arbeitet man bei Google und anderen Suchmaschinen also daran, menschliche Suchanfragen zu 'verstehen'. Auf der anderen Seite müssen die Suchmaschinen aber auch 'verstehen', worum es auf einer Website geht.

Was bedeutet das für die Betreiber von Websites oder Shops?

Es gibt bereits eine Reihe von Maßnahmen, die Websitebetreiber einsetzen können, um Suchmaschinen dieses Verständnis zu erleichtern.

Grundlegend sind natürlich die Informationsarchitektur der Website und die Navigation, die diese zugänglich macht. Genau so wichtig ist die verwendete Terminologie, die sich u.a. an der Außensicht der User / Zielgruppen orientieren sollte und nicht an der spezifischen Innensicht. Von diesen und anderen Grundlagen wie einer korrekten Gliederung der Seiteninformationen durch H-Tags und anderem soll hier aber nicht die Rede sein.

Vielmehr soll hier kurz dargestellt werden, welche Möglichkeiten es heute schon gibt, die helfen, für bestimmte Informationen eine bessere Suchmaschinen-Verständlichkeit zu erzielen.

Das Prinzip besteht darin, dass man Google und Co. mitteilt, um welche Art von Information es sich bei einem konkreten Begriff oder Ausdruck handelt. Beispiele sind 'autor' (definiert den folgenden Namen als den eines Autors), 'termin', 'preis', 'bewertung'.

Insbesondere bei sog. strukturierten Daten (z.B. Produktdaten aus einer Datenbank) liegen ja in der Regel Auszeichnungen der Daten vor. Die lassen sich nutzen, um z.B. eine Zahl mit dem Attribut 'Preis' zu definieren.

Um diese Daten auch auf einer Website oder in einem Online-Shop für Google & Co. verfügbar zu machen, müssen diese nach einem offiziellen Standard (http://schema.org) ausgezeichnet werden. Dort sind für alle Anwendungsfälle (z.B. Rezepte oder Produkte) die möglichen Felder definiert. Um die Daten der eigenen Website nach diesem Standard zu markieren, gibt es verschiedene Formate. Bisher waren Microdata, Microformats oder RDFa üblich, bei denen die Feldzuordnungen an den jeweiligen Stellen in den laufenden HTML-Code einer Seite eingefügt wurden.

Der modernere Ansatz und das aktuell von Google empfohlene Verfahren ist jedoch JSON-LD*, bei dem der Code aus den Datenbankattributen komplett in die Kopf-Sektion einer Seite eingefügt werden kann. Dies erleichtert die Verarbeitung dieser Daten und bringt neue Möglichkeiten des Auslesens, Speicherns und für Schnittstellen zwischen verschiednen Diensten mit sich.

Beispiel von Google:

Dieses Verfahren wird von Google empfohlen. Allerdings funktioniert es zur Zeit nur mit google.com und auch nur für Inhalte wie Filme und Rezepte, aber Google hat angekündigt, JSON-LD-Auszeichnungen zukünftig auch in anderen Sprachen und für weitere Inhaltsformen zu berücksichtigen.

In den USA zeigt Google bei manchen Suchen bereits sog. Rich Cards an, die ein Produkt abbilden und dazu kurz gefasst die weiteren notwendigen Informationen liefern. Solche Rich Cards bieten natürlich einen großen Vorteil gegenüber den 'normalen' Suchergebnis- oder Adwords-Darstellungen, da sie sehr viel auffälliger und nützlicher für den User sind.

Empfehlung

Insbesondere Webshop-Betreiber sollten sich mit dem Thema der Auszeichnung strukturierter Daten und insbesondere mit JSON-LD befassen. Aber auch Betreiber anderer Websites sollten überlegen, ob der Einsatz solcher Auszeichungen z.B. für Kontaktdaten und ähnliches sinnvoll ist.

Wenn Google die Rich Cards ausbaut und zunehmend auch in anderen Bereichen strukturierte Daten ausliest und verwendet, dann wird dieses Thema eine erhebliche Bedeutung gewinnen.

Eine weitere wichtige Perspektive ergibt sich durch 'intelligente' Agenten, Bots und ChatBots, die zur Zeit von Apple, Google und Microsoft immer weiter entwickelt werden, und die User (insbesondere von Smartphones) davon entlasten sollen, selbst zu suchen. Diese Agenten und Bots müssen ja auch 'verstehen', wonach der User sucht, und wo sich die gesuchte Information findet.

Hier gibt Google Informationen zum Thema 'Strukturierte Daten' und zur Anwendung von JSON LD.

https://developers.google.com/search/docs/guides/intro-structured-data

Gerne können Sie uns bei Interesse an diesem Thema ansprechen. Entweder über unser Kontaktformular oder über diese Telefonnummer: 0221 – 9730 62 - 0

*JSON-LD = JavaScript Object Notation for Linked Data

Dieses Verfahren wird von Google empfohlen. Allerdings funktioniert es zur Zeit nur mit google.com und auch nur für Inhalte wie Filme und Rezepte, aber Google hat angekündigt, JSON-LD-Auszeichnungen zukünftig auch in anderen Sprachen und für weitere Inhaltsformen zu berücksichtigen.

In den USA zeigt Google bei manchen Suchen bereits sog. Rich Cards an, die ein Produkt abbilden und dazu kurz gefasst die weiteren notwendigen Informationen liefern. Solche Rich Cards bieten natürlich einen großen Vorteil gegenüber den 'normalen' Suchergebnis- oder Adwords-Darstellungen, da sie sehr viel auffälliger und nützlicher für den User sind.