Keyword Research: Semantische Keyword Tools
Keyword Research ist für den Erfolg einer jeden Suchmaschinenmarketing-Kampagne von entscheidender Bedeutung. Durch die ständig steigende Konkurrenz im bezahlten Suchmaschinenmarketing werden häufig gesuchte und offensichtlich relevante Begriffe immer teurer und damit weniger profitabel, wenn nicht sogar gänzlich unprofitabel. Hätte man die Möglichkeit, eine große Anzahl relevanter – für andere schwer identifizierbarer – Begriffe zu erzeugen, so könnte man die Performance einer Kampagne steigern, da derartige Suchbegriffe in der Regel deutlich billiger sind. Ziel ist es also eine große Menge relevanter Schlüsselwörter zu bestimmen, die in ihrer Masse einen ähnlich hohen Traffic erzeugen aber günstiger sind. Die am Markt verfügbaren Keyword Tools (Wordtracker, Keyword Discovery, Adwords Keyword Tool,…) lösen dieses Problem nicht oder nur unzureichend. Ihnen fehlt das semantische Verständnis.
Vibhanshu Abhishek veröffentlichte 2007 ein Paper [PDF], in dem er ein Verfahren beschreibt, mit Hilfe dessen sich relevante Keywords für das Search Engine Marketing (SEM) generieren lassen. Dabei nutzt er die semantische Ähnlichkeit von Begriffen aus, um anstelle weniger aber häufig angefragter Schlüsselwörter viele weniger häufig angefragte Keywords zu bestimmen. Die zugrunde liegende Annahme geht davon aus, dass häufig angefragte Keywords zu höheren Preisen ersteigert werden müssen als weniger häufig angefragte.
Einführung
Im SEM werden Gebote für bestimmte Keywords abgegeben, damit bei einer entsprechenden Suchanfrage zielgerichtete Werbeanzeigen geschaltet werden können. Die Position der Anzeige hängt dabei unter anderem vom Gebot ab. Die tatsächlichen Kosten hängen vom jeweiligen Keyword, für das man bietet, ab. Dabei wurde beobachtet, dass es einen großen Zusammenhang zwischen der Häufigkeit eines Begriffes in einer Suchanfrage und der Höhe des abzugebenden Gebots gibt, damit eine Anzeige tatsächlich geschaltet wird (Bartz et al. 2006 [PDF]). Basierend auf dieser Korrelation, wäre es sinnvoller auf sogenannte low-volume Keywords zu setzen. Das sind Schlüsselwörter, die weniger häufig angefragt werden und somit billiger zu ersteigern sind. Das Problem besteht nun darin, möglichst viele dieser relevanten aber billigen Keywords zu identifizieren.
Bisherige Verfahren
Als Basis zum Generieren derartiger Keywords dient normalerweise eine kleine Menge von Ausgangsbegriffen. Die verschiedenen Techniken, um aus dieser Ausgangsmenge neue Begriffe zu generieren, kann man grob in folgende Klassen aufteilen:
- Analyse von Suchanfragen: Diese Möglichkeit haben insbesondere die Suchmaschinenanbieter Google, Yahoo! usw selbst. Sie können auswerten, welche Suchanfragen häufig gestellt werden, die Begriffe aus der Ausgangsmenge enthalten. Sie stellen diese Information ihren Kunden auch mit Hilfe entsprechender Tools zur Verfügung.
- Keyword-Breakdown: Man kann auswerten, welche konkreten Suchanfragen zu besonders vielen Konvertierungen geführt haben. Insbesondere bei broad Matches kann somit die Liste der eigenen Keywords um potentiell erfolgversprechende Kandidaten erweitert werden.
- Analyse der Ergebnisseiten: Dabei wird nach Begriffen in der Ausgangsbasis gesucht und die Ergebnisseiten werden analysiert, um Begriffe, die sich in der Nähe der Ausgangsbegriffe befinden, als potentielle neue Kandidaten aufzunehmen.
- Analyse der Meta-Tags der Ergebnisseiten: Es werden Suchanfragen nach den Begriffen in der Ausgangsbasis ausgeführt. Viele Ergebnisseiten enthalten in den Meta-Tags Informationen zu relevanten Schlüsselwörtern. Diese können als weitere Kandidaten für neue Keywords betrachtet werden.
Keines dieser Verfahren benutzt explizit die semantische Ähnlichkeit bestimmter Begriffe.
Was heißt “semantisch ähnlich”?
Eine Möglichkeit besteht natürlich darin, einen Thesaurus zu nutzen, um äquivalente Begriffe zu finden. Wie aber soll ein Programm entscheiden, dass zwei Begriffe oder Phrasen semantisch ähnlich sind? Im Paper wird folgende Vorgehensweise vorgeschlagen. Basierend auf einer Menge schon generierter Keywordkandidaten, von denen man noch nicht weiss, wie relevant sie tatsächlich sind, wird für jedes dieser Keywords eine Suchanfrage ausgeführt. Anschließend werden z.B. die ersten 30 Ergebnisseiten genauer analysiert, d.h. es werden Worte oder Textphrasen gesucht, die – vereinfacht gesagt – besonders häufig vorkommen. Es wird also für jedes einzelne dieser Dokumente eine Menge besonders relevanter Begriffe ermittelt.
Um diese Begriffe zu finden, werden aus dem Text zunächst alle sogenannten Stopwörter entfernt. Dabei handelt es sich um sehr häufig vorkommende Begriffe wie und, oder, er, sie usw. Anschließend wird versucht von den übrig gebliebenen Begriffen den Wortstamm zu rekonstruieren, indem z.B. Pluralendungen entfernt werden. Die Komplexität dieses Schrittes ist sehr stark von der Sprache des Textes abhängig. Die Worte, die man nach diesem Schritt erhält, werden nun entsprechend ihrer Häufigkeit gewichtet und sortiert. Für jede Seite merkt man sich nun z.B. wieder die 30 häufigsten Begriffe. Basierend auf dieser Auswahl von Begriffen und ihrer Häufigkeit, kann man für jedes der generierten Schlüsselwörter einen repräsentativen Vektor berechnen.
Die Ähnlichkeit zweier Begriffe kann man nun als Produkt der beiden repräsentativen Vektoren definieren. Je höher das Ergebnis des Produkts, desto ähnlicher sind sich die beiden Begriffe. Etwas anschaulicher heisst das, dass sich zwei Begriffe ähnlich sind, wenn auf den Ergebnisseiten der jeweiligen Suchanfragen häufig die gleichen Begriffe vorkommen.
Wie bestimmt man die Menge potentieller Schlüsselwörter?
Bevor man Keywords auf ihre Ähnlichkeit hin untersuchen kann, müssen zunächst potentielle Kandidaten bestimmt werden. Die Basis B bildet die Menge der Webseiten, der zu bewerbenden Firma bzw. des zu bewerbenden Produkts. Für jede dieser Webseiten werden wiederum die wichtigsten Begriffe bestimmt und als potentielle Kandidaten für Schlüsselwörter vorgemerkt. Dieses initiale Verzeichnis potentieller Kandidaten kann nun noch von Hand durch relevante Begriffe ergänzt werden.
Für jeden dieser ersten Kandidaten wird nun eine Suchanfrage ausgeführt und z.B. die ersten 30 Dokumente werden analysiert und zur Basis B hinzugefügt. Aus diesen Seiten werden ebenfalls die häufigsten Begriffe extrahiert und in das Kandidatenverzeichnis aufgenommen. Dieser zweite Schritt hat zur Folge, dass evtl. allgemeinere aber immer noch relevante Begriffe in die Liste der Kandidaten aufgenommen werden.
Wie extrahiert man nun die relevanten Keywords?
Man hat nun ein großes Verzeichnis potentieller Schlüsselwörter und Informationen darüber, wie ähnlich sich entsprechende Schlüsselwörter sind. Mit Hilfe der Basis B – diese enthält alle analysierten Webseiten – kann man noch feststellen, wie häufig die einzelnen Kandidaten genau auftreten. Hierbei wird von der zusätzlichen Annahme ausgegangen, dass ein häufig vorkommendes Wort auch für Suchanfragen sehr populär ist und somit schon sehr hohe Gebote bei den einzelnen Suchmaschinen aufweist. Diese will man eher vermeiden und durch Keywords ersetzen, die immer noch relevant sind, aber weniger häufig auftreten.
Um diese zu identifizieren, konstruiert man aus dem Verzeichnis der Schlüsselwörter einen Graphen. Die Knoten bestehen dabei aus den einzelnen Schlüsselwörtern und Kanten zwischen zwei Knoten geben an, wie semantisch ähnlich sich zwei Begriffe sind. Auf diesem Graphen kann man nun einen Algorithmus ausführen, welcher ausgehend von einem signifikaten aber teuren Keyword billigere Alternativen findet, indem er Kanten entlang zu weiteren Kandidaten läuft, die eine sehr hohe Ähnlichkeit haben. Dabei werden Keywords ignoriert, die in der Basis B sehr häufig vorgekommen sind, da man davon ausgeht, dass diese relativ teuer zu ersteigern sind. Sobald man die gewünschte Menge von Schlüsselwörtern gefunden hat, terminiert das Verfahren. Diese eingeschränkte Menge an Kandidaten kann man nun beliebig kombinieren oder auch einzeln einsetzen und als Keywords bei den entsprechenden Suchmaschinen ersteigern.
Die Qualität des Verfahrens hängt dabei von der Anzahl der untersuchten Webseiten und von der Anzahl der extrahierten relevanten Begriffe der einzelnen Webseiten ab. Je mehr, desto besser das Ergebnis.
Und wie könnte nun so ein Ergebnis aussehen?
Im Paper selbst wurden empirische Untersuchungen basierend auf 96 Webseiten einer Zahnklinik und dreier Wellness-Center durchgeführt. Dabei wurden zu Beginn die häufigsten 10 Begriffe jeder Seite extrahiert. Das Ergebnis waren 328 verschiedene Begriffe. Dieses initiale Verzeichnis wurde durch weitere Suchanfragen auf 1681 Begriffe erweitert. Für diese Begriffe wurde die semantische Ähnlichkeit anhand des hier vorgestellten Verfahren bestimmt. Im folgenden exemplarisch ein Auszug aus den gewonnen Ergebnissen:
- skin: skincare, facial, treatment, face, care, occitane, product, exfoliator, dermal, body
- teeth: tooth, whitening, dentist, veneer, filling, gums, face, baby, smilesbaltimore, features
- pedicure: manicure, leg, feet, nails, treatment, skincare, tool, smilesbaltimore, massage, facial
Fazit
Semantische Keyword Tools werden in Zukunft – vor dem Hintergrund steigender Klickpreise (Bid Inflation) – für SEM-Dienstleister eine wichtige strategische Rolle spielen. Zwar ist es auch heute möglich, semantisch ähnliche und relevante Keywords zu identifizieren (der Mensch ist dafür äußerst gut geeignet), aber der dafür erforderliche Zeitaufwand limitiert die Möglichkeiten sehr stark. Semantische Keyword Tools könnten den Prozess des Keyword Research enorm verkürzen. Die Vision ist es, ein paar wenige Seed Keywords zu definieren, die durch ein semantisches Keyword Tool um relevante, aber schwer identifizierbare Begriffe automatisch ergänzt werden. In einem zweiten Schritt wird aus diesen Begriffe via Query Expansion (Analyse von Suchanfragen) eine Vielzahl speziellerer Begriffe erzeugt. Anschließend werden alle Begriffe automatisch zu verschiedenen Anzeigengruppe zusammengefasst, um dann automatisch durch Suchen der Keywords auf der Website (Scraping) Vorschläge für geeignete Landing Pages zu generieren. Zuletzt – darum wird man leider in absehbarer Ziet nicht herum kommen – muss ein Mensch (man braucht uns doch noch!) die gesamte Liste generierter Keywords und korrespondierender Landing Pages prüfen und korrigieren.
Technology rules!

Am 15. Juli 2007 um 09:50 Uhr
Ein Tool welches, zumindest ansatzweise, in diese Richtung geht, ist semager.de. Momentan eher für den deutschsprachigen Markt. Ich habe die drei o.g. Begriffe ausprobiert, die Ergebnisse waren gar nicht mal schlecht.
Am 15. Juli 2007 um 13:26 Uhr
Eine sehr interessante Suchmaschine. Damit ist es auf jeden Fall möglich zu einem Begriff passende äquivalente Begriffe zu finden. Einen kleinen Nachteil hat das ganze aber im Vergleich zu dem oben vorgestellten Verfahren. Dort wird als zusätzlicher Kontext Information aus den Webseiten der konkret zu bewerbenden Produkte bzw. der zu bewerbenden Firma ausgewertet. Diese zusätzliche Information kann genutzt werden, um evtl. passendere semantisch ähnliche Begriffe zu finden. Diese Zusatzinformation steht semager.de in dieser Form nicht direkt zur Verfügung.
Am 17. Juli 2007 um 11:36 Uhr
Man kann aber bei Semager auch auf das “Plus” Zeichen vor der URL der Suchergebnisse klicken. Dann werden die Top-Begriffe dieser URL angezeigt.
Am 17. Juli 2007 um 12:01 Uhr
[...] der Internetseite von Marketing2Null.de wurde vor kurzem ein Bericht über die Erstellung von relevanten Keywords für Suchwerbung [...]
Am 30. Juli 2007 um 15:57 Uhr
[...] meinem letzten Beitrag habe ich die grundsätzliche Funktionsweise semantischer Keyword Tools beschrieben. Ziel dieser [...]
Am 18. September 2007 um 21:09 Uhr
[...] bewirbt. Suchmaschinen haben die Möglichkeit über Textklassifizierungsalgorithmen oder semantische Keyword Tools herauszufinden, wie eng Begriffe miteinander in Verbindung stehen. Es sollte also vermieden werden, [...]
Am 8. Februar 2008 um 14:31 Uhr
[...] man über ein Keyword bereits besitzt, für andere Keywords zu nutzen. Mit Hilfe unseres semantischen Keyword Tools lassen sich Keywords anhand semantischer Ähnlichkeit kategorisieren. Weiß man, dass das [...]
Am 17. März 2008 um 20:01 Uhr
Tipps und Tools zur Keyword-Recherche…
Vor der Optimierung einer Seite für die Suchmaschinen steht immer der Prozess der Keyword-Recherche. Dabei werden qualitativ und quantitativ jene Keywörter identifiziert, auf die später mittels Suchmaschinenoptimierung optimiert werden s…
Am 12. November 2009 um 20:50 Uhr
Danke für das Tool und ihr habt eine super Seite.