Wie Suchmaschinen die Klickrate neuer Anzeigen schätzen
Alle großen Suchmaschinen determinieren das Ranking von Anzeigen (Sponsored Links) auf Basis des erwarteten Umsatzes. Leicht vereinfacht ausgedrückt wird also diejenige Anzeige, deren Produkt aus Klickrate und Gebot am höchsten ist an erster Stelle positioniert. Dieser Mechanismus erlaubt es den Betreibern von Suchmaschinen ihren Umsatz zu maximieren, da das Klickvolumen auf ersten Positionen sehr groß ist und mit sinkenden Positionen stark abfällt (Listeneffekt). Für Anzeigen, die bereits eine große Anzahl Impressions und Klicks bekommen haben, lässt sich die Klickrate einfach durch Division der Klicks mit den Impressions ermitteln und eine Anzeige kann für die Suchmaschinen optimal positioniert werden. Bei neuen Anzeigen und Keywords hingegen gibt es zu Beginn keinerlei Daten. Es besteht also die Gefahr, dass die Klickrate von Anzeigen falsch eingeschätzt wird und eine suboptimale Positionierung errechnet wird. Bis schließlich ausreichend Daten gesammelt sind, kann eine erhebliche Umsatzeinbuße durch diese Fehleinschätzung entstehen. Diese Gefahr wird vor allem dadurch verschärft, dass der Trend zu immer mehr Keywords geht, von denen jedes einzelne zwar ein geringes Suchvolumen hat, die aber im Aggregat ein großes Volumen generieren. Um für alle diese “Long Tail Keywords” ausreichend Daten zu sammeln, können einige Monate vergehen.
Suchmaschinen brauchen folglich Mittel und Wege, um die Klickrate neuer Anzeigen besser abschätzen zu können. Im Folgenden möchte ich auf die Ergebnisse eines Papers von M. Richardson, E. Dominowska and R. Ragno mit dem Titel “Predicting Clicks: Estimating the Click-Through Rate for New Ads” eingehen, um zu erläutern, welche Möglichkeiten Suchmaschinen haben, um dieses Problem zu lösen. Die Ergebnisse sind auch für praktische Anwender von Bedeutung, die effektive Anzeigen schreiben wollen, die von Suchmaschinen von Beginn an als qualitativ hochwertig eingestuft werden.
Einflussfaktoren
Die Autoren des Papers sind alle bei Microsoft angestellt und haben die Auswertungen anhand der Daten von Microsofts Suchmaschine Live Search vorgenommen. Ziel der Datenanalyse war es, Zusammenhänge zwischen der Ausprägung verschiedener Variablen und der Klickrate von Anzeigen ableiten zu können, um daraus ein Modell zur Prognose der Klickraten neuer Anzeigen abzuleiten. Es ist anzunehmen, dass alle größeren Suchmaschinen ähnliche Modelle zur Prognose von Klickraten nutzen.
HINWEIS: Die Autoren gehen hier vereinfachend davon aus, dass die Klickrate unabhängig von der Position ist, auf der eine Anzeige geschaltet wird, da es primär darum geht, positionsunabhängige Faktoren (siehe unten) zu analysieren.
Die folgenden Einflussfaktoren können bei der Schätzung der Klickrate neuer Anzeigen herangezogen werden:
Klickrate anderer Anzeigen bei gleichen Keywords:
Die Klickrate von Anzeigen unterscheidet sich in der Regel stark in Abhängigkeit des mit der Anzeige verknüpften Keywords. Verschiedene Anzeigen unterschiedlicher Advertiser, die mit identischen Keywords verknüpft sind, unterscheiden sich hingegen weniger stark in ihrer Klickrate. Es ist davon auszugehen, dass Suchmaschinen diese Daten, die ihnen ohnehin bekannt sind, nutzen, um die Klickrate zu prognostizieren.
Klickrate anderer Anzeigen bei ähnlichen Keywords:
Wenn die Klickrate für eine Anzeige für das Keyword “rote Schuhe” bekannt ist, so kann dieser Wert herangezogen werden, um die Klickrate für eine Anzeige für “rote Schuhe kaufen” zu prognostizieren. Suchmaschinen werden also versuchen, die Klickrate von Anzeigen zu berücksichtigen, die mit ähnlichen Keywords verknüpft sind.
Anzeigen-Qualität:
Da sich die Klickraten von Anzeigen in vielen Fällen aber auch bei gleichen oder sehr ähnlichen Keywords unterscheiden, ist es sinnvoll zudem die Anzeigen-Qualität mit einzubeziehen. Folgende Aspekte können berücksichtigt werden:
- Erscheinungsbild einer Anzeige: Wie viele Wörter sind im Titel/Anzeigentext? Werden kurze oder lange Wörter verwendet? Werden übermäßig viele Sonderzeichen verwendet?
- Aufmerksamkeitswirkung: Gibt es einen “call-to-action”? Enthält die Anzeige Zahlen, Prozente, oder Ähnliches?
- Display URL: Ist die Marke des Advertisers bekannt? Wie lang ist die URL? Besteht die URL aus einem Wort oder enthält sie ggf. Bindestriche?
- Qualität der Landing Page: Ist die Landing Page W3C-konform? Werden Style-Sheets genutzt? HINWEIS: Die Qualität der Landing Page hat nur dann einen Einfluss, wenn anzunehmen ist, dass sie dem Nutzer bereits durch vorhergehende Besuche bekannt ist (wie in der Regel bei Amazon oder eBay).
- Relevanz: Kommt das jeweilige Keyword genau im Titel vor? Kommt ein Teil des Keywords im Titel vor? Kommt das Keyword im Anzeigentext vor?
Zielgenauigkeit einer Anzeige
Je zielgenauer eine Anzeige, desto höher ist im Normalfall die Klickrate. Suchmaschinen haben die Möglichkeit festzustellen, mit welchen Keywords eine Anzeige verknüpft ist. Sind bspw. völlig fremde Begriffe in einer Anzeigengruppe, so wird dies sicherlich dazu führen, dass eine geringere Klickrate prognostiziert wird (und in aller Regel auch tatsächlich geringer ist) als in einem anderen Fall, in dem ein Advertiser sehr ähnliche Begriffe in einer Anzeigengruppe hat.
Beispiel:

Die obere Anzeige ist speziell auf Schuhe zugeschnitten, während die zweite Anzeige Produkte aus völlig unterschiedlichen Produktkategorien bewirbt. Suchmaschinen haben die Möglichkeit über Textklassifizierungsalgorithmen oder semantische Keyword Tools herauszufinden, wie eng Begriffe miteinander in Verbindung stehen. Es sollte also vermieden werden, völlig unterschiedliche Begriffe in einer Anzeigengruppe zusammen zu fassen, auch wenn es über “Dynamic Keyword Insertion” die Möglichkeit gibt Anzeigen zu personalisieren.
Häufigkeit einer Suchanfrage
Die Autoren des Papers gehen davon aus, dass die Häufigkeit einer Suchanfrage die Klickrate beeinflusst. Zwar konnten ihre Analysen belegen, dass die Berücksichtigung dieses Aspekts eine genauere Prognose der Klickrate ermöglicht. Ich möchte aber zumindest bezweifeln, ob die unterstellte Kausalität zutreffend ist. Plausibler scheint mir, dass die Klickrate mit der Anzahl der Wettbewerber, die auf ein Keyword bieten negativ korreliert ist. Die Anzahl der Wettbewerber wiederum steht im Normalfall in Zusammenhang mit der Häufigkeit eines Suchbegriffs. Es ist aber durchaus denkbar, dass ein Suchbegriff, der im Web selten vorkommt und auch nur selten angefragt wird, von vielen Konkurrenten berücksichtigt wurde. In diesem Fall ist sicherlich keine überdurchschnittlich hohe Klickrate zu erwarten.
Ergebnisse
Hinweise zur Interpretation der Ergebnisse:
Ein kleiner MSE (mean squared error), zu deutsch mittlere quadratische Abweichung, bedeutet, dass die mit Hilfe des Modells berechnete Klickrate im Mittel in der Nähe der tatsächlichen Klickrate liegt und dass die berechneten Werte wiederum relativ wenig streuen und somit mit großer Wahrscheinlichkeit den tatsächlichen Werten entsprechen. Die Kullback-Leibler-Divergenz stellt eine weitere Methode dar, um die tatsächlich aufgetretenen Beobachtungen mit den berechneten Modellwerten zu vergleichen. Auch hier bedeutet ein kleinerer Wert, dass das Modell der Realität besser entspricht. Entsprächen die aus dem Modell abgeleiteten Werte exakt den tatsächlichen Werten, so würde der Wert 0 resultieren.
Baseline CTR: durchschnittliche Klickrate aller untersuchten Anzeigen
Term CTR: Klickrate anderer Anzeigen bei gleichen Keywords
Related term CTR: Klickrate anderer Anzeigen bei ähnlichen Keywords
Ad Quality: Qualität der Anzeige
Order specifity: Zielgenauigkeit der Anzeige
Search Data: Wie häufig kommt ein Begriff im Web vor? Wie häufig wird er in Suchmaschinen angefragt?




Das Ergebnis zeigt, dass sich eine Verbesserung um knapp 30% erzielen lässt, wenn man die genannten Faktoren berücksichtigt und nicht einfach von einer durchschnittlichen Klickrate ausgeht.
Fazit
Die Studie zeigt, welche Möglichkeiten Betreiber von Suchmaschinen haben, um die Klickrate neuer Anzeigen zu prognostizieren. Konkrete Aussagen darüber, welche Suchmaschine nun tatsächlich welche Faktoren einbezieht, können nicht getroffen werden. Da jedoch der Umsatz der Suchmaschinen erheblich von der Fähigkeit der Prognose von Klickraten neuer Anzeigen beeinflusst wird, ist davon auszugehen, dass alle Suchmaschinen einige der hier genannten Einflussfaktoren berücksichtigen. Zudem ist anzunehmen, dass weitere hier nicht genannte Einflussfaktoren herangezogen werden. So hat bspw. der Match-Typ (Broad, Phrase, Exact) eines Keywords sicherlich auch einen Einfluss auf die Klickrate. Es wäre zu erwarten, dass Exact Matches, also Anfragen, die mit dem gewählten Keyword eines Advertisers exakt übereinstimmen, tendenziell eine höhere Klickrate haben als Broad Matches.
Für Praktiker ergeben sich folgende Empfehlungen:
- Anzeigengruppen sollten sehr eng gefasst sein und ausschließlich verwandte Begriffen beinhalten.
- Keywords nach Möglichkeit exakt im Titel verwenden.
- Keywords nach Möglichkeit auch im Anzeigentext verwenden.
- Auch auf Begriffe bieten, bei denen es weniger Konkurrenz gibt.
- Möglichst viele Suchanfragen als Exact Match abdecken.
- ständig selber empirische Untersuchungen durchführen, um zu testen, welche Anzeigentexte (Eher kurz oder eher lang? Ausrufezeichen verwenden? &-Zeichen verwenden? …) die besten Klickraten erzielen. Auf diese Weise ist es möglich, genau diejenigen Faktoren zu identifizieren, auf Basis derer die Suchmaschinen eine hohe Klickrate prognostizieren.
