<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>marketing2null.de &#187; Forschung</title>
	<atom:link href="http://www.marketing2null.de/category/forschung/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.marketing2null.de</link>
	<description></description>
	<lastBuildDate>Thu, 28 Jan 2010 08:17:19 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>Bid Management &amp; Google Adwords API-Kosten</title>
		<link>http://www.marketing2null.de/2008/02/08/bid-management-google-adwords-api-kosten/</link>
		<comments>http://www.marketing2null.de/2008/02/08/bid-management-google-adwords-api-kosten/#comments</comments>
		<pubDate>Fri, 08 Feb 2008 13:30:30 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2008/02/08/bid-management-google-adwords-api-kosten/</guid>
		<description><![CDATA[Als Suchmaschinenmarketing (SEM) vor wenigen Jahren begann rasant zu wachsen, weckte dies auch das Interesse einiger Wissenschaftler, die sich mit formalen Analysen von SEM beschäftigten. Der Fokus der Wissenschaft lag zunächst auf der formalen Analyse der zugrunde liegenden Auktionsmechanismen und Gebotsstrategien. Das wohl bekannteste Paper zum Bid Management bzw. der Gebotsoptimierung wurde im Jahr 2004 [...]]]></description>
			<content:encoded><![CDATA[<p>Als Suchmaschinenmarketing (SEM) vor wenigen Jahren begann rasant zu wachsen, weckte dies auch das Interesse einiger Wissenschaftler, die sich mit formalen Analysen von SEM beschäftigten. Der Fokus der Wissenschaft lag zunächst auf der formalen Analyse der zugrunde liegenden Auktionsmechanismen und Gebotsstrategien. Das wohl bekannteste Paper zum Bid Management bzw. der Gebotsoptimierung wurde im Jahr 2004 von <a href="http://www.cis.upenn.edu/~mkearns/teaching/SponsoredSearch/optimal.pdf">B. Kitts und B. Leblanc</a> veröffentlicht. Das Paper ist für alle, die sich ernsthaft mit Bid Management bzw. Gebotsoptimierung beschäftigen, eine Pflichtlektüre. Dennoch gehen einige sehr wichtige, praxisrelevante Aspekte unter. Es stellt sich die Frage, ob es überhaupt sinnvoll ist, für jedes Keyword optimale Gebote zu ermitteln. Zudem kommt, dass die Kosten der Nutzung der Google API altbewährte Gebotsstrategien unmöglich macht und neue Herangehensweisen erfordert. Im folgenden möchte ich auf die wichtigsten Punkte des Papers eingehen und einige praxisrelevante Tipps geben.</p>
<p><span id="more-122"></span></p>
<p>Kitts und Leblanc beschreiben die Funktionsweise eines Bietagenten, dessen Aufgabe es ist, Gebote für Keywords vollautomatisch abzugeben, Budgets zu planen und zwischen verschiedenen Keywords zu allokieren. Es geht also nicht um regelbasierte Verwaltungstools à la <a href="https://app.atlasonepoint.com/GTSignUp.aspx?plId=1">Atlas</a>, die im eigentlichen Sinne keine Optimierung gewährleisten, sondern es dem Nutzer überlassen, bestimmt Regeln (z.B. angestrebte Position, ROI) festzulegen.</p>
<p>Ziel des Bietagenten ist es, Gebote so festzulegen, dass der Gesamtgewinn maximiert wird, ohne dass eventuelle Budgetbeschränkungen überschritten werden. Kern der Optimierungsstrategie ist es, ausgehend von einem erwarteten Umsatz pro Klick, Gebote gezielt zu variieren, um schätzen zu können, wie sich das Klickvolumen durch die Erzielung unterschiedlicher Positionen verändert. Das folgende Beispiel veranschaulicht die grundsätzliche Vorgehensweise:</p>
<p>Aus historischen Daten geht hervor, dass ein Klick einen durchschnittlichen Wert von 1 € hat. Dieser Wert, als EPC (Earning per Click) bezeichnet, errechnet sich über die Division der erzielten Gewinnmarge durch die Anzahl der Klicks. Wurde mit 1000 Klicks eine Marge von 1000 € erzielt, so liegt der EPC bei 1 €. Der Bietagent hat nun über die Variation der Gebote herausgefunden, dass auf der ersten Position ein Preis von 0,9 € je Klick anfällt und 100 Klicks pro Zeiteinheit generiert werden. Auf der 5 Position kostet ein Klick nur 0,7 €, wobei nur 20 Klicks erzielt werden. Demzufolge wird auf der ersten Position ein Gewinn von 10 € pro Zeiteinheit (= 100 Klicks * (1 € &#8211; 0,9 €)) erzielt, während auf der fünften Position nur ein Gewinn von 6 € entsteht. Durch die Variation der Gebote lässt sich nun auch der erwartete Gewinn der anderen Positionen bestimmen.</p>
<h2>Ermittlung der EPCs kann teuer werden</h2>
<p>Um eine derartige Optimierung überhaupt durchführen zu können, ist es zunächst erforderlich, den EPC eines bestimmten Keywords in Erfahrung zu bringen. Die EPCs einzelner Keywords innerhalb einer SEM-Kampagne können sich sehr stark unterscheiden. Um den Earning per Click schätzen zu können, sind Daten über Klicks, Klickpreise und Conversions sowie deren Gewinnmargen erforderlich. In aller Regel ist es so, dass eine sehr geringe Anzahl von Keywords einen hohen EPC aufweisen, während sehr viele Keywords einen geringen Wert haben, der möglicherweise sogar unter dem von Google gesetzten Mindestgebot liegt. Setzt man nun einen Bietagenten auf eine größere Kampagne mit vielen tausend Keywords an &#8211; mit dem Ziel für jedes Keyword ein optimales Gebot zu determinieren, so lassen sich zwar langfristig für jedes einzelne Keyword optimale Gebote ermitteln. Fraglich ist allerdings, ob die Kosten, die dadurch entstehen, gerechtfertigt sind.  Hat man bspw. einen Account mit 50.000 Keywords und nimmt man an, dass man zur Schätzung der EPCs mindestens 100 Klicks pro Keyword braucht, so sind 5 Mio Klicks erforderlich, um alle Keywords zu testen. Bei einem Klickpreis (CPC) von nur 10 Cent fallen also Kosten von 500.000 € an. Da ein Großteil der Keywords im Normalfall einen niedrigen EPC aufweisen, könnte es sein, dass die anfänglichen Investitionen (zu Testzwecken) nie wieder eingespielt werden. Dies ist z.B. dann der Fall, wenn nach 100-200 Klicks keine Conversion angefallen ist und das Keyword aus dem Portfolio genommen wird oder wenn ein EPC von 5 Cent ermittelt wird, das Mindestgebot aber größer als 5 Cent ist.</p>
<p>Folglich braucht man Mittel und Wege, um die EPCs auf möglichst schonende Art und Weise schätzen zu können. Möglich wäre es, Faktoren wie den Preis des beworbenen Produkts im Verhältnis zum Preis von konkurrierenden Produkten zu berücksichtigen. Denkbar wäre es auch, Informationen, die man über ein Keyword bereits besitzt, für andere Keywords zu nutzen. Mit Hilfe unseres <a href="http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/">semantischen Keyword Tools</a> lassen sich Keywords anhand semantischer Ähnlichkeit kategorisieren. Weiß man, dass das Keyword &#8220;MP3-Downloads&#8221; einen EPC von 20 Cent hat, so lässt sich das initiale Gebot für das semantisch ähnliche Keyword &#8220;Musik-Downloads&#8221; auf 20 Cent setzen, ohne damit größere Verluste zu riskieren.</p>
<h2>Variation der Gebote verursacht hohe Adwords API-Kosten</h2>
<p>Der Optimierungsansatz von Kitts und Leblanc basiert auf den damaligen Rahmenbedingungen. Bis Ende 2006 war die Nutzung der Google Adwords API noch gratis. Man konnte Gebote variieren, ohne dass dafür Kosten anfielen. Das schnelle Wachstum des SEM-Marktes und die Long Tail Strategien vieler Advertiser führen zu einer großen Belastung der Adwords-Plattform, woraufhin Google sich entschloss, für die Nutzung der API Geld zu verlangen. Die Kosten, die anfallen, um Kampagnendaten über die API abzufragen, sind vernachlässigbar gering. Der Download eines Reports für einen gesamten Account kostet &#8211; unabhängig von der Anzahl der Keywords und Anzeigen &#8211; nur 25 Cent ($). Gebote hochzuladen ist hingegen sehr teuer. Der Upload eines neuen Gebots für ein einziges Keyword kostet 0,25 Cent. Geht man vom obigen Beispiel aus, so würde ein Update der Gebote aller 50.000 Keywords 125 $ kosten. Um nun für jedes einzelne Keyword herauszufinden, wie sich die Position und das Klickvolumen bei alternativen Geboten verhalten, sind während der Testphase bereits mindestens 20 Gebotsanpassungen erforderlich, was insgesamt 2500 $ kostet. Da sich der Wettbewerb ständig ändert, müssen Gebote aber auch in der restlichen Life-time einer Kampagne angepasst werden, was weitere Kosten verursacht. Die Herausforderung liegt also darin, im Zuge der Gebots-Optimierung immer abzuwägen, ob der erwartete zusätzliche Gewinn durch die Abgabe eines neuen Gebots für ein bestimmtes Keyword, die dadurch entstehenden Kosten rechtfertigt. Der Strategie, optimale Gebote für unterschiedliche Wochentage oder gar Tageszeiten abzugeben, sind damit Grenzen gesetzt.</p>
<h2>Fazit</h2>
<p>Bei der Gebotsoptimierung müssen der Zeithorizont einer Kampagne, das Klickvolumen der einzelnen Keywords und die Kosten für die Nutzung der API berücksichtigt werden.</p>
<ul>
<li><strong>Zeithorizont:</strong> Plant man, Anzeigen nur über den Zeitraum von einem Jahr zu schalten, so ist es sicherlich nicht die richtige Herangehensweise, detaillierte Informationen über jedes einzelne Keyword zu sammeln, da die Informationssuche sehr teuer werden kann. Es lohnt sich nicht, 100 € in ein Keyword zu investieren, wenn sich durch die gewonnene Information und optimierte Gebote ein zusätzlicher Gewinn von 5 € pro Monat erzielen lässt. Wird mit einer Laufzeit von mehr als 2 Jahren gerechnet, so könnte die anfängliche Investition jedoch lohnenswert sein. Je größer der Zeithorizont, desto mehr Keywords sollte man testen.</li>
<li><strong>Klickvolumen:</strong> Long Tail Keywords können schnell unprofitabel werden. Allein der Upload eines Keywords kostet rund 0,63 Cent ($), jede Gebotsabgabe kostet weitere 0,25 Cent. Viele dieser Keywords werden nie Impressions bekommen, andere werden zu hohe Mindestgebote haben. Insgesamt ist der zusätzliche Gewinn, der durch die Optimierung der Gebote erzielt werden könnte sehr gering. Regelmäßige Gebotsanpassungen in kurzen Zeitabständen sollten also nur für High Traffic Keywords unternommen werden.</li>
<li><strong>API-Kosten:</strong> Generell besteht ein Zielkonflikt, da einerseits die Kosten für die API den Gewinn negativ beeinflussen und andererseits durch Gebotsanpassungen, durch die API-Kosten entstehen, mehr Gewinn erzielt werden kann. Der durch die Optimierung erzielte zusätzliche Gewinn muss die Optimierungskosten übersteigen. Ökonomisch ausgedrückt bedeutet das, dass die Grenzkosten im Optimum genau dem Grenzertrag entsprechen.</li>
</ul>
<p>Die Ende 2006 eingeführte Bepreisung der Google API dürfte das Optimierungskalkül der Bid Management Tools älterer Tage in Frage stellen. Die Aufgabe, API Kosten im Zuge der Optimierung zu berücksichtigen, ist keinesfalls trivial und stellt eine große Herausforderung dar.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=122&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_122" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2008/02/08/bid-management-google-adwords-api-kosten/feed/</wfw:commentRss>
		<slash:comments>24</slash:comments>
		</item>
		<item>
		<title>SEM Werbebudget-Planung: 2 häufige Fehler</title>
		<link>http://www.marketing2null.de/2007/12/10/sem-werbebudget-planung-2-haeufige-fehler/</link>
		<comments>http://www.marketing2null.de/2007/12/10/sem-werbebudget-planung-2-haeufige-fehler/#comments</comments>
		<pubDate>Mon, 10 Dec 2007 09:33:17 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/12/10/sem-werbebudget-planung-2-haeufige-fehler/</guid>
		<description><![CDATA[Ich möchte im Folgenden ein Paper von M. Schwartz und R. Vohra (Two Misconceptions About Internet Advertising) vorstellen, in dem zwei häufige Fehler im SEM beleuchtet werden (kein Link, da das Paper nicht online verfügbar ist). Es geht dabei zum einen um die Festlegung von Tagesbudgets für SEM-Kampagnen und zum anderen um den optimalen Einsatz [...]]]></description>
			<content:encoded><![CDATA[<p>Ich möchte im Folgenden ein Paper von M. Schwartz und R. Vohra (Two Misconceptions About Internet Advertising) vorstellen, in dem zwei häufige Fehler im SEM beleuchtet werden (kein Link, da das Paper nicht online verfügbar ist). Es geht dabei zum einen um die Festlegung von Tagesbudgets für SEM-Kampagnen und zum anderen um den optimalen Einsatz von Werbebudgets.</p>
<h2>Fehler 1: Die Grenzen des Tagesbudgets regelmäßig erreichen</h2>
<p>Wer die Grenzen seines Tagesbudgets tatsächlich nahezu täglich erreicht, der begeht einen groben Anfängerfehler. Erfahrenen Advertisern wird dieser Fehler wohl kaum unterlaufen.</p>
<p><span id="more-110"></span></p>
<p>Die negativen Effekte liegen auf der Hand. Wird Tagesbudget-Grenze erreicht, so wird die Anzeigenschaltung schlagartig gestoppt. Nehmen wir an, ein Advertiser zahlt einen durchschnittlichen CPC von einem Euro und hat ein Tagesbudget von 500 EUR, das normalerweise irgendwann am Nachmittag erreicht wird. Nach 500 Klicks ist also Schluss. Dieser Advertiser könnte sich ganz einfach besser stellen, indem er seine Gebote so weit senkt, dass seine Budgetbeschränkung nicht mehr bindend ist. Er könnte auf diese Weise die Anzahl der Klicks deutlich steigern, ohne auch nur einen Cent mehr auszugeben.</p>
<p>Ein weiterer Effekt, der im Paper von Schwartz und Vohra nicht berücksichtigt wurde, ist die Eigenschaft des Adwords-Systems, Klicks gleichmäßig über den Tag zu verteilen (sofern man die Option nicht manuell in den Kampagneneinstellungen deaktiviert hat). Selbst wenn die Budgetbeschränkung gar nicht erst erreicht wird, liefert Google nicht die Impressions, die bei deutlich höher gesetztem Budget anfallen würden. Das liegt vermutlich daran, dass das Adwords-Systems bei plötzlichem Anstieg der Klicks zu bestimmten Tageszeiten die Anzeigenschaltung dämpft, um die gleichmäßige Verteilung der Klicks zu garantieren. Demzufolge ist es empfehlenswert, das Tagesbudget deutlich höher anzusetzen als die erwarteten Ausgaben.</p>
<h2>Fehler 2: Ausgleich des Return on Investment (ROI) nicht optimal</h2>
<p>Um das Werbebudget optimal einzusetzen, <a href="http://www.google.com/adwords/learningcenter/text/19209.html">empfiehlt Google</a>, den ROI verschiedener Keywords auszugleichen, indem die Gebote für dasjenige Keyword mit dem höheren (niedrigeren) ROI angehoben (gesenkt) werden. Diese Strategie wurde sogar wissenschaftlich untersucht und empfohlen:</p>
<blockquote><p>[...] propose a bidding heuristic to optimize the utility for bidders by equalizing the return-on-investment for each bidder across all keywords [...] </p>
<p>Quelle: <a href="http://www.business.ualberta.ca/kasdemir/ssa2/borgsetal.pdf">Borgs et al. (2005) [PDF]</a></p>
</blockquote>
<p>Fakt ist jedoch, dass diese Regel nicht zwangsläufig sinnvoll ist. Solange Budgets nicht bindend sind, ist es generell optimal, das Budget in Richtung der Keywords zu verschieben, die den größeren Grenzgewinn (Gewinn für eine zusätzliche Geldeinheit Werbung) vorweisen, nicht jedoch den ROI (durchschnittlicher Gewinn je Geldeinheit Werbung) auszugleichen. Schwartz und Vohra belegen dies anhand eines Beispiels, das ich für das leichtere Verständnis etwas ergänzen möchte. Es wird vereinfachend davon ausgegangen, dass der durchschnittliche CPC dem Gebot entspricht.</p>
<p>Es werden die beiden Keywords &#8220;Photography&#8221; und &#8220;Photography Classes&#8221; betrachtet. Das Budget ist auf 110 € beschränkt. Ein Klick für das Keyword &#8220;Photography&#8221; (&#8220;Photography Classes&#8221;) erwirtschaftet durchschnittlich einen Deckungsbeitrag von 2 € (2,25 €).</p>
<p>Angenommen für das Keyword &#8220;Photography&#8221; wird auf Postion 1 5% mehr geboten als auf Position 5. Die erste Position bekommt genau doppelt so viele Klicks, wie die fünfte Position.</p>
<p align="center"><img height="100" alt="ROI-Werbebudget-1" src="http://www.marketing2null.de/wp-content/uploads/2007/12/roi-werbebudget-1-1.jpg" width="450" /></p>
<p>Ein Advertiser, der auf der fünften Position liegt, muss folglich sein Gebot um 5% anheben, um sich an erster Stelle zu positionieren. Die Werbeausgaben steigen von 60 € auf 126 €. Die um 66 € erhöhten Werbeausgaben für dieses Keyword steigern den Deckungsbeitrag um 120 € auf 240 €. Der neue ROI beträgt 90,48%.</p>
<p>Für das Keyword &#8220;Photography Classes&#8221; sind die Rahmenbedingungen verschieden. Um von der fünften auf die erste Position zu kommen, muss der Advertiser 20% mehr zahlen, während die erste Position nur 5% mehr Klicks bekommt.</p>
<p align="center"><img height="100" alt="ROI-Werbebudget-2" src="http://www.marketing2null.de/wp-content/uploads/2007/12/roi-werbebudget-2-2.jpg" width="450" /></p>
<p>Durch die Erhöhung des Gebots auf 0,75 € würde der Advertiser seinen Deckungsbeitrag um 4,5 € von 90 € auf 94,5 € erhöhen. Die Werbekosten würden aber um 6,5 € steigen, was eine Schmälerung des Gewinns um 2 € zur Folge hätte.</p>
<p>Gehen wir nun davon aus, der Advertiser würde der Empfehlung folgen und einen Ausgleich des ROI anstreben. Er würde also das Gebot für das Keyword &#8220;Photography Classes&#8221; anheben. Der Gesamtgewinn über beide Keywords im Vergleich zur Ausgangssituation würde um 2 € sinken, obwohl die Abweichung des ROI der beiden Keywords verringert würde.</p>
<p>Der Advertiser könnte sich (in diesem Beispiel) besser stellen, indem er dem Keyword mit dem geringeren ROI mehr Budget zuweist. Eine Erhöhung seines Gebots für &#8220;Photography&#8221; um 1 Cent bei gleichem Gebot für &#8220;Photography Classes&#8221; würde zu einem zusätzlichen Gewinn von 4,35 € führen. Das Werbebudget wird folglich dann optimal eingesetzt, wenn verstärkt in diejenigen Keywords mit dem höheren Grenzgewinn investiert wird, nicht in die mit höherem ROI.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=110&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_110" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/12/10/sem-werbebudget-planung-2-haeufige-fehler/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Wie Suchmaschinen die Klickrate neuer Anzeigen schätzen</title>
		<link>http://www.marketing2null.de/2007/09/18/wie-suchmaschinen-die-klickrate-neuer-anzeigen-schaetzen/</link>
		<comments>http://www.marketing2null.de/2007/09/18/wie-suchmaschinen-die-klickrate-neuer-anzeigen-schaetzen/#comments</comments>
		<pubDate>Tue, 18 Sep 2007 19:06:23 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/09/18/wie-suchmaschinen-die-klickrate-neuer-anzeigen-schaetzen/</guid>
		<description><![CDATA[Alle großen Suchmaschinen determinieren das Ranking von Anzeigen (Sponsored Links) auf Basis des erwarteten Umsatzes. Leicht vereinfacht ausgedrückt wird also diejenige Anzeige, deren Produkt aus Klickrate und Gebot am höchsten ist an erster Stelle positioniert. Dieser Mechanismus erlaubt es den Betreibern von Suchmaschinen ihren Umsatz zu maximieren, da das Klickvolumen auf ersten Positionen sehr groß [...]]]></description>
			<content:encoded><![CDATA[<p>Alle großen Suchmaschinen determinieren das Ranking von Anzeigen (Sponsored Links) auf Basis des erwarteten Umsatzes. Leicht vereinfacht ausgedrückt wird also diejenige Anzeige, deren Produkt aus Klickrate und Gebot am höchsten ist an erster Stelle positioniert. Dieser Mechanismus erlaubt es den Betreibern von Suchmaschinen ihren Umsatz zu maximieren, da das Klickvolumen auf ersten Positionen sehr groß ist und mit sinkenden Positionen stark abfällt (Listeneffekt). Für Anzeigen, die bereits eine große Anzahl Impressions und Klicks bekommen haben, lässt sich die Klickrate einfach durch Division der Klicks mit den Impressions ermitteln und eine Anzeige kann für die Suchmaschinen optimal positioniert werden. Bei neuen Anzeigen und Keywords hingegen gibt es zu Beginn keinerlei Daten. Es besteht also die Gefahr, dass die Klickrate von Anzeigen falsch eingeschätzt wird und eine suboptimale Positionierung errechnet wird. Bis schließlich ausreichend Daten gesammelt sind, kann eine erhebliche Umsatzeinbuße durch diese Fehleinschätzung entstehen. Diese Gefahr wird vor allem dadurch verschärft, dass der Trend zu immer mehr Keywords geht, von denen jedes einzelne zwar ein geringes Suchvolumen hat, die aber im Aggregat ein großes Volumen generieren. Um für alle diese &#8220;Long Tail Keywords&#8221; ausreichend Daten zu sammeln, können einige Monate vergehen.</p>
<p>Suchmaschinen brauchen folglich Mittel und Wege, um die Klickrate neuer Anzeigen besser abschätzen zu können. Im Folgenden möchte ich auf die Ergebnisse eines Papers von M. Richardson, E. Dominowska and R. Ragno mit dem Titel &#8220;<a href="http://www2007.org/papers/paper784.pdf">Predicting Clicks: Estimating the Click-Through Rate for New Ads</a>&#8221; eingehen, um zu erläutern, welche Möglichkeiten Suchmaschinen haben, um dieses Problem zu lösen. Die Ergebnisse sind auch für praktische Anwender von Bedeutung, die effektive Anzeigen schreiben wollen, die von Suchmaschinen von Beginn an als qualitativ hochwertig eingestuft werden.</p>
<p><span id="more-94"></span></p>
<h2>Einflussfaktoren</h2>
<p>Die Autoren des Papers sind alle bei Microsoft angestellt und haben die Auswertungen anhand der Daten von Microsofts Suchmaschine Live Search vorgenommen. Ziel der Datenanalyse war es, Zusammenhänge zwischen der Ausprägung verschiedener Variablen und der Klickrate von Anzeigen ableiten zu können, um daraus ein Modell zur Prognose der Klickraten neuer Anzeigen abzuleiten. Es ist anzunehmen, dass alle größeren Suchmaschinen ähnliche Modelle zur Prognose von Klickraten nutzen.</p>
<p><em>HINWEIS: Die Autoren gehen hier vereinfachend davon aus, dass die Klickrate unabhängig von der Position ist, auf der eine Anzeige geschaltet wird, da es primär darum geht, positionsunabhängige Faktoren (siehe unten) zu analysieren.</em></p>
<p>Die folgenden Einflussfaktoren können bei der Schätzung der Klickrate neuer Anzeigen herangezogen werden:</p>
<h3>Klickrate anderer Anzeigen bei gleichen Keywords:</h3>
<p>Die Klickrate von Anzeigen unterscheidet sich in der Regel stark in Abhängigkeit des mit der Anzeige verknüpften Keywords. Verschiedene Anzeigen unterschiedlicher Advertiser, die mit identischen Keywords verknüpft sind, unterscheiden sich hingegen weniger stark in ihrer Klickrate. Es ist davon auszugehen, dass Suchmaschinen diese Daten, die ihnen ohnehin bekannt sind, nutzen, um die Klickrate zu prognostizieren.</p>
<h3>Klickrate anderer Anzeigen bei ähnlichen Keywords:</h3>
<p>Wenn die Klickrate für eine Anzeige für das Keyword &#8220;rote Schuhe&#8221; bekannt ist, so kann dieser Wert herangezogen werden, um die Klickrate für eine Anzeige für &#8220;rote Schuhe kaufen&#8221; zu prognostizieren. Suchmaschinen werden also versuchen, die Klickrate von Anzeigen zu berücksichtigen, die mit ähnlichen Keywords verknüpft sind.</p>
<h3>Anzeigen-Qualität:</h3>
<p>Da sich die Klickraten von Anzeigen in vielen Fällen aber auch bei gleichen oder sehr ähnlichen Keywords unterscheiden, ist es sinnvoll zudem die Anzeigen-Qualität mit einzubeziehen. Folgende Aspekte können berücksichtigt werden:</p>
<ul>
<li>
<strong>Erscheinungsbild einer Anzeige:</strong> Wie viele Wörter sind im Titel/Anzeigentext? Werden kurze oder lange Wörter verwendet? Werden übermäßig viele Sonderzeichen verwendet?</li>
<li>
<strong>Aufmerksamkeitswirkung:</strong> Gibt es einen &#8220;call-to-action&#8221;? Enthält die Anzeige Zahlen, Prozente, oder Ähnliches?</li>
<li>
<strong>Display URL:</strong> Ist die Marke des Advertisers bekannt? Wie lang ist die URL? Besteht die URL aus einem Wort oder enthält sie ggf. Bindestriche?</li>
<li>
<strong>Qualität der Landing Page:</strong> Ist die Landing Page W3C-konform? Werden Style-Sheets genutzt? HINWEIS: Die Qualität der Landing Page hat nur dann einen Einfluss, wenn anzunehmen ist, dass sie dem Nutzer bereits durch vorhergehende Besuche bekannt ist (wie in der Regel bei Amazon oder eBay).</li>
<li>
<strong>Relevanz:</strong> Kommt das jeweilige Keyword genau im Titel vor? Kommt ein Teil des Keywords im Titel vor? Kommt das Keyword im Anzeigentext vor?</li>
</ul>
<h3>Zielgenauigkeit einer Anzeige</h3>
<p>Je zielgenauer eine Anzeige, desto höher ist im Normalfall die Klickrate. Suchmaschinen haben die Möglichkeit festzustellen, mit welchen Keywords eine Anzeige verknüpft ist. Sind bspw. völlig fremde Begriffe in einer Anzeigengruppe, so wird dies sicherlich dazu führen, dass eine geringere Klickrate prognostiziert wird (und in aller Regel auch tatsächlich geringer ist) als in einem anderen Fall, in dem ein Advertiser sehr ähnliche Begriffe in einer Anzeigengruppe hat.</p>
<p>Beispiel:</p>
<p align="center"><img height="121" alt="Zielgenauigkeit von Anzeigen" src="http://www.marketing2null.de/wp-content/uploads/2007/09/zielgenauigkeitvonanzeigen-1.jpg" width="307" /></p>
<p>Die obere Anzeige ist speziell auf Schuhe zugeschnitten, während die zweite Anzeige Produkte aus völlig unterschiedlichen Produktkategorien bewirbt. Suchmaschinen haben die Möglichkeit über Textklassifizierungsalgorithmen oder <a href="http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools">semantische Keyword Tools</a> herauszufinden, wie eng Begriffe miteinander in Verbindung stehen. Es sollte also vermieden werden, völlig unterschiedliche Begriffe in einer Anzeigengruppe zusammen zu fassen, auch wenn es über &#8220;Dynamic Keyword Insertion&#8221; die Möglichkeit gibt Anzeigen zu personalisieren.</p>
<h3>Häufigkeit einer Suchanfrage</h3>
<p>Die Autoren des Papers gehen davon aus, dass die Häufigkeit einer Suchanfrage die Klickrate beeinflusst. Zwar konnten ihre Analysen belegen, dass die Berücksichtigung dieses Aspekts eine genauere Prognose der Klickrate ermöglicht. Ich möchte aber zumindest bezweifeln, ob die unterstellte Kausalität zutreffend ist. Plausibler scheint mir, dass die Klickrate mit der Anzahl der Wettbewerber, die auf ein Keyword bieten negativ korreliert ist. Die Anzahl der Wettbewerber wiederum steht im Normalfall in Zusammenhang mit der Häufigkeit eines Suchbegriffs. Es ist aber durchaus denkbar, dass ein Suchbegriff, der im Web selten vorkommt und auch nur selten angefragt wird, von vielen Konkurrenten berücksichtigt wurde. In diesem Fall ist sicherlich keine überdurchschnittlich hohe Klickrate zu erwarten.</p>
<h2>Ergebnisse</h2>
<p>Hinweise zur Interpretation der Ergebnisse:</p>
<p>Ein kleiner <em>MSE</em> (mean squared error), zu deutsch mittlere quadratische Abweichung, bedeutet, dass die mit Hilfe des Modells berechnete Klickrate im Mittel in der Nähe der tatsächlichen Klickrate liegt und dass die berechneten Werte wiederum relativ wenig streuen und somit mit großer Wahrscheinlichkeit den tatsächlichen Werten entsprechen. Die <em>Kullback-Leibler-Divergenz</em> stellt eine weitere Methode dar, um die tatsächlich aufgetretenen Beobachtungen mit den berechneten Modellwerten zu vergleichen. Auch hier bedeutet ein kleinerer Wert, dass das Modell der Realität besser entspricht. Entsprächen die aus dem Modell abgeleiteten Werte exakt den tatsächlichen Werten, so würde der Wert 0 resultieren.</p>
<p><b>Baseline CTR:</b> durchschnittliche Klickrate aller untersuchten Anzeigen<br />
<b>Term CTR:</b> Klickrate anderer Anzeigen bei gleichen Keywords<br />
<b>Related term CTR:</b> Klickrate anderer Anzeigen bei ähnlichen Keywords<br />
<b>Ad Quality:</b> Qualität der Anzeige<br />
<b>Order specifity:</b> Zielgenauigkeit der Anzeige<br />
<b>Search Data:</b> Wie häufig kommt ein Begriff im Web vor? Wie häufig wird er in Suchmaschinen angefragt?</p>
<p>&nbsp;</p>
<p align="center"><img height="98" alt="Table1" src="http://www.marketing2null.de/wp-content/uploads/2007/09/table1.jpg" width="358" /></p>
<p align="center"><img height="101" alt="Table2" src="http://www.marketing2null.de/wp-content/uploads/2007/09/table2.jpg" width="365" /></p>
<p align="center"><img height="98" alt="Table3" src="http://www.marketing2null.de/wp-content/uploads/2007/09/table3.jpg" width="367" /></p>
<p align="center"><img height="114" alt="Table4" src="http://www.marketing2null.de/wp-content/uploads/2007/09/table4.jpg" width="367" /></p>
<p>Das Ergebnis zeigt, dass sich eine Verbesserung um knapp 30% erzielen lässt, wenn man die genannten Faktoren berücksichtigt und nicht einfach von einer durchschnittlichen Klickrate ausgeht. </p>
<h2>Fazit</h2>
<p>Die Studie zeigt, welche Möglichkeiten Betreiber von Suchmaschinen haben, um die Klickrate neuer Anzeigen zu prognostizieren. Konkrete Aussagen darüber, welche Suchmaschine nun tatsächlich welche Faktoren einbezieht, können nicht getroffen werden. Da jedoch der Umsatz der Suchmaschinen erheblich von der Fähigkeit der Prognose von Klickraten neuer Anzeigen beeinflusst wird, ist davon auszugehen, dass alle Suchmaschinen einige der hier genannten Einflussfaktoren berücksichtigen. Zudem ist anzunehmen, dass weitere hier nicht genannte Einflussfaktoren herangezogen werden. So hat bspw. der Match-Typ (Broad, Phrase, Exact) eines Keywords sicherlich auch einen Einfluss auf die Klickrate. Es wäre zu erwarten, dass Exact Matches, also Anfragen, die mit dem gewählten Keyword eines Advertisers exakt übereinstimmen, tendenziell eine höhere Klickrate haben als Broad Matches.</p>
<p>Für Praktiker ergeben sich folgende Empfehlungen:</p>
<ul>
<li>Anzeigengruppen sollten sehr eng gefasst sein und ausschließlich verwandte Begriffen beinhalten.</li>
<li>Keywords nach Möglichkeit exakt im Titel verwenden.</li>
<li>Keywords nach Möglichkeit auch im Anzeigentext verwenden.</li>
<li>Auch auf Begriffe bieten, bei denen es weniger Konkurrenz gibt.</li>
<li>Möglichst viele Suchanfragen als Exact Match abdecken.</li>
<li>ständig selber empirische Untersuchungen durchführen, um zu testen, welche Anzeigentexte (Eher kurz oder eher lang? Ausrufezeichen verwenden? &amp;-Zeichen verwenden? &#8230;) die besten Klickraten erzielen. Auf diese Weise ist es möglich, genau diejenigen Faktoren zu identifizieren, auf Basis derer die Suchmaschinen eine hohe Klickrate prognostizieren.</li>
</ul>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=94&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_94" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/09/18/wie-suchmaschinen-die-klickrate-neuer-anzeigen-schaetzen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Übersicht über Auktionsmechanismen</title>
		<link>http://www.marketing2null.de/2007/08/30/uebersicht-ueber-auktionsmechanismen/</link>
		<comments>http://www.marketing2null.de/2007/08/30/uebersicht-ueber-auktionsmechanismen/#comments</comments>
		<pubDate>Thu, 30 Aug 2007 10:54:14 +0000</pubDate>
		<dc:creator>Christof König</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/08/30/uebersicht-ueber-auktionsmechanismen/</guid>
		<description><![CDATA[Suchmaschinenmarketing hat während der letzten Jahre sehr an Bedeutung gewonnen. Google konnte in diesem Zeitraum ein starkes Umsatzwachstum realisieren, wobei ein Großteil dieser Umsätze durch die Versteigerung von Werbeanzeigen neben den generischen Suchresultaten erzielt wurde. Für den Erfolg der Suchmaschinenanbieter ist die Ausgestaltung bzw. das Design des Auktionsmechanismus&#8217; von großer Bedeutung, da dadurch zum einen [...]]]></description>
			<content:encoded><![CDATA[<p>Suchmaschinenmarketing hat während der letzten Jahre sehr an Bedeutung gewonnen. Google konnte in diesem Zeitraum ein starkes Umsatzwachstum realisieren, wobei ein Großteil dieser Umsätze durch die Versteigerung von Werbeanzeigen neben den generischen Suchresultaten erzielt wurde. Für den Erfolg der Suchmaschinenanbieter ist die Ausgestaltung bzw. das Design des Auktionsmechanismus&#8217; von großer Bedeutung, da dadurch zum einen die Umsätze und zum anderen die Relevanz der Suchergebnisse betroffen sind. Prinzipiell laufen die verschiedenen Auktionsmechanismen nach dem gleichen Verfahren ab. Ein Advertiser bestimmt eine Menge von Begriffen/Keywords, welche für das zu bewerbende Produkt relevant sind. Jeder Advertiser gibt nun für die von ihm bestimmten Keywords Gebote ab, welche angeben, wie viel er bereit ist maximal zu bezahlen, falls seine Anzeige geschaltet wird und ein Kunde auf die Anzeige klickt.</p>
<p>Sobald ein Benutzer der Suchmaschine eine Suche durchführt werden neben den generischen Suchergebnissen auch Werbeanzeigen eingeblendet. Dabei werden nur Werbeanzeigen berücksichtigt deren Keywords zur Suchanfrage passen. Die Reihenfolge, in der die Anzeigen dargestellt werden, hängt in erster Linie vom Gebot des Advertisers ab, wird aber auch von anderen Faktoren wie der Klickrate beeinflusst. Geht man vereinfachend davon aus, dass die Qualität der Anzeigen aller Teilnehmer einer Keyword-Auktion identisch ist (gleiche Klickrate), so wird die Anzeige mit dem höchsten Gebot an erster Stelle positioniert, die Anzeige mit dem zweithöchsten Gebot an zweiter Stelle usw. Das höchste Gebot führt also zur Top-Position, auf welche von den Suchmaschinenbenutzern im Regelfall häufiger geklickt wird als auf weiter unten aufgeführte Anzeigen. Klickt ein Benutzer auf eine Anzeige, wird dem Advertiser ein Betrag kleiner gleich seinem Maximalgebot in Rechnung gestellt. Bei gleicher Anzeigenqualität zahlt jeder Advertiser einen Cent mehr als der darunter liegende Advertiser bietet (Zum Nachlesen: <a title="Beschreibung von Googles Ranking Mechanismus" href="http://www.marketing2null.de/2007/08/14/neue-adwords-ranking-formel-motivation-und-auswirkungen/">Erläuterung des Ranking-Mechanismus</a>).</p>
<h2>Wie wird das Ranking berechnet und was hat der Advertiser zu bezahlen?</h2>
<p>Abhängig vom tatsächlich verwendeten Auktionsmechanismus des Suchmaschinenanbieters ergibt sich ein unterschiedliches Ranking der Anzeigen und der zu bezahlende Preis für einen Klick auf eine Anzeige unterscheidet sich. Im Folgenden wird auf die folgenden Verfahren genauer eingegangen:</p>
<ul>
<li>Generalized First Price Auktion</li>
<li>Generalized Second Price Auktion</li>
<li>Vickrey-Clarke-Groves (VCG) Auktion</li>
</ul>
<p><span id="more-84"></span></p>
<h2>Generalized First Price Auktion</h2>
<p>In den Anfängen des Suchmaschinenmarketings (Overture, 1997) wurden Anzeigen einfach nach der Höhe des Gebots positioniert und bei einem Klick wurde als zu zahlender Betrag das Maximalgebot festgelegt.</p>
<p>Der Vorteil dieses Verfahrens liegt beim Suchmaschinenbetreiber, da er einen Preis in Höhe der maximalen Zahlungsbereitschaft des Advertisers in Rechnung stellen kann. Für die Anbieter ergibt sich damit die Situation, dass sie evtl. viel zu viel für ihre tatsächliche Position zahlen. Um ihre Kosten zu senken, werden sie also immer wieder ihre Gebote anpassen und testen, ob sich ihre Position ändert. Damit sind derartige Auktionsverfahren sehr instabil, da alle Advertiser versuchen ihren Gewinn zu optimieren, indem sie ihre Kosten minimieren.</p>
<p>Das folgende Beispiel basiert auf einem Paper von <a title="Internet advertising and the generalized second price auction: Selling billions of dollars worth of keywords" href="http://rwj.berkeley.edu/schwarz/publications/gsp051003.pdf">Edelman, Ostrovsky und Schwarz</a>. Angenommen es sind zwei Anzeigepositionen zu vergeben und drei Bieter (A, B und C) für diese Positionen. Diese bieten jeweils 10 EUR, 4 EUR und 2 EUR pro Klick. Position 1 erhält pro Stunde 200 Klicks und Position 2 erhält im gleichen Zeitraum 100 Klicks. Anbieter A zahlt somit 2000 EUR und Anbieter B 400 EUR. Dabei wird Anbieter B aber relativ schnell herausfinden, dass er eigentlich nur 2,01 EUR zahlen müßte, Anbieter A dagegen nur 2,02 EUR. Nun könnte aber Anbieter B mit einem Gebot von 2,03 EUR seine Position verbessern, so dass sich mit der Zeit die Preise langsam wieder hochschaukeln. Hierbei haben die Anbieter die am schnellsten reagieren sehr deutliche Vorteile gegenüber ihren Mitbewerbern. Durch die ständige Interaktion der Advertiser in Form von Gebotsanpassungen kommt es also zu erheblichen Ineffizienzen.</p>
<h2>Generalized Second Price Auktion</h2>
<p>Auch bei diesem Verfahren werden die Gebote nach der Höhe der Gebote positioniert. Allerdings ergeben sich andere Kosten pro Klick. Der Advertiser an Position <em>i</em> zahlt für einen Klick das Maximalgebot des Advertisers an Position <em>i+1</em> plus einen zusätzlichen Betrag von normalerweise einem Cent bzw. der jeweils kleinsten Einheit der verwendeten Währung (wird im folgenden nicht berücksichtigt).</p>
<p>Damit zahlt ein Advertisers den Minimalbetrag, den er hätte bieten müssen, damit seine Anzeige an der tatsächlichen Position erschienen wäre. Damit besteht für den Advertiser kein unmittelbarer Anlass seine Gebote non-stop anzupassen, um zu prüfen, ob er denn auch noch mit einem niedrigeren Gebot an gleicher Position erscheinen würde, wie dies bei GFP Auktionen der Fall ist.</p>
<p>Basierend auf obigem Beispiel würde Anbieter A 4 EUR und Anbieter B 2 EUR zahlen. Somit zahlt A 800 EUR und B 200 EUR. Der zu zahlende Betrag für einen Klick hängt also nur von den Geboten der Mitbewerber ab, nicht aber vom eigenen Gebot.</p>
<p>Dieses Verfahren wurde 2002 von Google eingeführt und später von Yahoo!/Overture übernommen. Zur Bestimmung des Rankings berücksichtigen beide Anbieter heute neben dem Gebot auch einen Qualitätsfaktor (maßgeblich durch die Klickrate beeinflusst). Auf diese Weise werden Anzeigen, die für mehr Umsatz für den Suchmaschinenbetreiber sorgen, weiter oben platziert („Ranking by Revenue“).</p>
<h2>Vickrey-Clarke-Groves (VCG) Auktion</h2>
<p>Ein weiteres Auktionsverfahren basiert auf dem sog. Vickrey-Clarke-Groves Mechanismus. Dabei werden auch hier normalerweise die Anzeigen entsprechend der Gebote angeordnet, d.h. die Anzeige mit dem höchsten Gebote landet wieder an erster Stelle.</p>
<p>Dem muss aber nicht immer so sein, sondern nur wenn sich die Klickrate einer Anzeige an einer konkreten Position allein aus dem Produkt der Qualität der Anzeige und einem positionsabhängigen Faktor, der das Verhalten der Sucher repräsentiert, ergibt. Dabei handelt es sich aber um eine gängige Annahme, so dass wir im folgenden davon ausgehen, dass Anzeigen anhand ihres Gebots positioniert werden. Trifft diese Annahme dagegen nicht zu, kann es in einer VCG Auktion dazu kommen, dass Anzeigen mit einem niedrigeren Gebot höher positioniert werden als Anzeigen mit einem höheren Gebot (hierbei spielen Qualitätsfaktoren aber keine Rolle).</p>
<p>In einer VCG Auktion versucht der Auktionator den Nutzen aller an der Auktion Beteiligten zu maximieren. Dabei kennt er nur die mitgeteilten Gebote und somit nicht zwangsweise den realen Nutzen den einzelne Advertiser durch einen Klick auf ihre Anzeige realisieren. Jeder Advertiser kennt dagegen seinen eigenen Nutzen, den er für den Klick auf eine Anzeige erfährt, und sein tatsächlich abgegebenes Gebot. Damit der Auktionator den tatsächlichen Nutzen mitgeteilt bekommt, muss er für die Advertiser einen Anreiz schaffen, ihm den wahren Nutzen mitzuteilen. Dazu zahlt er &#8211; vereinfacht ausgedrückt &#8211; jedem Advertiser die Summe der Gebote der Mitbewerber für den von ihm ermittelten optimalen Fall der Anzeigenpositionierung aus. Das hat zur Folge, dass die zu maximierende Zielfunktion des Auktionators identisch zu der des Advertisers ist, falls dieser als Gebot seinen tatsächlichen Nutzen angibt. Das hat zur Folge, dass in einer VCG Auktion alle Advertiser als Gebot ihren wahren Nutzen angeben. Diese Eigenschaft bezeichnet man als <em>truth-telling</em>.</p>
<p>Die Kosten für den Advertiser an Position <em>i</em> ergeben sich aus der Differenz zweier Summen <em>s_1</em> und <em>s_2</em>. Dabei ergibt sich <em>s_1</em> aus der Summe des Nutzens, den alle Mitbewerber erfahren hätten, falls Advertiser <em>i</em> nicht an der Auktion teilgenommen hätte. Die Summe <em>s_2</em> ist dagegen die Summe des Nutzens der Mitbewerber, falls Advertiser <em>i</em> doch an der Auktion teilnimmt. Dabei kann man ausnutzen, dass alle Advertiser, deren Anzeigen oberhalb von <em>i</em> angezeigt werden, durch diesen nicht beeinflusst werden. Ihr Nutzen ist also in beiden Summen identisch. Man braucht somit nur Mitbewerber zu berücksichtigen, die unterhalb von <em>i</em> gerankt werden.</p>
<p>Für das obige Beispiel ergeben sich dann für Anbieter B die folgenden Kosten: falls B fehlt, wäre C eine Position höher und hätte in einer Stunde einen Nutzen von 200 EUR. Da C aber, falls B an der Auktion teilnimmt, gar nicht gerankt wird, ergibt sich in diesem Fall ein Nutzen von 0 EUR. Die Differenz daraus sind 200 EUR, welche B zu bezahlen hat.</p>
<p>Für A ergeben sich 600 EUR als Kosten. Nimmt A nicht an der Auktion teil, hätte B einen Nutzen von 4 EUR * 200 = 800 EUR und B einen Nutzen von 2 EUR * 100 = 200 EUR. Also insgesamt 1000 EUR. Da aber A an der Auktion teilnimmt ergibt sich für C 0 EUR Nutzen und für B nur ein Nutzen von 4 EUR * 100 = 400 EUR. Also in der Summe 400 EUR. Die Differenz beträgt somit 600 EUR.</p>
<p>Wie man hier schon erkennen kann sind die Preise im Falle einer VCG Auktion kleiner gleich den Kosten in einer GSP Auktion. Dies ist für den Fall, dass Advertiser in einer GSP Auktion und in einer VCG Auktion die gleichen Gebote abgeben, immer der Fall.</p>
<h2>Unterschied: GSP &#8211; VCG</h2>
<p>VCG ist <em>truth-telling</em>, GSP dagegen nicht. Betrachtet man wieder obiges Beispiel und geht davon aus, dass die Gebote von 10 EUR, 4 EUR und 2 EUR dem tatsächlichen Nutzen entsprechen. Allerdings erhalte die 2. Position nun 199 Klicks pro Stunde, während die erste Position immer noch 200 Klicks pro Stunde erhält. Dann ergibt sich für Anbieter A bei seinem wahrhaftigen Gebot ein Gewinn von (10 EUR &#8211; 4 EUR) * 200 = 1200 EUR. Bietet A dagegen nur 3 EUR, wird seine Anzeige an die 2. Position gesetzt und er erhält als Gewinn (10 EUR &#8211; 2 EUR) * 199 = 1592 EUR. Also einen größeren Gewinn, wenn er nicht die Wahrheit sagt.</p>
<p>Betrachtet man in diesem Beispiel dagegen eine VCG Auktion mit den ursprünglichen Geboten und den abgewandelten Klickraten. Dann ergeben sich für Anbieter A die folgenden Kosten: (4 EUR * 200) + (2 EUR * 199) &#8211; (4 EUR * 199) = 402 EUR. Das macht einen Gewinn von 10 EUR * 200 &#8211; 402 EUR = 1598.</p>
<p>Gibt A dagegen ein Gebot von 3 EUR an, hat er insgesamt 2 EUR * 199 = 398 EUR zu zahlen. Das macht einen Gewinn von 10 EUR * 199 &#8211; 398 EUR = 1592. Es rentiert sich in diesem Fall für A nicht ein Gebot ungleich seinem tatsächlichen Nutzen abzugeben.</p>
<h2>Warum wird VCG nicht eingesetzt?</h2>
<p>VCG hätte für die Advertiser den Vorteil, dass sie ihr Gebot relativ einfach festlegen können, wenn ihnen der Nutzen eines Klicks auf eine Anzeige bekannt ist. In einer VCG Auktion geben sie diesen direkt als Gebot an und müssen sich keine weiteren Gedanken machen. Warum wird das VCG Verfahren weder bei Google noch bei Yahoo eingesetzt?</p>
<p>Ein Nachteil für die Suchmaschinenanbieter besteht darin, dass sie zum Teil wesentlich geringere Einnahmen haben, da in allen Fällen die Einnahmen bei einer VCG Auktion geringer sind, wenn die Gebote gleich sind. Außerdem ist der Auktionsmechanismus deutlich komplexer und aufwendiger zu implementieren als bei einer GSP Auktion. Schon laufende und bewährte Systeme müssten ersetzt werden.</p>
<p>Desweiteren ist es potentiellen Advertisern wohl wesentlich schwieriger zu vermitteln, wie sich die Kosten pro Klick tatsächlich berechnen. Hier haben sowohl GFP als auch GSP wesentliche Vorteile in der einfachen Erklärbarkeit.</p>
<p>Trotzdem besteht für Advertiser sicher ein Anreiz auf Plattformen zu agieren, die eine VCG Auktion anbieten. Dies könnte evtl. kleinere Mitbewerber im Suchmaschinenumfeld dazu veranlassen, einen VCG-Mechanismus zu implementieren. Ein weiterer Vorteil für Advertiser (neben den niedrigeren Klickpreisen) liegt darin, dass der Aufwand bei der Optimierung von Kampagnen deutlich zurück gehen würde, da nicht mehr auf die Strategien anderer Advertiser reagiert werden müsste, sondern einfach ein Gebot in Höhe des eigenen tatsächlichen Nutzens ausreichend wäre.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=84&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_84" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/08/30/uebersicht-ueber-auktionsmechanismen/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Mobile Marketing: Klassifizierung und Ziele mobiler Marketing-Kampagnen</title>
		<link>http://www.marketing2null.de/2007/08/09/mobile-marketing-klassifizierung-und-ziele-mobiler-marketing-kampagnen/</link>
		<comments>http://www.marketing2null.de/2007/08/09/mobile-marketing-klassifizierung-und-ziele-mobiler-marketing-kampagnen/#comments</comments>
		<pubDate>Thu, 09 Aug 2007 13:30:23 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Mobile Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/08/09/mobile-marketing-klassifizierung-und-ziele-mobiler-marketing-kampagnen/</guid>
		<description><![CDATA[Marketing-Experten schätzen mobile Endgeräte als äußerst viel versprechende Marketing-Tools ein. Mobile Marketing ist eine sehr junge Disziplin und bisher eher eine Nische, hat aber dennoch ein großes Potenzial. Für diejenigen, die keine Experten auf dem Gebiet sind, möchte ich im Folgenden etwas zum Grundverständnis beitragen und ein Paper von Key Pousttchi und Dietmar G. Wiedemann [...]]]></description>
			<content:encoded><![CDATA[<p>Marketing-Experten schätzen mobile Endgeräte als äußerst viel versprechende Marketing-Tools ein. Mobile Marketing ist eine sehr junge Disziplin und bisher eher eine Nische, hat aber dennoch ein großes Potenzial. Für diejenigen, die keine Experten auf dem Gebiet sind, möchte ich im Folgenden etwas zum Grundverständnis beitragen und ein <a href="http://www.wi-mobile.de/fileadmin/Papers/weitere/Categorizing-Mobile-Marketing-Campaigns_47-ICMB.pdf">Paper von Key Pousttchi und Dietmar G. Wiedemann</a> [PDF] vorstellen. Während in den meisten wissenschaftlichen Studien zum mobilen Marketing Erfolgsfaktoren oder die Akzeptanz der Nutzer untersucht wird, konzentrieren Pousttchi und Wiedemann sich darauf, mobile Marketing-Kampagnen zu klassifizieren. Das Ergebnis einer Analyse von 55 Fallstudien (u.a. BMW, Coca Cola, Ferrero, O2) sind vier Grundtypen mobiler Marketing-Kampagnen sowie eine Beschreibung der damit verfolgten Ziele.</p>
<p>Im Folgenden möchte ich die Studie und die daraus abgeleiteten Ergebnisse in aller Kürze zusammenfassen.</p>
<p><span id="more-65"></span></p>
<h2>Mobile Marketing</h2>
<p>Die Autoren definieren Mobile Marketing als <em>&#8220;form of marketing communication using mobile communication techniques to promote goods, services and ideas&#8221;</em>.</p>
<p>Das Wachstum des mobilen Marketings ist in erster Linie auf drei Faktoren zurückzuführen:</p>
<ul>
<li>weltweit steigende Verbreitung mobiler Endgeräte.</li>
<li>Bildschirmgrößen der Endgeräte werden größer.</li>
<li>Steigende Bandbreiten durch 3G-Netze.</li>
</ul>
<p>Zudem eröffnen Faktoren wie Ubiquität (Handy ist fast immer und überall verfügbar; keine räumlichen und zeitlichen Einschränkungen) und Kontextsensitivität (z.B. Bereitstellung spezifischer Angebote durch Ortung des Nutzers) Möglichkeiten für das Marketing, die es bislang nicht gab. Im Vergleich zu traditionellen Massenmedien, ist es durch Mobile Marketing möglich, Maßnahmen direkt auf den Nutzer und seine Bedürfnisse zuzuschneiden und sogar mit ihm zu interagieren. Mobile Endgeräte sind somit optimal für die individualisierte und dialogorientierte Kommunikation geeignet.</p>
<h2>Charakteristika mobiler Marketing-Kampagnen</h2>
<p>Grundsätzlich lassen sich zwei Arten mobiler Marketing-Kampagnen unterscheiden. In Push-Kampagnen werden Werbebotschaften vom Werbetreibenden initiiert, indem Werbebotschaften ohne vorherige Anforderung an den Nutzer geschickt werden. Pull-Kampagnen hingegen zeichnen sich dadurch aus, dass der Nutzer bestimmte Informationen aktiv anfordert. Bisherige Erkenntnisse zeigen, dass die Nutzer das mobile Marketing nur dann akzeptieren, wenn sie durch den Empfang von Nachrichten bzw. Werbebotschaften einen <em>Mehrwert</em> sehen. Folglich muss Mobile Marketing immer mit der Absicht durchgeführt werden, dem Nutzer etwas zu liefern, das er wertschätzt (Information, Unterhaltung, Gewinnspiele,&#8230;).</p>
<p>Bevor man einem Nutzer Werbung schicken darf, muss man ihn dazu bewegen, sein Einverständnis zu geben (Opt-in). Zur Übermittlung der Werbebotschaften kommen verschiedene Technologien wie IVR (Interactive Voice Response), SMS, MMS oder WAP zum Einsatz. Zudem kann Werbung auch mit Hilfe von Java-Anwendungen (Handy-Spiele; in-game-advertising) kommuniziert werden. Auch LBS (location-based services) können zum Einsatz kommen, um den Nutzer bspw. über Angebote in seiner räumlichen Umgebung zu informieren.</p>
<p>Die einzelne Charakteristika und Instanzen mobiler Marketing-Kampagnen sind der von Pousttchi und Wiedemann entwickelten, so genannten morphologischen Box, zu entnehmen.</p>
<p><img height="231" alt="Morphologische Box" src="http://www.marketing2null.de/wp-content/uploads/2007/08/morphologische-box.jpg" width="450" /></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<h2>Ableitung von Grundtypen mobiler Marketing-Kampagnen</h2>
<p>Die Autoren konnten auf Basis der Analyse der 55 Fallstudien 4 Grundtypen mobiler Marketing-Kampagnen identifizieren. Alle derzeit bekannten mobilen Marketing-Kampagnen lassen sich mindestens einem dieser Grundtypen zuordnen. Eine einzelne Kampagne kann aber auch mehrere Grundtypen gleichzeitig umfassen. Alle Grundtypen von Kampagnen zeichnen sich durch das Charakteristikum &#8220;added value&#8221; aus. Dies macht deutlich, dass die Akzeptanz der Nutzer ein wichtiger Erfolgsfaktor ist und nur dann sichergestellt werden kann, wenn ein klarer Mehrwert erkennbar ist.</p>
<ol>
<li><strong>Grundtyp Information:</strong> Diese Kategorie umfasst mobile Newsletter, Produktinformationen, ortsspezifische Informationen (&#8220;Wo ist die nächste Apotheke?&#8221;), aber auch Nachrichten, Wetterberichte oder Horoskope. Aus Sicht des Kunden ist es von Bedeutung, dass die Information wirklich relevant ist, andernfalls würden sie das mobile Marketing als aufdringlich und unerwünscht empfinden. Die Relevanz der bereitgestellten Information lässt sich steigern, wenn die Auslieferung von Informationen zu bestimmten Zeitpunkten stattfinden, einen örtlichen Bezug vorweisen oder sich am Nutzerprofil orientieren. Die Analyse der Fallstudien zeigte, dass Kampagnen dieses Grundtyps häufig mit anderen Grundtypen kombiniert werden &#8211; in den meisten Fällen mit dem Typ Coupon, um den Mehrwert für den Nutzer zu steigern.</li>
<li><strong>Grundtyp Entertainment:</strong> Entertainment ist ein mobiler Service, der für die Nutzer oft einen großen Mehrwert darstellt. Sofern das Angebot ausreichend amüsant ist und gefühlsbetont ist, ist es möglich, Werbebotschaften unterbewusst zu kommunizieren. Typische Beispiele für diesen Grundtyp sind Video-Kampagnen, Musik, Spiele oder Personalisierungsangebote wie Klingeltöne. Um mehr als ein Unterhaltungsangebot bereitzustellen können Advertiser WAP-Download-Center einrichten, um mehrfach Kontakt mit den Kunden herzustellen. Entertainment-Angebote wie Spiele werden typischerweise mehrfach genutzt, was es ermöglicht, die Werbebotschaft nicht nur einmal zu übermitteln und so das Markenimage nachhaltig zu stärken. Ein weiterer positiver Effekt (nicht im Paper erwähnt) liegt darin, dass sich Unterhaltungsangebote gut für virale Kampagnen eignen, da sie von den Nutzern gerne an Freunde oder Bekannte weitergeleitet werden und sich so verbreiten können.</li>
<li><strong>Grundtyp Gewinnspiel:</strong> Obwohl die zu gewinnenden Preise sich in ihrem Wert und ihrer Art teilweise stark voneinander unterscheiden, basieren die meisten mobilen Gewinnspiele auf dem selben Prinzip. Über andere Medien wird die Aufmerksamkeit der Nutzer gewonnen. Sie beantworten eine (selten anspruchsvolle) Frage oder stimmen für etwas ab und versenden einen bestimmten Code per SMS, woraufhin sie die Chance haben Geld oder sonstige Preise zu gewinnen. Der Vorteil von Gewinnspielen ist, dass über den Preis ein materieller Anreiz zum teilnehmen gesetzt wird. Je höher der Wert des Preises für die Zielgruppe ist, desto größer ist die Chance, die Nutzer zum mitmachen zu bewegen.</li>
<li><strong>Grundtyp Coupon:</strong> Coupon-Kampagnen setzen einen monetären Anreiz zur Teilnahme. Coupon-Kampagnen funktionieren in der Regel so, dass dem Nutzer per SMS ein Coupon-Code zugesendet wird. Einen solchen mobilen Coupon kann der Nutzer verwenden um Produkte mit Rabatt zu erwerben oder um kostenlose SMS/MMS versenden zu dürfen. Abhängig vom Wert des Coupons werden diverse Sicherheitsmaßnahmen zur Prüfung der Echtheit des Coupons eingesetzt. Mobile Coupons können in zwei Kategorien eingeteilt werden: Impuls-Coupons und angeforderte Coupons. Impuls-Coupons sind Coupons, die sehr zeitempfindlich sind und in erster Linie darauf abzielen den Nutzer zu einem spontanen Kauf eines bestimmten Produktes zu bewegen. Impuls-Coupons werden an Nutzer versendet, die sich einverstanden erklärt haben, Coupons zu erhalten, aber nicht wissen, wann welche Coupons verschickt werden. Angeforderte Coupons werden von Nutzern, die an bestimmten Produkten interessiert sind, explizit ausgewählt.</li>
</ol>
<h2>Ziele mobiler Marketing-Kampagnen</h2>
<p>Über Experteninterviews und die Analyse von 30 Fallstudien konnten die Autoren die folgenden Ziele mobiler Marketing-Kampagnen identifizieren.</p>
<ul>
<li><strong>Bekanntheitsgrad von Marken stärken:</strong> Kunden sollen sich in Kauf- und Konsumsituationen an die Marke erinnern, was vor allem bei Neuprodukteinführungen von Bedeutung ist.</li>
<li><strong>Marken-Image ändern:</strong> Die Wahrnehmung der Marke durch die Nutzer soll geändert werden.</li>
<li><strong>Verkaufsförderung:</strong> Mit Hilfe von Promotion soll der Absatz der Produkte und Services angekurbelt werden.</li>
<li><strong>Markentreue stärken:</strong> Es wird versucht bestehende Kunden stärker an sich zu binden und sie dadurch zu Wiederholungskäufen zu bewegen.</li>
<li><strong>Aufbau einer Kundendatenbank:</strong> Es wird versucht Kundenprofile zu erstellen, um Angebote und Werbebotschaften genauer auf die Kunden abstimmen zu können.</li>
<li><strong>mobile Mund-zu-Mund-Propaganda: </strong>Ziel ist es, dem Nutzer etwas zu Liefern, das ihm so gut gefällt, dass er es an Freunde oder Bekannte weiterleitet. Dies können wichtige Informationen, Anwendungen, Bilder oder Musik sein.</li>
</ul>
<p>Die folgende Abbildung ist Übersicht über die verschiedenen Grundtypen und die damit jeweils verfolgten Ziele.</p>
<p><img height="398" alt="Standard-Typen" src="http://www.marketing2null.de/wp-content/uploads/2007/08/standard-typen.jpg" width="450" /></p>
<p>&nbsp;</p>
<h2>Fazit</h2>
<p>Die Studie von Pousttchi und Wiedemann gibt einen guten Überblick über bisherige Anwendungsformen des mobilen Marketings. Durch die Analyse von 55 Fallstudien konnten die vier Grundtypen Information, Entertainment, Gewinnspiel und Coupons abgeleitet werden. Zudem wird gezeigt, welche konkreten Ziele mit diesen verschiedenen Arten von Kampagnen verfolgt werden können.</p>
<p>Zum Grundtyp Information würde ich auch die mobile Suche zählen. Seit einiger Zeit lassen sich bei Google auch Werbeanzeigen für Nutzer der mobilen Suche von Google schalten. Werbung in Suchmaschinen zeichnet sich durch den informativen Charakter aus und bietet einen deutlichen Mehrwert für die Nutzer. Ein Opt-in, der die Reichweite einer mobilen Marketing-Kampagne stark limitiert ist nicht erforderlich. Ich erwarte deshalb, dass ein beachtlicher Teil der zukünftigen Ausgaben für mobiles Marketing in die mobile Suche fließen wird.</p>
<p>Überraschend finde ich auch, dass der direkte Verkauf von Produkten nicht als Ziel genannt wurde. Über mobile Endgeräte lassen sich schließlich auch Produkte oder Services erwerben. Fast alle im Paper beschriebenen Ziele haben mit Branding zu tun. Das Problem aller Branding-Kampagnen ist die schwierige Messbarkeit des Werbeerfolgs. Branding-Kampagnen wirken wegen Carry-Over-Effekten nicht nur heute, sondern insbesondere in der Zukunft, weshalb oft erst nach Jahen festgestellt werden kann, ob eine Kampagne erfolgreich war oder nicht. Suchmaschinenmarketing hat meiner Meinung nach so stark an Popularität gewonnen, weil sich der Werbeerfolg messen lässt. Advertiser können den ROI schnell und einfach ermitteln und Kampagnen auf diese Weise optimieren. Die Messbarkeit und die Möglichkeit der Erfolgskontrolle führten zu höheren Investitionen. Genau dieses Potezial gibt es auch für das mobile Marketing. Nutzer könnten durch Marketing-Maßnahmen zu unmittelbaren Käufen animiert werden. Zwar sind Handys aufgrund der limitierten Display-Größe eher ungeeignet, um Produkte zu kaufen, für die eine grafische Darstellung von großer Bedeutung ist (z.B. Kleidung). Andere Produkte oder Services lassen sich aber ebenso vom Handy aus bestellen. Der Grund dafür, dass der direkte Verkauf von Produkten bisher kaum eine Rolle zu spielen scheint, könnte darin liegen, dass mobile Bezahlsysteme noch immer nicht von der breiten Masse angenommen werden. Google hat sich den Weg quasi selber geebnet und ermöglicht es den Nutzern von Google Checkout, schnelle und sichere Käufe über das Handy abzuwickeln.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=65&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_65" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/08/09/mobile-marketing-klassifizierung-und-ziele-mobiler-marketing-kampagnen/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Keyword Research: Semantische Keyword Tools (Beispiel)</title>
		<link>http://www.marketing2null.de/2007/07/30/keyword-research-semantische-keyword-tools-anhand-eines-beispiels/</link>
		<comments>http://www.marketing2null.de/2007/07/30/keyword-research-semantische-keyword-tools-anhand-eines-beispiels/#comments</comments>
		<pubDate>Mon, 30 Jul 2007 13:55:27 +0000</pubDate>
		<dc:creator>Christof König</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>
		<category><![CDATA[TecZoom]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/07/30/keyword-research-semantische-keyword-tools-anhand-eines-beispiels/</guid>
		<description><![CDATA[In meinem letzten Beitrag habe ich die grundsätzliche Funktionsweise semantischer Keyword Tools beschrieben. Ziel dieser Tools ist es, aus wenigen initialen Begriffen eine große Menge semantisch verwandter Begriffe zu erzeugen, die im Aggregat ein hohes Suchvolumen erzeugen und jeweils möglichst günstige Klickpreise vorweisen können. In diesem Beitrag möchte ich nun versuchen, das recht komplexe Verfahren [...]]]></description>
			<content:encoded><![CDATA[<p>In meinem <a href="http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/">letzten Beitrag</a> habe ich die grundsätzliche Funktionsweise semantischer Keyword Tools beschrieben. Ziel dieser Tools ist es, aus wenigen initialen Begriffen eine große Menge semantisch verwandter Begriffe zu erzeugen, die im Aggregat ein hohes Suchvolumen erzeugen und jeweils möglichst günstige Klickpreise vorweisen können. In diesem Beitrag möchte ich nun versuchen, das recht komplexe Verfahren an einem kleinen Beispiel zu veranschaulichen. Die einzelnen Auswertungen erfolgten unter Verwendung eines kleinen selbstgeschriebenen Perl-Programms.</p>
<p><span id="more-56"></span></p>
<p>Für die englischen Begriffe <em>pig</em>, <em>pork</em>, <em>beef</em> und <em>vegetable</em> wurde jeweils eine Suche in Google durchgeführt und die kurze Inhaltsangabe der ersten zwei bzw. drei Treffer wurde als Dokument für die weitere Berechnung herangezogen. Die Ergebnisse werden bei längeren Dokumenten wesentlich besser. Darauf wurde aber aufgrund der Nachvollziehbarkeit und Übersichtlichkeit verzichtet. Die Suche erfolgte für englische Begriffe &#8211; ebenso wurden nur englische Ergebnisseiten berücksichtigt &#8211; da es für die englische Sprache den <a title="Porter Stemmer" href="http://www.tartarus.org/~martin/PorterStemmer/">Porter Stemmer</a> vorimplementiert gibt, der Begriffe auf ihren Wortstamm zurückführt, um z.B. Pluralendungen zu vernachlässigen.</p>
<h2>Allgemeines Vorgehen</h2>
<p>Das allgemeine Vorgehen zum Erstellen des repräsentativen Beschreibungsvektors für einen konkreten Suchbegriff sieht folgendermaßen aus (die z.T. etwas technische Beschreibung wird gleich darauf anhand eines Beispiels ausführlich vorgeführt):</p>
<ul>
<li>Suchanfrage bei einem Suchmaschinenanbieter nach dem konkreten Begriff x stellen</li>
<li>Sei R(x) die Menge der (maximal) n Ergebnisseiten d_1, d_2, &#8230;, d_n</li>
<li>Berechne für jede Ergebnisseite d_i aus R(x) einen TFIDF Vektor v_i</li>
<li>Schränke jeden Vektor v_i auf die m am höchsten bewerteten Begriffe ein</li>
<li>Berechne den Durchschnitt der normierten Vektoren v_i (euklidische Norm)</li>
<li>Normiere den gerade berechneten Durchschnitt</li>
</ul>
<h2>Berechnung am Beispiel <em>pig</em></h2>
<p>Anhand der Ergebnisdokumente für den Suchbegriff <em>pig</em> wird ein repräsentativer Beschreibungsvektor für eben diesen Suchbegriff im Folgenden berechnet. Eine Suchanfrage bei Google nach dem Begriff <em>pig</em> lieferte die folgende Ergebnisliste:</p>
<p><img height="177" alt="Ergebnisliste für Suchanfrage pig in Google" src="http://www.marketing2null.de/wp-content/uploads/2007/07/search-pig.png" width="450" /></p>
<p>Die Kurzbeschreibungen der ersten beiden Treffer dienen als Ergebnisseiten für die anschließenden Berechnungen:</p>
<ul>
<li>A pig has a snout for a nose, small eyes, and a small tail, which may be curly, kinked, or straight. It has a thick body and short legs. &#8230;</li>
<li>Its animal representation is the Pig. In Chinese culture, the pig is associated with fertility and virility. To bear children in the year of the pig &#8230;</li>
</ul>
<p>Die Menge R(x) besteht im Beispiel also aus den obigen beiden Dokumenten.</p>
<h2>Was ist ein TFIDF Vektor und wie berechnet man diesen?</h2>
<p>Ein TFIDF Vektor ordnet jedem einzelnen Begriff eines Dokuments ein Gewicht zu. Die Höhe dieses Wertes gibt an, wie relevant der Begriff bzgl. des Dokuments und der Menge der untersuchten Dokumente ist. Dabei spielen zwei Faktoren eine Rolle. Zum einen die Häufigkeit des Begriffes im gerade untersuchten Dokument (lokale Sicht, entspricht dem tf = term frequency) und in wie vielen der untersuchten Dokumente der Begriff überhaupt (globale Sicht, idf = inverse document frequency) vorkommt. Die genaue Formel lautet:</p>
<p>w_(t,i) = tf_(t,i) * log(D / df_t)</p>
<p>Dabei entspricht tf_(t,i) der Anzahl der Vorkommen des Begriffes t im Dokument d_i. Der Wert df_t gibt an, in wie vielen Dokumenten aus R(x) der Begriff t vorkommt und D ist die Anzahl der Dokumente in R(x). Die globale Sicht stellt sicher, dass Worte, die in allen Dokumenten vorkommen, mit einem sehr kleinen Gewicht gewertet werden. Damit wird sichergestellt, dass sog. Stopwörter wie <em>und</em>, <em>der</em> usw. nicht zu stark in die Bewertung miteinfließen.</p>
<p>Für unser konkretes Beispiel ergibt sich folgende Tabelle:</p>
<table>
<thead>
<tr>
<td>term</td>
<td>tf_(t,D_1)</td>
<td>tf_(t,D_2)</td>
<td>df_t</td>
<td>D/df_t</td>
<td>IDF_t</td>
<td>w_(t,D_1)</td>
<td>w_(t,D_2)</td>
</tr>
</thead>
<tr>
<td>a</td>
<td>5</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>1,5051</td>
<td>0,0000</td>
</tr>
<tr>
<td>and</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>1</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>animal</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>associated</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>be</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>bear</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>body</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>children</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>chinese</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>culture</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>curly</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>eyes</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>fertility</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>for</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>has</td>
<td>2</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,6021</td>
<td>0,0000</td>
</tr>
<tr>
<td>in</td>
<td>0</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,6021</td>
</tr>
<tr>
<td>is</td>
<td>0</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,6021</td>
</tr>
<tr>
<td>it</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>its</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>kinked</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>legs</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>may</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>nose</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>of</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>or</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>pig</td>
<td>1</td>
<td>3</td>
<td>2</td>
<td>1</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>representation</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>short</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>small</td>
<td>2</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,6021</td>
<td>0,0000</td>
</tr>
<tr>
<td>snout</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>straight</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>tail</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>the</td>
<td>0</td>
<td>4</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>1,2041</td>
</tr>
<tr>
<td>thick</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>to</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>virility</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>which</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>with</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>year</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
</table>
<p>Hierbei wurden die einzelnen Worte unverändert übernommen. Ignoriert man aber häufige Suffixe, also Wortendungen, und betrachtet nur noch den Wortstamm (<a title="Porter Stemmer" href="http://www.tartarus.org/~martin/PorterStemmer/">Porter Stemmer</a>) ergibt sich das folgende Bild:</p>
<table>
<thead>
<tr>
<td>term</td>
<td>tf_(t,D_1)</td>
<td>tf_(t,D_2)</td>
<td>df_t</td>
<td>D/df_t</td>
<td>IDF_t</td>
<td>w_(t,D_1)</td>
<td>w_(t,D_2)</td>
</tr>
</thead>
<tr>
<td>a</td>
<td>5</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>1,5051</td>
<td>0,0000</td>
</tr>
<tr>
<td>and</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>1</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>anim</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>associ</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>be</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>bear</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>bodi</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>children</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>chines</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>cultur</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>curli</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>ey</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>fertil</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>for</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>ha</td>
<td>2</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,6021</td>
<td>0,0000</td>
</tr>
<tr>
<td>in</td>
<td>0</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,6021</td>
</tr>
<tr>
<td>is</td>
<td>0</td>
<td>2</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,6021</td>
</tr>
<tr>
<td>it</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>1</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>kink</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>leg</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>mai</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>nose</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>of</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>or</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>pig</td>
<td>1</td>
<td>3</td>
<td>2</td>
<td>1</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>represent</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>short</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>small</td>
<td>2</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,6021</td>
<td>0,0000</td>
</tr>
<tr>
<td>snout</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>straight</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>tail</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>the</td>
<td>0</td>
<td>4</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>1,2041</td>
</tr>
<tr>
<td>thick</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>to</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>viril</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>which</td>
<td>1</td>
<td>0</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,3010</td>
<td>0,0000</td>
</tr>
<tr>
<td>with</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
<tr>
<td>year</td>
<td>0</td>
<td>1</td>
<td>1</td>
<td>2</td>
<td>0,3010</td>
<td>0,0000</td>
<td>0,3010</td>
</tr>
</table>
<p>Die beiden letzten Spalten geben nun die Gewichtungen der einzelnen Terme in den beiden Dokumenten wieder.</p>
<h2>Was macht man nun mit den TDIDF-Vektoren?</h2>
<p>Zunächst werden sie auf die Top m (in unserem Beispiel 10) Elemente reduziert. Die folgende Tabelle zeigt das Ergebnis:</p>
<table>
<tr>
<td>term</td>
<td>D_1</td>
<td>D_2</td>
</tr>
<tr>
<td>a</td>
<td>1,5051</td>
<td></td>
</tr>
<tr>
<td>bear</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>bodi</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>children</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>curli</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>ey</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>fertil</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>ha</td>
<td>0,6021</td>
<td></td>
</tr>
<tr>
<td>in</td>
<td></td>
<td>0,6021</td>
</tr>
<tr>
<td>is</td>
<td></td>
<td>0,6021</td>
</tr>
<tr>
<td>of</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>or</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>represent</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>small</td>
<td>0,6021</td>
<td></td>
</tr>
<tr>
<td>snout</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>tail</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>the</td>
<td></td>
<td>1,2041</td>
</tr>
<tr>
<td>viril</td>
<td></td>
<td>0,3010</td>
</tr>
<tr>
<td>which</td>
<td>0,3010</td>
<td></td>
</tr>
<tr>
<td>with</td>
<td></td>
<td>0,3010</td>
</tr>
</table>
<p>Für jedes Dokument existiert nun ein eingeschränkter repräsentativer Vektor. Diese Vektoren stellen Richtungen in einem hoch-dimensionalen Raum dar. Dabei steht jeder Begriff für eine einzelne Dimension des Raumes. Um diese Vektoren besser untereinander vergleichen zu können, wird ihre Länge normiert. Anschließend wird aufbauend auf den normierten Vektoren der Durchschnitt berechnet, um für den ursprünglichen Suchbegriff einen repräsentativen Vektor zu gewinnen.</p>
<p>Wie wird ein Vektor normiert? Und was bedeutet das? Wie gerade erwähnt stellen Vektoren Richtungen in einem hoch-dimensionalen Raum dar. Jeder dieser Vektoren hat eine Norm (dies entspricht im geometrischen Sinne der Länge des Vektors). Beim Normieren wird jeder Eintrag des Vektors durch die Norm des Vektors geteilt. Man erhält dadurch einen äquivalenten Vektor mit der Norm 1. Wir verwenden hierbei die Euklidische Norm. Diese entspricht der Länge in der Geometrie.</p>
<p>Wie berechnet man die euklidische Norm eines m-dimensionalen Vektors? Man bildet die Summe der Quadrate der einzelnen Einträge und zieht daraus anschließend die Wurzel. Damit ergeben sich für unsere beiden Beispieldokumente die folgenden Normen:</p>
<ul>
<li>D_1: sqrt(1,5051^2 + 0,3010^2 + &#8230; + 0,3010^2) = 1,9039</li>
<li>D_2: sqrt(0,3010^2 + 0,3010^2 + &#8230; + 0,3010^2) = 1,6761</li>
</ul>
<p>In der obigen Tabelle wird also jeder Eintrag in der Spalte D_1 durch 1,9039 und in der Spalte D_2 durch 1,6761 geteilt. Damit erhält man den normierten Vektor für jedes einzelne Dokument. Über diese normierten Vektoren wird nun der Durchschnitt gebildet, d.h. alle Vektoren werden addiert und anschließend jeder Vektoreintrag durch die Anzahl der aufaddierten Vektoren geteilt. Der hierbei entstehende Ergebnisvektor kann nun wieder mehr als m Einträge enthalten. Für den Begriff <em>pig</em> ergibt sich somit folgender Durchschnittsvektor:</p>
<table>
<tr>
<td>a</td>
<td>0,3953</td>
</tr>
<tr>
<td>bear</td>
<td>0,0898</td>
</tr>
<tr>
<td>bodi</td>
<td>0,0791</td>
</tr>
<tr>
<td>children</td>
<td>0,0898</td>
</tr>
<tr>
<td>curli</td>
<td>0,0791</td>
</tr>
<tr>
<td>ey</td>
<td>0,0791</td>
</tr>
<tr>
<td>fertil</td>
<td>0,0898</td>
</tr>
<tr>
<td>ha</td>
<td>0,1581</td>
</tr>
<tr>
<td>in</td>
<td>0,1796</td>
</tr>
<tr>
<td>is</td>
<td>0,1796</td>
</tr>
<tr>
<td>of</td>
<td>0,0898</td>
</tr>
<tr>
<td>or</td>
<td>0,0791</td>
</tr>
<tr>
<td>represent</td>
<td>0,0898</td>
</tr>
<tr>
<td>small</td>
<td>0,1581</td>
</tr>
<tr>
<td>snout</td>
<td>0,0791</td>
</tr>
<tr>
<td>tail</td>
<td>0,0791</td>
</tr>
<tr>
<td>the</td>
<td>0,3592</td>
</tr>
<tr>
<td>viril</td>
<td>0,0898</td>
</tr>
<tr>
<td>which</td>
<td>0,0791</td>
</tr>
<tr>
<td>with</td>
<td>0,0898</td>
</tr>
</table>
<p>Dieser Vektor wird wiederum normiert. Die Norm ist in diesem Fall 0,7071. Das Ergebnis ist nun der endgültige Repräsentant für den Suchbegriff <em>pig</em>:</p>
<table>
<tr>
<td>a</td>
<td>0.5590</td>
</tr>
<tr>
<td>bear</td>
<td>0.1270</td>
</tr>
<tr>
<td>bodi</td>
<td>0.1118</td>
</tr>
<tr>
<td>children</td>
<td>0.1270</td>
</tr>
<tr>
<td>curli</td>
<td>0.1118</td>
</tr>
<tr>
<td>ey</td>
<td>0.1118</td>
</tr>
<tr>
<td>fertil</td>
<td>0.1270</td>
</tr>
<tr>
<td>ha</td>
<td>0.2236</td>
</tr>
<tr>
<td>in</td>
<td>0.2540</td>
</tr>
<tr>
<td>is</td>
<td>0.2540</td>
</tr>
<tr>
<td>of</td>
<td>0.1270</td>
</tr>
<tr>
<td>or</td>
<td>0.1118</td>
</tr>
<tr>
<td>represent</td>
<td>0.1270</td>
</tr>
<tr>
<td>small</td>
<td>0.2236</td>
</tr>
<tr>
<td>snout</td>
<td>0.1118</td>
</tr>
<tr>
<td>tail</td>
<td>0.1118</td>
</tr>
<tr>
<td>the</td>
<td>0.5080</td>
</tr>
<tr>
<td>viril</td>
<td>0.1270</td>
</tr>
<tr>
<td>which</td>
<td>0.1118</td>
</tr>
<tr>
<td>with</td>
<td>0.1270</td>
</tr>
</table>
<h2>Die restlichen 3 Suchbegriffe</h2>
<p>Als Ausgangsbasis für die restlichen 3 Suchbegriffe dienten die folgenden Ergebnisseiten einer Suchanfrage bei Google.</p>
<p><img height="176" alt="search beef" src="http://www.marketing2null.de/wp-content/uploads/2007/07/search-beef.png" width="450" /></p>
<p><img height="187" alt="search pork" src="http://www.marketing2null.de/wp-content/uploads/2007/07/search-pork.png" width="450" /></p>
<p><img height="186" alt="search veg" src="http://www.marketing2null.de/wp-content/uploads/2007/07/search-veg.png" width="450" /></p>
<p>Die einzelnen Ergebnistexte, die Google bei einem Treffer anzeigt, wurden als Dokumente für die entsprechenden Suchbegriffe interpretiert und mittels des Stemmers auf ihren Wortstamm reduziert.</p>
<p>Vollkommen analog kann man dann entsprechende repräsentative Vektoren für die anderen 3 Suchbegriffe berechnen:</p>
<table>
<thead>
<tr>
<td>term</td>
<td>beef</td>
<td>pig</td>
<td>pork</td>
<td>veg</td>
</tr>
</thead>
<tr>
<td>100</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>a</td>
<td>0,0000</td>
<td>0,5590</td>
<td>0,4249</td>
<td>0,0000</td>
</tr>
<tr>
<td>accord</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>and</td>
<td>0,0928</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1601</td>
</tr>
<tr>
<td>answer</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>barrel</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,2125</td>
<td>0,0000</td>
</tr>
<tr>
<td>base</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>bear</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>beef</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,0000</td>
</tr>
<tr>
<td>black</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>board</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>bodi</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>botan</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1379</td>
</tr>
<tr>
<td>bovin</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>breed</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>but</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1062</td>
<td>0,0000</td>
</tr>
<tr>
<td>cattl</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>children</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>commonli</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1062</td>
<td>0,0000</td>
</tr>
<tr>
<td>consum</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,0000</td>
</tr>
<tr>
<td>content</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>contradict</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>cook</td>
<td>0,2514</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>count</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>cuisin</td>
<td>0,2649</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>culinari</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>curli</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>doe</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1601</td>
</tr>
<tr>
<td>especi</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>european</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>ey</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>fertil</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>for</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,0000</td>
</tr>
<tr>
<td>gener</td>
<td>0,2514</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>ha</td>
<td>0,0000</td>
<td>0,2236</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>health</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>in</td>
<td>0,0000</td>
<td>0,2540</td>
<td>0,1176</td>
<td>0,0000</td>
</tr>
<tr>
<td>includ</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,3203</td>
</tr>
<tr>
<td>industri</td>
<td>0,2514</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>inform</td>
<td>0,2514</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>is</td>
<td>0,2649</td>
<td>0,2540</td>
<td>0,2734</td>
<td>0,0000</td>
</tr>
<tr>
<td>juic</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>like</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,1601</td>
</tr>
<tr>
<td>list</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1601</td>
</tr>
<tr>
<td>liter</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1062</td>
<td>0,0000</td>
</tr>
<tr>
<td>meat</td>
<td>0,2649</td>
<td>0,0000</td>
<td>0,2814</td>
<td>0,0000</td>
</tr>
<tr>
<td>member</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>name</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,0000</td>
</tr>
<tr>
<td>nation</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>no</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>nutrit</td>
<td>0,2514</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>of</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>on</td>
<td>0,0928</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,1826</td>
</tr>
<tr>
<td>or</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>origin</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1062</td>
<td>0,0000</td>
</tr>
<tr>
<td>other</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>plant</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>prefectur</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>princip</td>
<td>0,1325</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>promot</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>provid</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>rais</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>recip</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>refer</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>represent</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>sens</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1062</td>
<td>0,1601</td>
</tr>
<tr>
<td>sinc</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>small</td>
<td>0,0000</td>
<td>0,2236</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>snout</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>some</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1407</td>
<td>0,1601</td>
</tr>
<tr>
<td>spice</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1601</td>
</tr>
<tr>
<td>strict</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>subgroup</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>tail</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>tajima-ushi</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>term</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>that</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>the</td>
<td>0,0000</td>
<td>0,5080</td>
<td>0,2814</td>
<td>0,0000</td>
</tr>
<tr>
<td>their</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1826</td>
</tr>
<tr>
<td>there</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1869</td>
</tr>
<tr>
<td>thi</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1601</td>
</tr>
<tr>
<td>to</td>
<td>0,3203</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,1869</td>
</tr>
<tr>
<td>tradit</td>
<td>0,1601</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>viril</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
<tr>
<td>websit</td>
<td>0,0000</td>
<td>0,0000</td>
<td>0,1792</td>
<td>0,0000</td>
</tr>
<tr>
<td>which</td>
<td>0,0000</td>
<td>0,1118</td>
<td>0,1062</td>
<td>0,1601</td>
</tr>
<tr>
<td>with</td>
<td>0,0000</td>
<td>0,1270</td>
<td>0,0000</td>
<td>0,0000</td>
</tr>
</table>
<h2>Wie stellt man nun fest, ob sich zwei Begriffe ähnlich sind?</h2>
<p>Um festzustellen, wie semantisch ähnlich sich zwei Begriffe sind, nimmt man die beiden entsprechenden repräsentativen Vektoren und bildet das Skalarprodukt der beiden Vektoren. Dazu erweitert man zunächst die beiden Vektoren, so dass sie jeweils noch fehlende Begriffe des anderen Vektors mit dem Gewicht 0 enthalten. Die beiden Vektoren werden den Begriffen nach sortiert (siehe obige Darstellung der repräsentativen Vektoren). Das Skalarprodukt ist die Summe der Produkte zueinandergehöriger Gewichte. Je höher der Wert, desto größer ist die semantische Ähnlichkeit der verglichenen Suchbegriffe.</p>
<p>Untersucht man die vier obigen Begriffe ergeben sich folgende Werte:</p>
<ul>
<li><em>beef</em>, <em>pork</em>: 0,2547</li>
<li><em>beef</em>, <em>pig</em>: 0,0673</li>
<li><em>beef</em>, <em>veg</em>: 0,1216</li>
<li><em>pig</em>, <em>pork</em>: 0,4917</li>
<li><em>pig</em>, <em>veg</em>: 0,0383</li>
<li><em>pork</em>, <em>veg</em>: 0,1382</li>
</ul>
<h2>Fazit</h2>
<p>Wenn man sich obige Werte genauer ansieht, kann man sehr schön erkennen, dass die berechneten Werte durchaus der Realität entsprechen. Die beiden Begriffe <em>pig</em> und <em>pork</em> haben die höchste semantische Ähnlichkeit. Das ist absolut nachvollziehbar, wenn man sich die entsprechenden deutschen Begriffe ansieht: <em>Schwein</em> und <em>Schweinefleisch</em>. Betrachtet man <em>beef</em> und <em>pork</em> sind sich diese auch noch etwas ähnlich. Immerhin handelt es sich bei beiden Begriffen um unterschiedliche Fleischarten. Sowohl <em>beef</em> und <em>vegetable</em> als auch <em>pork</em> und <em>vegetable</em> sind sich noch ein klein wenig ähnlich. Bei allen drei Begriffen handelt es sich um Worte auf dem Bereich der Küche und des Kochens. Die geringste Ähnlichkeit haben in diesem Fall die beiden Begriffe <em>beef</em> und <em>pig</em>. Es handelt sich weder um das gleiche Tier noch um den gleichen Kontext (z.B. Küche).</p>
<p>Zusammenfassend kann man sagen, dass sich schon an diesem doch relativ kleinen Beispiel zeigt, dass das beschriebene Verfahren durchaus in der Lage ist, die semantische Ähnlichkeit zwischen einzelnen Begriffen zu erfassen und als Zahlenwert quantitativ zu repräsentieren.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=56&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_56" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/07/30/keyword-research-semantische-keyword-tools-anhand-eines-beispiels/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Keyword Research: Semantische Keyword Tools</title>
		<link>http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/</link>
		<comments>http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/#comments</comments>
		<pubDate>Thu, 12 Jul 2007 10:07:06 +0000</pubDate>
		<dc:creator>Christof König</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>
		<category><![CDATA[TecZoom]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/</guid>
		<description><![CDATA[Keyword Research ist für den Erfolg einer jeden Suchmaschinenmarketing-Kampagne von entscheidender Bedeutung. Durch die ständig steigende Konkurrenz im bezahlten Suchmaschinenmarketing werden häufig gesuchte und offensichtlich relevante Begriffe immer teurer und damit weniger profitabel, wenn nicht sogar gänzlich unprofitabel. Hätte man die Möglichkeit, eine große Anzahl relevanter &#8211; für andere schwer identifizierbarer &#8211; Begriffe zu erzeugen, [...]]]></description>
			<content:encoded><![CDATA[<p>Keyword Research ist für den Erfolg einer jeden Suchmaschinenmarketing-Kampagne von entscheidender Bedeutung. Durch die ständig steigende Konkurrenz im bezahlten Suchmaschinenmarketing werden häufig gesuchte und offensichtlich relevante Begriffe immer teurer und damit weniger profitabel, wenn nicht sogar gänzlich unprofitabel. Hätte man die Möglichkeit, eine große Anzahl relevanter &#8211; für andere schwer identifizierbarer &#8211; Begriffe zu erzeugen, so könnte man die Performance einer Kampagne steigern, da derartige Suchbegriffe in der Regel deutlich billiger sind. Ziel ist es also eine große Menge relevanter Schlüsselwörter zu bestimmen, die in ihrer Masse einen ähnlich hohen Traffic erzeugen aber günstiger sind. Die am Markt verfügbaren Keyword Tools (Wordtracker, Keyword Discovery, Adwords Keyword Tool,&#8230;) lösen dieses Problem nicht oder nur unzureichend. Ihnen fehlt das semantische Verständnis.</p>
<p><span id="more-35"></span><br />
Vibhanshu Abhishek veröffentlichte 2007 ein <a href="http://www2007.org/workshops/paper_87.pdf">Paper</a> [PDF], in dem er ein Verfahren beschreibt, mit Hilfe dessen sich relevante Keywords für das Search Engine Marketing (SEM) generieren lassen. Dabei nutzt er die semantische Ähnlichkeit von Begriffen aus, um anstelle weniger aber häufig angefragter Schlüsselwörter viele weniger häufig angefragte Keywords zu bestimmen. Die zugrunde liegende Annahme geht davon aus, dass häufig angefragte Keywords zu höheren Preisen ersteigert werden müssen als weniger häufig angefragte. </p>
<h2>Einführung</h2>
<p>Im SEM werden Gebote für bestimmte Keywords abgegeben, damit bei einer entsprechenden Suchanfrage zielgerichtete Werbeanzeigen geschaltet werden können. Die Position der Anzeige hängt dabei unter anderem vom Gebot ab. Die tatsächlichen Kosten hängen vom jeweiligen Keyword, für das man bietet, ab. Dabei wurde beobachtet, dass es einen großen Zusammenhang zwischen der Häufigkeit eines Begriffes in einer Suchanfrage und der Höhe des abzugebenden Gebots gibt, damit eine Anzeige tatsächlich geschaltet wird (<a href="http://www.business.ualberta.ca/kasdemir/ssa2/bartzmurthisebastian.pdf">Bartz et al. 2006</a> [PDF]). Basierend auf dieser Korrelation, wäre es sinnvoller auf sogenannte low-volume Keywords zu setzen. Das sind Schlüsselwörter, die weniger häufig angefragt werden und somit billiger zu ersteigern sind. Das Problem besteht nun darin, möglichst viele dieser relevanten aber billigen Keywords zu identifizieren.</p>
<h2>Bisherige Verfahren</h2>
<p>Als Basis zum Generieren derartiger Keywords dient normalerweise eine kleine Menge von Ausgangsbegriffen. Die verschiedenen Techniken, um aus dieser Ausgangsmenge neue Begriffe zu generieren, kann man grob in folgende Klassen aufteilen:</p>
<ul>
<li>Analyse von Suchanfragen: Diese Möglichkeit haben insbesondere die Suchmaschinenanbieter Google, Yahoo! usw selbst. Sie können auswerten, welche Suchanfragen häufig gestellt werden, die Begriffe aus der Ausgangsmenge enthalten. Sie stellen diese Information ihren Kunden auch mit Hilfe entsprechender Tools zur Verfügung.</li>
<li>Keyword-Breakdown: Man kann auswerten, welche konkreten Suchanfragen zu besonders vielen Konvertierungen geführt haben. Insbesondere bei <i>broad</i> Matches kann somit die Liste der eigenen Keywords um potentiell erfolgversprechende Kandidaten erweitert werden.</li>
<li>Analyse der Ergebnisseiten: Dabei wird nach Begriffen in der Ausgangsbasis gesucht und die Ergebnisseiten werden analysiert, um Begriffe, die sich in der Nähe der Ausgangsbegriffe befinden, als potentielle neue Kandidaten aufzunehmen.</li>
<li>Analyse der Meta-Tags der Ergebnisseiten: Es werden Suchanfragen nach den Begriffen in der Ausgangsbasis ausgeführt. Viele Ergebnisseiten enthalten in den Meta-Tags Informationen zu relevanten Schlüsselwörtern. Diese können als weitere Kandidaten für neue Keywords betrachtet werden.</li>
</ul>
<p>Keines dieser Verfahren benutzt explizit die semantische Ähnlichkeit bestimmter Begriffe.</p>
<h2>Was heißt &#8220;semantisch ähnlich&#8221;?</h2>
<p>Eine Möglichkeit besteht natürlich darin, einen Thesaurus zu nutzen, um äquivalente Begriffe zu finden. Wie aber soll ein Programm entscheiden, dass zwei Begriffe oder Phrasen semantisch ähnlich sind? Im Paper wird folgende Vorgehensweise vorgeschlagen. Basierend auf einer Menge schon generierter Keywordkandidaten, von denen man noch nicht weiss, wie relevant sie tatsächlich sind, wird für jedes dieser Keywords eine Suchanfrage ausgeführt. Anschließend werden z.B. die ersten 30 Ergebnisseiten genauer analysiert, d.h. es werden Worte oder Textphrasen gesucht, die &#8211; vereinfacht gesagt &#8211; besonders häufig vorkommen. Es wird also für jedes einzelne dieser Dokumente eine Menge besonders relevanter Begriffe ermittelt.</p>
<p>Um diese Begriffe zu finden, werden aus dem Text zunächst alle sogenannten Stopwörter entfernt. Dabei handelt es sich um sehr häufig vorkommende Begriffe wie <i>und</i>, <i>oder</i>, <i>er</i>, <i>sie</i> usw. Anschließend wird versucht von den übrig gebliebenen Begriffen den Wortstamm zu rekonstruieren, indem z.B. Pluralendungen entfernt werden. Die Komplexität dieses Schrittes ist sehr stark von der Sprache des Textes abhängig. Die Worte, die man nach diesem Schritt erhält, werden nun entsprechend ihrer Häufigkeit gewichtet und sortiert. Für jede Seite merkt man sich nun z.B. wieder die 30 häufigsten Begriffe. Basierend auf dieser Auswahl von Begriffen und ihrer Häufigkeit, kann man für jedes der generierten Schlüsselwörter einen repräsentativen Vektor berechnen.</p>
<p>Die Ähnlichkeit zweier Begriffe kann man nun als Produkt der beiden repräsentativen Vektoren definieren. Je höher das Ergebnis des Produkts, desto ähnlicher sind sich die beiden Begriffe. Etwas anschaulicher heisst das, dass sich zwei Begriffe ähnlich sind, wenn auf den Ergebnisseiten der jeweiligen Suchanfragen häufig die gleichen Begriffe vorkommen.</p>
<h2>Wie bestimmt man die Menge potentieller Schlüsselwörter?</h2>
<p>Bevor man Keywords auf ihre Ähnlichkeit hin untersuchen kann, müssen zunächst potentielle Kandidaten bestimmt werden. Die Basis <i>B</i> bildet die Menge der Webseiten, der zu bewerbenden Firma bzw. des zu bewerbenden Produkts. Für jede dieser Webseiten werden wiederum die wichtigsten Begriffe bestimmt und als potentielle Kandidaten für Schlüsselwörter vorgemerkt. Dieses initiale Verzeichnis potentieller Kandidaten kann nun noch von Hand durch relevante Begriffe ergänzt werden.</p>
<p>Für jeden dieser ersten Kandidaten wird nun eine Suchanfrage ausgeführt und z.B. die ersten 30 Dokumente werden analysiert und zur Basis <i>B</i> hinzugefügt. Aus diesen Seiten werden ebenfalls die häufigsten Begriffe extrahiert und in das Kandidatenverzeichnis aufgenommen. Dieser zweite Schritt hat zur Folge, dass evtl. allgemeinere aber immer noch relevante Begriffe in die Liste der Kandidaten aufgenommen werden.</p>
<h2>Wie extrahiert man nun die relevanten Keywords?</h2>
<p>Man hat nun ein großes Verzeichnis potentieller Schlüsselwörter und Informationen darüber, wie ähnlich sich entsprechende Schlüsselwörter sind. Mit Hilfe der Basis <i>B</i> &#8211; diese enthält alle analysierten Webseiten &#8211; kann man noch feststellen, wie häufig die einzelnen Kandidaten genau auftreten. Hierbei wird von der zusätzlichen Annahme ausgegangen, dass ein häufig vorkommendes Wort auch für Suchanfragen sehr populär ist und somit schon sehr hohe Gebote bei den einzelnen Suchmaschinen aufweist. Diese will man eher vermeiden und durch Keywords ersetzen, die immer noch relevant sind, aber weniger häufig auftreten.</p>
<p>Um diese zu identifizieren, konstruiert man aus dem Verzeichnis der Schlüsselwörter einen <a href="http://de.wikipedia.org/wiki/Graph_(Graphentheorie)">Graphen</a>. Die Knoten bestehen dabei aus den einzelnen Schlüsselwörtern und Kanten zwischen zwei Knoten geben an, wie semantisch ähnlich sich zwei Begriffe sind. Auf diesem Graphen kann man nun einen Algorithmus ausführen, welcher ausgehend von einem signifikaten aber teuren Keyword billigere Alternativen findet, indem er Kanten entlang zu weiteren Kandidaten läuft, die eine sehr hohe Ähnlichkeit haben. Dabei werden Keywords ignoriert, die in der Basis <i>B</i> sehr häufig vorgekommen sind, da man davon ausgeht, dass diese relativ teuer zu ersteigern sind. Sobald man die gewünschte Menge von Schlüsselwörtern gefunden hat, terminiert das Verfahren. Diese eingeschränkte Menge an Kandidaten kann man nun beliebig kombinieren oder auch einzeln einsetzen und als Keywords bei den entsprechenden Suchmaschinen ersteigern.</p>
<p>Die Qualität des Verfahrens hängt dabei von der Anzahl der untersuchten Webseiten und von der Anzahl der extrahierten relevanten Begriffe der einzelnen Webseiten ab. Je mehr, desto besser das Ergebnis.</p>
<h2>Und wie könnte nun so ein Ergebnis aussehen?</h2>
<p>Im Paper selbst wurden empirische Untersuchungen basierend auf 96 Webseiten einer Zahnklinik und dreier Wellness-Center durchgeführt. Dabei wurden zu Beginn die häufigsten 10 Begriffe jeder Seite extrahiert. Das Ergebnis waren 328 verschiedene Begriffe. Dieses initiale Verzeichnis wurde durch weitere Suchanfragen auf 1681 Begriffe erweitert. Für diese Begriffe wurde die semantische Ähnlichkeit anhand des hier vorgestellten Verfahren bestimmt. Im folgenden exemplarisch ein Auszug aus den gewonnen Ergebnissen:</p>
<ol>
<li>skin: skincare, facial, treatment, face, care, occitane, product, exfoliator, dermal, body</li>
<li>teeth: tooth, whitening, dentist, veneer, filling, gums, face, baby, smilesbaltimore, features</li>
<li>pedicure: manicure, leg, feet, nails, treatment, skincare, tool, smilesbaltimore, massage, facial</li>
</ol>
<h2>Fazit</h2>
<p>Semantische Keyword Tools werden in Zukunft &#8211; vor dem Hintergrund steigender Klickpreise (Bid Inflation) &#8211; für SEM-Dienstleister eine wichtige strategische Rolle spielen. Zwar ist es auch heute möglich, semantisch ähnliche und relevante Keywords zu identifizieren (der Mensch ist dafür äußerst gut geeignet), aber der dafür erforderliche Zeitaufwand limitiert die Möglichkeiten sehr stark. Semantische Keyword Tools könnten den Prozess des Keyword Research enorm verkürzen. Die Vision ist es, ein paar wenige Seed Keywords zu definieren, die durch ein semantisches Keyword Tool um relevante, aber schwer identifizierbare Begriffe automatisch ergänzt werden. In einem zweiten Schritt wird aus diesen Begriffe via Query Expansion (Analyse von Suchanfragen) eine Vielzahl speziellerer Begriffe erzeugt. Anschließend werden alle Begriffe automatisch zu verschiedenen Anzeigengruppe zusammengefasst, um dann automatisch durch Suchen der Keywords auf der Website (Scraping) Vorschläge für geeignete Landing Pages zu generieren. Zuletzt &#8211; darum wird man leider in absehbarer Ziet nicht herum kommen &#8211; muss ein Mensch (man braucht uns doch noch!) die gesamte Liste generierter Keywords und korrespondierender Landing Pages prüfen und korrigieren. </p>
<p><strong>Technology rules!</strong></p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=35&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_35" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/07/12/keyword-research-semantische-keyword-tools/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>Affiliate Marketing: Negative Auswirkungen auf die Marke?</title>
		<link>http://www.marketing2null.de/2007/07/10/affiliate-marketing-negative-auswirkungen-auf-die-marke/</link>
		<comments>http://www.marketing2null.de/2007/07/10/affiliate-marketing-negative-auswirkungen-auf-die-marke/#comments</comments>
		<pubDate>Tue, 10 Jul 2007 18:40:55 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Affiliate Marketing]]></category>
		<category><![CDATA[Forschung]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/07/10/affiliate-marketing-negative-auswirkungen-auf-die-marke/</guid>
		<description><![CDATA[Obwohl Affiliate Marketing sehr populär ist und nach wie vor stark wächst, scheint es in der Wissenschaft kaum Beachtung zu finden. Während es sehr viele wissenschaftliche Publikationen zu den Themen Suchmaschinenmarketing (SEM) und Suchmaschinenoptimierung (SEO) gibt, ist Affiliate Marketing weitgehend unbeachtet geblieben. Eines der wenigen Paper wurde kürzlich auf der Bled eConference vorgestellt worden. Paul [...]]]></description>
			<content:encoded><![CDATA[<p>Obwohl Affiliate Marketing sehr populär ist und nach wie vor stark wächst, scheint es in der Wissenschaft kaum Beachtung zu finden. Während es sehr viele <a href="http://www.marketing2null.de/forschung/">wissenschaftliche Publikationen</a> zu den Themen Suchmaschinenmarketing (SEM) und Suchmaschinenoptimierung (SEO) gibt, ist Affiliate Marketing weitgehend unbeachtet geblieben. Eines der wenigen Paper wurde kürzlich auf der <a href="http://www.bledconference.org/">Bled eConference</a> vorgestellt worden. Paul Fox und Jonathan Wareham untersuchen inwieweit Online-Händler vertragliche Regelungen und Richtlinien erlassen (sollten), die den Handlungsspielraum ihrer Affiliates einschränken, um negative Auswirkungen auf ihre Marke zu vermeiden. Die Autoren argumentieren, dass Affiliate Marketing zwar eines der kostengünstigsten Marketinginstrumente ist und sich darüber hinaus durch die einfache Messbarkeit des Erfolgs auszeichnet. Dennoch bestünde das Risiko, dass die Marke des Händlers durch illegale oder unerwünschte Methoden der Affiliates negativ beeinflusst wird. Fox und Wareham empfehlen unter anderem klarere Richtlinien und gezieltere Kontrollen, um diese Gefahr zu reduzieren. Sie untersuchen den spanischen Markt, wobei die Ergebnisse aber durchaus auch auf andere Länder und Märke übertragbar sind. Das Paper mit dem Titel <a href="http://domino.fov.uni-mb.si/proceedings.nsf/Proceedings/3A8C34A143881762C12572EE00764960/$File/Paper52.pdf">Controlling your brand: Contractual restrictions placed by Internet retailers on affiliate marketing activities in Spain</a> wird im folgenden vorgestellt.</p>
<p><span id="more-39"></span></p>
<p>Die wissenschaftliche Studie von Fox und Wareham basiert auf der Prinzipal-Agent-Theorie. Eigentümer von Betrieben beauftragen oft Dritte zur Erfüllung betrieblicher Funktionen oder zur Abwicklung von Geschäftsprozessen, um eine effizientere Nutzung von Ressourcen zu gewährleisten. Die beauftragten Akteure (Agenten) handeln nicht immer zum Vorteil des Auftraggebers, sondern verfolgen vielmehr auch eigene Ziele, die im Konflikt mit den Absichten des Auftraggebers stehen. Um den Konflikt zu reduzieren ist ein geeignetes Anreiz- oder Kontrollsystem notwendig.</p>
<p>Im Falle von Affiliate Marketing verfolgt der Prinzipal (Merchant) das Ziel, den langfristigen Unternehmenserfolg zu maximieren. Dazu zählen nicht nur Verkäufe von heute, sondern auch Branding Effekte, die über so genannte Carry-Over-Effekte erst in der Zukunft wirken. Der Affiliate hingegen profitiert in erster Linie von seinen generierten Umsätzen, während der Branding Effekt für ihn kaum Bedeutung hat. Die Interessen von Prinzipal und Agent sind somit nicht kongruent. Zum Prinzipal-Agent-Problem kommt es dann, wenn die Maßnahmen, die der Affiliate verfolgt, dazu geeignet sind, seinen eigenen Nutzen zu maximieren, sich aber gleichzeitig negativ auf die Marke des Merchant auswirken. Beispielsweise könnte ein Affiliate, der einen Dating Service auf CPL-Basis promotet, behaupten, das komplette Angebot sei gratis. Er könnte auf diese Weise viele Nutzer zur Anmeldung bewegen, die sich aber betrogen fühlen, wenn sie feststellen, dass der Service kostenpflichtig ist. Diese Taktik ist für den Affiliate geeignet, um seine Provisionserlöse zu steigern, für die Marke und das Image des Dating-Services hingegen ist dies äußerst schädlich.</p>
<p>Um zu verstehen, wie Merchants die Aktivitäten ihrer Affiliates kontrollieren und beschränken, untersuchen Fox und Wareham a) die Programmrichtlinien, b) die Einschränkungen im Vertrag zwischen Affiliate und Affiliate Netzwerk und c) die Einschränkungen anderer Intermediäre (z.B. Suchmaschinen).</p>
<h2>Ergebnisse</h2>
<h3>Inhalte, Qualität und URL</h3>
<p>Zunächst wurde untersucht, inwieweit Merchants in ihren Guidelines festlegen, welche inhaltlichen oder qualitativen Voraussetzungen eine Partnerwebsite erfüllen muss. Dies ist insofern von Bedeutung, als dass davon auszugehen ist, dass Werbemittel, die auf Seiten ohne jeglichen inhaltlichen Bezug geschaltet werden, die Wahrnehmung der Marke des Händler seitens der Nutzer und potenziellen Kunden negativ beeinflussen.</p>
<blockquote><p>Newman et al. (2004) conclude that when a banner ad is placed on a website, if the ad is not highly congruent with the site (consistent in terms of product class), then consumer attitudes toward the website will be harmed. Based on these findings, it may be reasonable to assume that the consumer attitudes toward the brand of the advertiser could be harmed if the ad is viewed on a site which is not highly congruent with ad.</p></blockquote>
<p>Es zeigte sich, dass lediglich 13,24% aller Merchants überhaupt inhaltliche Einschränkungen spezifizieren. Mit Ausnahme eines Merchants beliefen sich diese Restriktionen auf mit Drogenkonsum, Pornografie oder Glücksspiel in Zusammenhang stehende Inhalte. Lediglich ein Kreditkarten-Anbieter machte genauere Angaben, indem er unter anderem Seiten mit schlechtem Design und minderwertiger Qualität ausschloss. Fox und Wareham weisen aber darauf hin, dass einige inhaltliche Vorgaben bereits in den Richtlinien der Affiliate-Netzwerke spezifiziert sind.</p>
<p>Weiterhin wurde untersucht, ob Merchants die Nutzung ihres Markennamens in der URL der Partnerseiten einschränken. Es stellte sich heraus, dass lediglich 3,68% der Merchants die Nutzung ihres Markennamens in der URL explizit untersagen. Zwar werden Copyright-Fragen in den Richtlinien der Affiliate Netzwerke berücksichtigt, die Tatsache, dass keine gesonderten Verbote ausgesprochen werden, führt aber nach Auffassung der Autoren zu Intransparenz.</p>
<p align="center"><img height="64" alt="Affiliate Business Models" src="http://www.marketing2null.de/wp-content/uploads/2007/07/affiliate-business-models.jpg" width="450" /></p>
<h3>Affiliate Promotion Tools</h3>
<p>Einer Umfrage von Partnercentric (2006) zufolge sind die wichtigsten Promotion Tools:</p>
<p align="center"><img height="236" alt="Affiliate Marketing Promotional Tools" src="http://www.marketing2null.de/wp-content/uploads/2007/07/affiliate-marketing-promotional-tools.jpg" width="289" /></p>
<p>Fox und Wareman sehen vor allem im bezahlten Suchmaschinenmarketing (SEM) und im E-Mail-Marketing die Gefahr eines negativen Einflusses auf die Marke eines Händlers. SEM-Affiliates haben einen großen Spielraum bei der Auswahl der Keywords und der Gestaltung des Anzeigentextes. Affiliates, die E-Mail-Marketing betreiben, können den Text der E-Mail frei wählen und es besteht zudem die Gefahr, dass Spam-Techniken zum Einsatz kommen.</p>
<p>Über 85% der untersuchten Merchants erlauben SEM, 29,3% verbieten es, auf ihre Markennamen zu bieten und 6,9% verbieten es auf den Markennamen ihrer Konkurrenten zu bieten. 19% der Merchants verbieten es ihren Markennamen im Anzeigentext zu verwenden. Die Nutzung des Display-URL, also das direkte Verlinken der Anzeigen auf die Seite des Merchants, wurde in 5,17% aller Fälle verboten.</p>
<p>Diese und weitere Ergebnisse zur Einschränkung von SEM sind der folgenden Tabelle zu entnehmen:</p>
<p align="center"><img height="201" alt="Affiliate Promotion Tools" src="http://www.marketing2null.de/wp-content/uploads/2007/07/affiliate-promotion-tools-1.jpg" width="450" /></p>
<p>Beim E-Mail-Marketing ist von Bedeutung, ob Merchants Vorgaben bezüglich a) Privatsphäre (Spam-Problematik), b) Opt-in/Opt-out oder c) Inhalte (Text der E-Mail) machen. Wie das Ergebnis der Studie zeigt, erlassen nur 2,2% der Merchants überhaupt Richtlinien zum E-Mail-Marketing. Von drei Merchants, die E-Mail-Marketing erwähnten, verbot einer es gänzlich, die beiden anderen verlangten Opt-in. Auch wenn Merchants in den meisten Fällen keine Richtlinien zum E-Mail-Marketing erlassen &#8211; die Problematik wird zum einen in den Richtlinien einiger Affiliate-Netzwerke angesprochen (Zanox bspw. verbietet Spam-Techniken explizit) und zum anderen durch nationale Gesetze (Opt-in vorgeschrieben) geregelt. Dennoch führt der Verzicht auf explizite Hinweise zu Intransparenz und könnte Missbrauch zufolge haben.</p>
<h2>Fazit</h2>
<p>Inhaltliche Restriktionen der Merchants umfassen zumeist lediglich Pornografie, Glücksspiel oder ähnliches, wohingegen der inhaltliche Fokus einer Partnerseite, also die Frage, ob die Partnerseite zu der Website des Merchants passt, meistens nicht berücksichtigt wird. Auch optische (Design der Website) und rechtliche Aspekte (Verwendung von Markennamen in der URL) werden nur selten explizit spezifiziert. Zwar können Merchants entscheiden, wen sie für ihr Programm akzeptieren und sie können die Partnerschaften jederzeit stornieren. Die undurchsichtigen Anforderungen und Richtlinien sorgen aber für Ineffizienzen für Affiliates bei der Auswahl eines Programms und für Merchants zu einem erhöhten Kontrollaufwand.</p>
<p>Hinsichtlich der Promotion Tools, wird zumeist nur der Umgang mit Markennamen geregelt, nicht jedoch der Inhalt der Werbebotschaften. Dies gilt sowohl für E-Mails, als auch für SEM. Die Idee der Autoren, den Inhalt bzw. Text von Werbeanzeigen auf Suchmaschinen vorzuschreiben, ist als nicht realistisch einzustufen, da gute, zielgerichtete Anzeigen häufig einen Keyword spezifischen Werbetext enthalten. Vorschriften seitens des Merchants würden zu niedrigen Click-Through-Rates, hohen CPCs und einer insgesamt schlechten Performance führen. Auch bei E-Mail-Marketing ist es äußerst zweifelhaft, ob der Merchant, der die genaue Zielgruppe des Affiliates nicht kennt, den Inhalt der E-Mails festlegen sollte (siehe unten: Punkt 4).</p>
<p>Fox und Wareham geben folgende Empfehlungen:</p>
<ol>
<li>Merchants sollten in ihren Programmrichtlinien explizit formulieren, welche inhaltlichen und qualitativen Anforderungen an eine Partnerseite gestellt werden, welche Anforderungen an die Privatsphäre beim E-Mail-Marketing gestellt werden und welche Restriktionen es beim SEM gibt.</li>
<li>Merchants sollten den Content von Partnerseiten regelmäßig überprüfen.</li>
<li>Merchants sollten regelmäßig nach relevanten Keywords auf verschiedenen Suchmaschinen suchen, um die Werbetexte und die Verwendung von Trademarks zu prüfen.</li>
<li>E-Mail-Marketing sollte sorgfältig kontrolliert werden. Entweder sollte der Inhalt der E-Mails vom Merchant vorgegeben werden, oder die Affiliates sollten sich dazu verpflichten, eine Kopie ihrer E-Mails an den Merchant zu schicken.</li>
</ol>
<p>Die Studie zeigt in erster Linie, dass ein gewisser Grad an Intransparenz besteht, da Restriktionen in den Programmrichtlinien häufig nur unzureichend spezifiziert sind. Zudem können sich Affiliates an den Programmrichtlinien allein oft nicht orientieren, sondern müssen neben den Richtlinien der Affiliate-Netzwerke auch nationale Gesetze und Bestimmungen verschiedener Suchmaschinen (Trademark-Problematik) beachten. Dies könnte &#8211; möglicherweise ungewollt &#8211; zu unerwünschten Handlungen der Affiliates oder Missbrauch führen und die Marke des Merchants negativ beeinflussen.</p>
<p>Das Problem, das im Übrigen nicht nur in Spanien, sondern auch hierzulande in Deutschland besteht, liegt darin, dass die Restriktionen der Programmbetreiber bei den meisten Affiliate-Netzwerken (Affilinet, Ad Butler, Belboon) in Form eines Fließtextes kommuniziert werden. Dies hat einersets zufolge, dass es zu Verständnisproblemen aufgrund unterschiedlich verwendeter Begriffe kommt (Dispay URL &#8211; Visible URL &#8211; sichtbare URL; keine Verwendung von Markennamen &#8211; nicht auf Markennamen bieten,&#8230;). Auf der anderen Seite kommt es häufig vor, dass manche Einschränkungen wegen mangelnder Erfahrung oder Unwissenheit nicht berücksichtigt werden. SEM Affiliates können sich also nicht darauf verlassen, dass Keyword Advertising gestattet ist, nur weil in den Restriktionen keinerlei Angaben gemacht werden.</p>
<p>Merchants sollten also neben einem (optionalen) Fließtext immer ein ausgefülltes Formular bereitstellen, um die Restriktionen für ihr Programm einheitlich und klar verständlich zu kommunizieren. Das Formular könnte so aufgebaut sein:</p>
<p><strong>Content, Design und URL</strong></p>
<p>Erwünschte inhaltliche Ausrichtung der Partnerseite: Merchant wählt aus Liste aus (Reise,&#8230;)<br />
Verbotene Inhalte der Partnerseite: (Pornografie, Glücksspiel,&#8230;)<br />
Verwendung von Markennamens des Merchants in der URL: Ja/Nein</p>
<p><strong>Suchmaschinenmarketing</strong></p>
<p>Suchmaschinenmarketing grundsätzlich erlaubt: Ja/Nein<br />
Verwendung von Markennamen im Anzeigentext erlaubt: Ja/Nein (evtl. Ausnahmen)<br />
Verwendung der Display URL des Merchants: Ja/Nein<br />
Bieten auf Markennamen des Merchants: Ja/Nein<br /> (evtl. Ausnahmen)<br />
Bieten auf Markennamen der Konkurrenz: Ja/Nein</p>
<p><strong>E-Mail-Marketing</strong></p>
<p>E-Mail-Marketing erlaubt: Ja/Nein<br />
Schutz der Privatsphäre: Nur Opt-in gestattet<br />
Kopie aller ausgehenden Nachrichten: Ja/nein</p>
<p>
<strong>Sonstiges</strong></p>
<p>Hier kann der Merchant &#8211; falls erforderlich &#8211; weitere Einschränkungen spezifizieren.</p>
<p>&nbsp;</p>
<p>CJ ist &#8211; was die SEM-Vorgaben angeht &#8211; vorbildlich. Zanox stellt lediglich klar, ob SEM generell erlaubt ist und falls ja, auf welche Keywords nicht geboten werden darf. Vollständige, standardisierte Spezifikationen sind bisher in keinem (mir bekannten) Netzwerk zu finden.</p>
<p><strong>Abschließend sei darauf hingewiesen, dass die Erkenntnisse dieser Studie nicht implizieren, dass Merchants noch restriktiver vorgehen sollten, als das bisher der Fall ist (in Europa zumindest). Sie sollten lediglich klarstellen was gestattet ist und was nicht.</strong></p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=39&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_39" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/07/10/affiliate-marketing-negative-auswirkungen-auf-die-marke/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Suchmaschinenmarketing: Nutzer unterschätzen die Qualität von Sponsored Links</title>
		<link>http://www.marketing2null.de/2007/06/30/suchmaschinenmarketing-nutzer-unterschaetzen-die-qualitaet-von-sponsored-links/</link>
		<comments>http://www.marketing2null.de/2007/06/30/suchmaschinenmarketing-nutzer-unterschaetzen-die-qualitaet-von-sponsored-links/#comments</comments>
		<pubDate>Sat, 30 Jun 2007 13:29:10 +0000</pubDate>
		<dc:creator>Andreas Reiffen</dc:creator>
				<category><![CDATA[Forschung]]></category>
		<category><![CDATA[Search Marketing]]></category>

		<guid isPermaLink="false">http://www.marketing2null.de/2007/06/30/suchmaschinenmarketing-nutzer-unterschaetzen-die-qualitaet-von-sponsored-links/</guid>
		<description><![CDATA[Das bezahlte Suchmaschinenmarketing (PPC Advertising) ist sicherlich eines der erfolgreichsten Geschäftsmodelle im Internet. Die Einnahmen aus den neben den organischen Resultaten geschalteten Werbeanzeigen sorgen für über 90% der Umsätze von Goolge und über 80% der Umsätze von Yahoo. Der Grund dafür, dass dieses Geschäftsmodell derart erfolgreich ist, liegt unter anderem darin, dass Werbetreibende die Möglichkeit [...]]]></description>
			<content:encoded><![CDATA[<p>Das bezahlte Suchmaschinenmarketing (PPC Advertising) ist sicherlich eines der erfolgreichsten Geschäftsmodelle im Internet. Die Einnahmen aus den neben den organischen Resultaten geschalteten Werbeanzeigen sorgen für über 90% der Umsätze von Goolge und über 80% der Umsätze von Yahoo. Der Grund dafür, dass dieses Geschäftsmodell derart erfolgreich ist, liegt unter anderem darin, dass Werbetreibende die Möglichkeit haben, Anzeigen zielgerichtet zu schalten, wenn Nutzer nach ganz bestimmten Keywords suchen. Vor allem bei Suchen mit kommerzieller Motivation (Kauf eines Produkts oder einer Dienstleistung) führt dies dazu, dass die Werbeanzeigen relevant für die jeweilige Suche eines Nutzers sind.<br />
Der Schlüssel zum Erfolg des bezahlten Suchmaschinenmarketing liegt in der Wahrnehmung der Relevanz der Werbeanzeigen seitens der Nutzer. Werden die Anzeigen als relevant wahrgenommen, so werden Sie angeklickt und generieren Umsätze für die Suchmaschinen, andernfalls werden sie einfach ignoriert.<br />
Google, Yahoo! und Co. wissen das und haben im Laufe der letzten Jahre einiges getan um die Relevanz ihrer Anzeigen zu verbessern (Mindestgebote, Quality Score, Qualitätskontrolle, etc). Stellt sich die Frage, wie Nutzer die Relevanz der Anzeigen empfinden.<br />
Zur Untersuchung der Wahrnehmung organischer Suchresultate und Sponsored Links (PPC Ads) seitens der Nutzer von Suchmaschinen gibt es eine interessante <a title="Studie von B. Jansen und M.Resnick" href="http://ist.psu.edu/faculty_pages/jjansen/academic/pubs/sponsored_links_jansen.pdf">Studie von B. Jansen und M. Resnick</a>, die ich im folgenden zusammenfassen und kritisch beurteilen möchte.</p>
<p><span id="more-25"></span></p>
<h2>Vorgehensweise und Aufbau der Studie</h2>
<p>
Insgesamt wurden sechs Suchanfragen mit kommerziellem Charakter (Suche nach einem Produkt oder einer Dienstleistung) aus den Kategorien <em>Allgemein</em> (bspw. Suche nach einer Produktkategorie), <em>Spezifisch</em> (Suche nach einem bestimmten Produkt) und <em>Ortsspezifisch</em> (Suche nach einem Produkt mit geografischem Bezug) an Google gestellt. Die erste Ergebnisseite (SERP) wurde dann maschinell ausgelesen („gescraped“) und nachbearbeitet. Dabei wurden nur die ersten fünf Sponsored Links berücksichtigt, alle weiteren wurden gelöscht. Die so modifizierte Ergebnisseite enthielt schließlich zehn organische Resultate und fünf Sponsored Links. Aus dieser Ergebnisseite wurde dann eine Vergleichsseite erstellt, indem die ersten fünf organischen Resultate mit fünf Sponsored Links vertauscht wurden. Um zu verhindern, dass die Testpersonen aufgrund der unterschiedlichen Formatierungen organische Resultate und Sponsored Links voneinander unterscheiden konnten wurden die Formatierungen vereinheitlicht.</p>
<p>&nbsp;</p>
<p align="center"><img height="339" alt="SERP vertauscht" src="http://www.marketing2null.de/wp-content/uploads/2007/06/serp-vertauscht.jpg" width="450" /></p>
<p>
Zur Durchführung der Studie wurden 56 Teilnehmer US-amerikanischer Universitäten im Alter zwischen 18 und 29 ausgewählt, denen jeweils drei originale Ergebnisseiten (nur Formate modifiziert und Logos entfernt) und drei Ergebnisseiten mit vertauschten organischen Resultaten und Sponsored Links vorgesetzt wurden. Die Teilnehmer der Studie hatten die Aufgabe, bestimmt Produkte zu finden, den Inhalt der während der Suche gesehenen Ergebnisseiten zu beschreiben, die Relevanz der Ergebnisse zu beurteilen und zu erläutern, weshalb sie bestimmte Ergebnisse auswählten. Das Suchverhalten der Teilnehmer wurde während der gesamten Studie aufgezeichnet. Nachdem alle sechs Ergebnisseiten abgearbeitet wurden, wurde den Teilnehmern aufgetragen, alle zuvor nicht angeklickten Suchresultate einzusehen und zu beurteilen.</p>
<p>&nbsp;</p>
<h2>Forschungsfragen und Ergebnisse</h2>
<p>
Die wichtigsten Fragen und korrespondierende Hypothesen werden im folgenden zusammengefasst:</p>
<p><strong>Frage:</strong> <em>Sind Nutzer einer Suchmaschine voreingenommen bezüglich der Qualität von Sponsored Links?<br /></em><strong>Hypothese:</strong> <em>Nutzer einer Suchmaschine schauen sich zuerst die organischen Resultate an, bevor sie sich die Sponsored Links anschauen.<br /></em>Mit Hilfe eines Binomialtests konnte nachgewiesen werden, dass sich die Teilnehmer mit einer großen Wahrscheinlichkeit zuerst auf die organischen Resultate konzentrieren. Die Hypothese konnte somit bestätigt werden.<br />
<strong>Hypothese:</strong> <em>Nutzer einer Suchmaschine schätzen die organischen Resultate als relevanter ein, als die Sponsored Links.<br /></em>Um zu testen, ob die Nutzer voreingenommen gegenüber Sponsored Links sind, wurde ein Chi-Quadrat-Test durchgeführt, wobei zunächst die Einschätzung der Suchresultate seitens der Testpersonen gemessen wurde, ohne, dass die Links tatsächlich angeklickt wurden. Dabei konnte ein signifikanter Unterschied zwischen organischen Resultaten und Sponsored Links festgestellt werden, obwohl die Relevanz durch das systematische Vertauschen von organischen Resultaten und Sponsored Links über die Stichprobe hinweg identisch war. Die Versuchspersonen schätzten 52% der organischen Resultate als relevant ein, während sie nur 42% der Sponsored Links als relevant einstuften.</p>
<p align="center"><img height="335" alt="Relevanz Organische Resultate" src="http://www.marketing2null.de/wp-content/uploads/2007/06/relevanz-organische-resultate.jpg" width="398" /></p>
<p>Wurde hingegen der Inhalt der Zielseiten beurteilt, so ergab der Test, dass kein signifikanter Unterschied der Relevanz bestand, obwohl die Testpersonen wussten ob sie über organischen Resultate oder Sponsored Links auf die Zielseite kamen.</p>
<p></p>
<p align="center"><img height="296" alt="Relevanz Sponsored Links" src="http://www.marketing2null.de/wp-content/uploads/2007/06/relevanz-sponsored-links-1.jpg" width="410" /></p>
<p>Es ist also denkbar, dass die tatsächliche Relevanz der Sponsored Links größer ist, als die der organischen Resultate, da die Wahrnehmung der Testpersonen durch deren schlechtere Einschätzung der Sponsored Links verzerrt verzerrt sein könnte.<br />
<strong>Frage:</strong> <em>Aufgrund welcher Faktoren sind Nutzer einer Suchmaschine gegenüber Sponsored Links voreingenommen?<br /></em>Zur Beantwortung dieser Frage wurden Kommentare und Aussagen der Versuchspersonen im Verlauf des Tests ausgewertet. Das Ergebnis zeigt, dass die meisten Nutzer eine verzerrte Wahrnehmung von Sponsored Links haben, weil es ihnen an Vertrauen mangelt, was wohl darauf zurückzuführen ist, dass sie wissen, dass jemand Geld für diese Anzeige zahlt und dort gegebenenfalls nicht zu Recht erscheint. Als zweit wichtigster Grund wurde die mangelnde Relevanz der Anzeigen genannt.<br />
Aus den Aussagen der Versuchspersonen konnte zudem abgeleitet werden, dass Nutzer sowohl bei organischen Resultaten, als auch bei Sponsored Links zunächst anhand des Titels beurteilen, ob ein ein Ergebnis es überhaupt Wert ist, genauer angeschaut zu werden. Nur wenn der Titel überzeugt, wird der Anzeigentext beurteilt, um dann zu entschieden, ob das Resultat relevant genug ist, um angeklickt zu werden.</p>
<p><strong>Frage:</strong> <em>Schätzen erfahrene, fortgeschrittene Nutzer Sponsored Links tendenziell besser ein, als unerfahrene Nutzer oder Anfänger?<br /></em><strong>Hypothese:</strong> <em>Je erfahrener und fortgeschrittener der Nutzer, desto wahrscheinlicher ist es, dass er Sponsored Links beachtet.<br /></em>Zur Verifikation dieser Hypothese wurde eine Regressionsanalyse durchgeführt. Es konnte kein signifikanter Zusammenhang festgestellt werden und die Hypothese wurde abgelehnt.<br />
Frage: Hat das Ranking der organischen Resultate bzw. der Sponsored Links einen Einfluss auf die Wahrscheinlichkeit, dass ein Suchergebnis bzw. Sponsored Link gesehen wird und auf die Wahrnehmung der Relevanz?<br />
<strong>Hypothese:</strong> <em>Je besser das organische Ranking eines Suchresultats, desto eher wird ein Nutzer es (aktiv) wahrnehmen.<br /></em>Eine Regressionsanalyse ergab, dass ein statistisch signifikanter (positiver) Zusammenhang zwischen der Position eines organischen Resultats und der Anzahl der Klicks besteht. Höher (besser) positionierte Anzeigen wurden also öfters angeklickt, als niedriger (schlechter) positionierte Anzeigen. Die Hypothese wurde angenommen.<br />
<strong>Hypothese:</strong> <em>Je besser das Ranking eines Sponsored Links, desto eher wird ein Nutzer ihn (aktiv) wahrnehmen.<br /></em>Mittels Regressionsanalyse konnte kein signifikanter Zusammenhang festgestellt werden und die Hypothese musste abgelehnt werden.<br />
<strong>Hypothese:</strong> <em>Je besser das organische Ranking eines Suchresultats, desto eher wird es als relevant erachtet.<br /></em>Hier konnte ein signifikanter Zusammenhang zwischen der Positionierung und der wahrgenommenen Relevanz festgestellt werden. Demnach wurden höher (besser) positionierte Resultate als relevanter eingestuft. Die Hypothese wurde somit angenommen.<br />
<strong>Hypothese:</strong> <em>Je besser das Ranking eines Sponsored Links, desto eher wird er als relevant erachtet.<br /></em>Bei den Sponsored Links konnte kein signifikanter Zusammenhang zwischen der Positionierung und der wahrgenommenen Relevanz festgestellt werden. Die Hypothese wurde abgelehnt.</p>
<h2>Fazit</h2>
<p>
Das Ergebnis dieser Studie zeigt, dass Nutzer von Suchmaschinen oft skeptisch und misstrauisch gegenüber Sponsored Links sind und deren Relevanz geringer einschätzen, als sie tatsächlich ist. Dies führt dann dazu, dass sie sich deutlich stärker auf die organischen Resultate konzentrieren, als auf die Sponsored Links.<br />
Um die Relevanz organischer Resultate im Vergleich zu Sponsored Links genauer einschätzen zu können, wird es nötig sein, einen weitaus größer angelegten Versuch mit mehr Testpersonen und vor allem einer großen Anzahl verschiedener Suchanfragen durchzuführen. Die Auswertung von sechs Suchanfragen ist sicherlich kein Beweis dafür, dass Sponsored Links genauso relevant oder gar relevanter sind als die organischen Resultate (bei Suchen mit kommerzieller Motivation).<br />
Das Ergebnis der Untersuchung ist aber zumindest ein Indiz, das meine anfänglichen Vermutungen bestärkt. Wenn ich mich mit Freunden oder Bekannten über Suchmaschinenmarketing (PPC Advertising) unterhalte, stoße ich immer auf die gleichen Bedenken. „Ahh, Du meinst die Werbeanzeigen neben den Suchergebnissen, auf die ich nie klicken würde“, „Da klicke ich eigentlich fast nie&#8230;die, die dort gelistet sind, haben eben gezahlt dafür.“,&#8230; Die zweite Aussage ist ja eigentlich so nicht wirklich falsch. Wer Werbeanzeigen bzw. Sponsored Links schaltet, muss Geld dafür zahlen. Was aber nicht richtig ist, ist die Annahme, dass die bezahlten Ergebnisse – allein aus dem Grund, dass jemand bereit ist, Geld dafür zu bezahlen – nicht relevant und vertrauenswürdig sind.<br />
Vor knapp zehn Jahren, als Alta Vista mit Spam überflutet wurde, hatte Bill Gross, der Gründer von GoTo (später Overture), die Vision dieses Problem zu lösen, indem er den Faktor Preis zum Hauptbestandteil des Rankingalgorithmus seiner kommerziellen Suchmaschine machte. Er entschied sich für ein Pay-per-Click-Abrechnungsmodell, um die Relevanz seiner Ergebnisse zu erhöhen und Spam unmöglich zu machen. Damals war der Auktionsmechanismus noch lange nicht so effizient wie er heute ist. Allein der Preis, den ein Werbetreibender pro Klick zu zahlen bereit war, bestimmte das Ranking. Heute wird von allen großen Suchmaschinen zudem die Klickrate (Teil des Quality Score) berücksichtigt, um Anzeigen mit größerer Relevanz zu begünstigen. Jemand, der ein niedriges Gebot abgibt und eine hochgradig relevante Anzeige schaltet, kann also höher positioniert werden, als jemand, der deutlich mehr bietet, aber eine Anzeige schaltet, für die sich niemand interessiert. Zudem versuchen die Suchmaschinen mittlerweile die Qualität der Landing Page zu berücksichtigen, um gegebenenfalls höhere Mindestgebote zu fordern, wenn die Seite qualitativ als minderwertig eingestuft wird (bspw. zu viele AdSense Anzeigen und wenig Content).<br />
Ist es unter diesen Voraussetzungen möglich, dass eine Anzeige, die langfristig für ein bestimmtes Keyword auf den vorderen Positionen geschaltet wird, überhaupt nicht relevant ist?<br />
Nein. Wäre sie nicht relevant bzw. können die Nutzer der Suchmaschine nicht das finden, wonach sie suchen, so würde das Unternehmen, das die Anzeige schaltet, Kosten tragen, ohne dass Produkte verkauft werden. Dieses Unternehmen, würde – sofern es rational handelt – die Gebote senken oder das entsprechende Keyword aus dem Programm nehmen. Das nicht relevante Ergebnis wäre also nur sehr kurzfristig hoch gerankt und würde kurze Zeit später entweder auf niedrigeren Positionen zu finden sein oder sogar ganz verschwinden.</p>
<p>Einige Ergebnisse dieser Studie sind als äußerst fragwürdig einzustufen. Es ist verwunderlich, dass erfahrene Nutzer in gleichen Maße gegenüber Sponsored Links voreingenommen sind, wie Leute, die nicht besonders mit Suchmaschinen vertraut sind. Ich hätte vermutet, dass erfahrene Nutzer im Laufe der Zeit ein Gespür für die Qualität der Sponsored Links entwickelt haben und deren Relevanz im Vergleich zu organischen Resultaten besser einschätzen können.<br />
Weiterhin halte ich es für äußerst zweifelhaft, dass die Relevanz der Sponsored Links mit schlechteren Positionen nicht sinkt. Dieses Ergebnis steht im Widerspruch zu den Erkenntnissen von <a title="Animesh et al." href="http://www.pitt.edu/~cist2006/files/AnimeshRamachandranViswanathan.pdf">Animesh et al.</a>, die herausgefunden haben, dass besser positionierte Anzeigen deutlich relevanter (qualitativ hochwertiger) sind als schlechter positionierte Anzeigen.</p>
<blockquote><p>We find that QUALITY is significantly positively correlated with average POSITION obtained by the firm in the sponsored search listings&#8230;</p></blockquote>
<p></p>
<p>Der Auktionsmechanismus und die Marktkräfte sorgen schließlich dafür (s.o.), dass relevantere Anzeigen tendenziell höher gerankt werden. Jansen und Resnick folgern aus den Ergebnissen ihrer Studie, dass Anzeigen nicht auf den vorderen Rängen platziert werden müssen, um wettbewerbsfähig zu sein. Diese Aussage ist zwar grundsätzlich zuzustimmen, die Begründung, das liege an der positionsunabhängigen Beurteilung der Relevanz, ist aber sehr dünn. Selbst wenn es so wäre, dass die Relevanz der Sponsored Links auf allen Positionen gleich groß ist, so ist dennoch zu Berücksichtigen, dass die Klickrate mit niedrigeren Positionen degressiv fällt, was auf den Listeneffekt zurückzuführen ist. Zudem nimmt die Anzahl der Impressions ab, da hoch gerankte Anzeigen auch bei Partnern wie AOL ausgegeben werden und</p>
<p>&nbsp;</p>
<p>niedrig platzierte Anzeigen ggf. nur auf der zweiten Seite ausgegeben werden. Beide Faktoren führen zu einem sinkenden Click Potential (<a title="Brooks 2005" href="http://atlassolutions.com/pdf/RankReport.pdf">Brooks 2005</a>). Dieser Einflussfaktor in Kombination mit den Klickpreisen (CPC) auf verschiedenen Positionen ist also letztendlich von Bedeutung, um Gebote zu optimieren, die empfundene Relevanz von 59 Versuchspersonen spielt hier wohl eher eine untergeordnete Rolle.<br />
Abschließend lässt sich sagen, dass die Studie von Jansen und Resnick in erster Linie belegt, dass die Güte von Sponsored Links von den Nutzern von Suchmaschinen deutlich unterschätzt werden. Suchmaschinen haben folglich ein großes Potenzial, ihre Umsätze zu steigern, indem sie Aufklärungsarbeit leisten und die Nutzer von der Qualität bzw. der Relevanz der Sponsored Links überzeugen. Eine Strategie könnte sein, den Nutzern, den Ranking-Mechanismus der Sponsored Links und die zugrunde liegenden Marktkräfte verständlich zu machen. Fraglich ist, ob sich dies so einfach auf die Schnelle erklären lässt. Eine weitere Möglichkeit wäre, breiter angelegte, unabhängige Studien zum Vergleich der Relevanz von organischen Resultaten und Sponsored Links für Produktsuchen durchzuführen und die Ergebnisse gezielt zu kommunizieren.<br />
Sollte sich aus derartigen Untersuchungen aber tatsächlich herausstellen, dass die Sponsored Links bei kommerziell motivierten Suchanfragen relevanter sind, so wäre langfristig nur eine Lösung wirklich sinnvoll: Die Suchmaschinen müssten sich von der Trennung von organischen Resultaten und Sponsored Links verabschieden und einen Algorithmus finden, der die beiden Arten von Suchresultaten integriert beurteilt und auf einer Ergebnisseite vermischt in gleichem Format ausgibt. Wir würden also dort landen, wo wir vor vielen Jahren schon einmal standen, mit dem Unterschied, dass damals kommerzielle Interessen der Grund für eine Vermischung von Werbeanzeigen und organischen Ergebnissen war, während in diesem Fall die Qualität der Suche das eigentliche Ziel wäre.<br />
Was würde der Nutzer dazu sagen? Wahrscheinlich würde er unterstellen: „Google ist böse!“.</p>
<p class="akst_link"><a href="http://www.marketing2null.de/?p=25&amp;akst_action=share-this"  title="eMail versenden, Link speichern, ..." id="akst_link_25" class="akst_share_link" rel="noindex nofollow">ShareThis</a>
</p>]]></content:encoded>
			<wfw:commentRss>http://www.marketing2null.de/2007/06/30/suchmaschinenmarketing-nutzer-unterschaetzen-die-qualitaet-von-sponsored-links/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
