WDF/IDF

WDF/IDF - Wer A sagt, muss auch B sagen - Texte durch Analyse optimieren

Was ist WDF/IDF?

WDF und IDF sind zur Suchmaschinenoptimierung verwendete Formeln, die die Relevanz eigener Inhalte im Verhältnis zum Content anderer Webseiten berechnen.

WDF ist die Abkürzung von "Within Document Frequency" und misst die Häufigkeit aller auf einer Seite oder in einem Dokument vorkommenden Wörter im Verhältnis zu allen anderen Wörtern in demselben Textkorpus.

WDF/IDF - Wer A sagt muss auch B sagen

IDF hingegen steht für "Inverse Document Frequency" und bemisst die Häufigkeit der in einem Text vorkommenden Wörter im Verhältnis zur Häufigkeit dieser Wörter in (theoretisch) allen anderen Texten. Die Formel stellt das Vorkommen eines Keywords auf einer Webseite ins Verhältnis zu allen anderen Seiten, die mit diesem Keyword ranken.

Wird eine Webseite mittels WDF/IDF-Analyse untersucht, steht also nicht die Keyword-Dichte im Fokus des Interesses, sondern der gesamte Textkorpus der Seite im Vergleich zu dem anderer Seiten, die Content zum gleichen Keyword ausspielen. Mit der WDF/IDF-Formel lässt sich die Termfrequenz einer Webseite bestimmen. Während viele SEO-Tools lediglich auf eine Erhöhung der Keyword-Dichte abzielen, lässt sich mit Tools zur WDF/IDF-Berechnung die Relevanz einer ganzen Website erhöhen. Diese stellen somit ein optimales Tool für die OnPage-Optimierung dar.

Was ist eine WDF IDF Analyse?

WDF IDF steht für „Within document frequency“ und „Inverse document frequency“. Übersetzt Du das, stellt sich heraus, dass es um die Häufigkeit in einem Dokument geht. Es geht also darum, Texte zu analysieren. WDF und IDF stellen diesbezüglich jeweils einen Wert dar. Im letzten Schritt einer längeren mathematischen Rechnung werden beide miteinander multipliziert. Aus diesem Grund verwendet man häufig den Begriff WDF*IDF.

Die grundlegende Formel lautet:

W i, j = WDF i, j * IDF i

Du multiplizierst die Häufigkeit eines Wortes i innerhalb eines bestimmten Dokuments j mit der Häufigkeit des Wortes i innerhalb vieler relevanter Dokumente.

WDF

Hierbei geht es um die relative Häufigkeit des jeweiligen Wortes i. Dazu wird es ins Verhältnis zu allen anderen Wörtern im Dokument j gesetzt. Dann dividiert man das Ergebnis durch die Gesamtlänge des Textes (L). Um das Ergebnis zu stauchen, wendest Du außerdem einen Logarithmus an. Die entsprechende Formel lautet:

W i, j = log 2 (Frequenz i, j + 1) / log 2 (L)

IDF

Auch hierbei ist das Thema eine relative Häufigkeit. Jedoch wird das Wort i ins Verhältnis zu allen Dokumenten gesetzt, welche es enthalten. Du benötigst zwei Mengen an Dokumenten: Die erste (ND) setzt sich aus allen relevanten Dokumenten mit dem gleichen Thema zusammen, die zweite (Ni) aus allen Dokumenten, welche das Wort i enthalten. Und auch hierbei kommt ein Logarithmus zum Einsatz, um das Ergebnis zu stauchen. Die Formel lautet:

IDF i = log 10 (1 + ND / Ni)

Welche SEO-Tools gibt es?

Praktisch funktioniert die Anwendung von WDF*IDF wie folgt: Du legst einen bestimmten Schlüsselbegriff fest, auf welchen die jeweilige Optimierung erfolgen soll. Für die anschließende WDF*IDF-Analyse stehen verschiedene SEO-Tools zu Verfügung. Die wichtigsten Anbieter sind:

Von der Funktionsweise her ähneln sich die verschiedenen Tools: Zunächst gibst Du deinen Schlüsselbegriff ein. Im Anschluss wählst Du noch das entsprechende Land aus. Dann errechnet das Tool den Idealwert. Mit diesem kannst Du den Wert deines Textes vergleichen.

Wie berechnet man WDF/IDF?

Die "Within Document Frequency" wird berechnet, indem man die Häufigkeit eines Terms in einem Text ins Verhältnis zur Anzahl aller Terme in dem selben Text setzt. Der Logarithmus sorgt dabei dafür, dass eine starke Erhöhung der Keyword-Dichte den WDF-Wert nicht positiv beeinflussen kann. Dies ist zu verhindern, weil die Keyword-Dichte nur die prozentuale Verteilung eines Worts im Verhältnis zur Anzahl aller Wörter eines Texts berechnet, während die "Within Document Frequency" das Verhältnis aller im Text vorkommenden Wörter mit einbezieht.

Die "Inverse Document Frequency" erhält man, indem man die Häufigkeit eines Terms in einem Dokument mit der Häufigkeit des gleichen Terms in einem relevanten Dokumentenkorpus multipliziert. Daraus erhält man die Gewichtung des Terms im Dokument, also welche Relevanz ein Text in Bezug auf ein bestimmtes Keyword hat. Der IDF-Wert gibt Aufschluss über die Häufigkeit an Dokumenten zu einem bestimmten Term.

Multipliziert man die beiden Formeln miteinander, ergibt sich der WDF*IDF-Wert, das heißt die relative Termgewichtung eines Dokuments im Verhältnis zu allen Dokumenten, die das gleiche Keyword enthalten. Das Ergebnis ist nur dann von Nutzen, wenn die Berechnung für jedes Wort in einem Text durchgeführt wird. Um ein möglichst präzises Ergebnis zu erhalten, sollte man für die Berechnung eine möglichst große Datenbasis heranziehen.

Warum ist WDF/IDF wichtig für SEO?

Mit WDF/IDF können User die Textinhalte ihrer Webauftritte so optimieren, dass sie ein hohes Suchmaschinenranking erreichen. Sie haben die Möglichkeit, die Häufigkeit der auf ihrer eigene Webseite vorkommenden Begriffe mit der Häufigkeit derselben Begriffe auf Webseiten zu vergleichen, die das beste Ranking für ein bestimmtes Keyword haben. In der Regel geben die entsprechenden Tools dem User anschließend Begriffe vor, die in ihrer Anzahl verringert, erhöht oder ergänzt werden sollten, um den Text möglichst einzigartig zu gestalten. Folgt man den Anweisungen, erreicht man das bestmögliche Ranking bei Google.

Viele Anbieter von SEO-Tools haben die WDF/IDF-Analyse inzwischen in ihre Tools aufgenommen. Nachdem man einen Suchbegriff eingegeben hat, den man ranken möchte, zeigt das Tool die Begriffe an, die einen hohen WDF/IDF-Wert besitzen und für die Suchmaschine relevant sind. Sie zeigen auf wie oft jedes Wort des Dokumentes vorkommt.

Während in der Suchmaschinenoptimierung früher vor allem die Keyword-Dichte als Maßstab galt, bietet die WDF/IDF-Formel eine sehr viel präzisere Möglichkeit zur Content-Optimierung. Heute darf WDF/IDF bei keiner OnPage-Optimierung fehlen. Der positive Effekt einer Steigerung des WDF/IDF-Werts auf das Ranking wurde wiederholt nachgewiesen.

Reichen WDF/IDF alleine für die Suchmaschinenoptimierung aus?

Das WDF/IDF Tool berücksichtigt lediglich die Termgewichtung von Texten und keineswegs Elemente wie Struktur, Tonalität, Stilmittel und Lesefluss. Diese spielen für die Userfreundlichkeit eines Texts aber eine bedeutende Rolle. Um lesbare, qualitativ hochwertige Texte zu erhalten, die dem Leser einen echten Mehrwert bieten, sollten Inhalte also immer für den User geschrieben werden, nicht für die Suchmaschine.

Darüber hinaus schließt die Analyse einige weitere Faktoren aus, die der tatsächlichen Optimierung von Content dienen können. Termini, die mit den Keywords in engem Zusammenhang stehen, oder Wörter, die auf die Suchintention des Nutzers hinweisen, werden beispielsweise nicht berücksichtigt. Orientiert man sich ausschließlich an den WDF/IDF-Werten, kann es passieren, dass Inhalte ohne wirklichen Sinn als optimiert eingestuft werden. Die Tools bieten zum Beispiel auch keine Option, Mehrdeutigkeiten von Begriffen abzubilden.

Häufige Fragen und Antworten

WDF*IDF – Der Keyword Density Killer?
WDF/IDF ist eine Weiterentwicklung der Keyworddichte.
Wie lässt sich WDF*IDF am besten beschreiben?
WDF bedeutet Within Document Frequency. WDF gibt die Häufigkeit der Wörter, die im Text vorkommen an. IDF bedeutet Inverse Document Frequency und gibt das Verhältnis des vorkommenden Wortes zu allen anderen Wörtern an. Nimmt man also das Ergebnis von WDF und multipliziert dies mit IDF, dann erhält man die Gewichtung des Terms im Verhältnis zum Vorkommen der anderen Wörter.
Was, wenn ich Keywords laut WDF*IDF zu oft verwendet habe?
Kein Problem. Stören Deine Keywords den Lesefluss, hast Du sie ungünstig eingebaut oder zu häufig verwendet. Tausche 1 oder 2 Schlagworte aus, das kann schon viel bewirken.