WDF/IDF

WDF/IDF - Wer A sagt, muss auch B sagen - Texte durch Analyse optimieren

Was ist WDF/IDF?

WDF und IDF sind zur Suchmaschinenoptimierung verwendete Formeln, die die Relevanz eigener Inhalte im Verhältnis zum Content anderer Webseiten berechnen.

WDF/IDF - Wer A sagt muss auch B sagen

WDF ist die Abkürzung von "Within Document Frequency" und misst die Häufigkeit aller auf einer Seite oder in einem Dokument vorkommenden Wörter im Verhältnis zu allen anderen Wörtern in demselben Textkorpus. IDF hingegen steht für "Inverse Document Frequency" und bemisst die Häufigkeit der in einem Text vorkommenden Wörter im Verhältnis zur Häufigkeit dieser Wörter in (theoretisch) allen anderen Texten. Die Formel stellt das Vorkommen eines Keywords auf einer Webseite ins Verhältnis zu allen anderen Seiten, die mit diesem Keyword ranken.

Wird eine Webseite mittels WDF/IDF-Analyse untersucht, steht also nicht die Keyword-Dichte im Fokus des Interesses, sondern der gesamte Textkorpus der Seite im Vergleich zu dem anderer Seiten, die Content zum gleichen Keyword ausspielen. Mit der WDF/IDF-Formel lässt sich die Termfrequenz einer Webseite bestimmen. Während viele SEO-Tools lediglich auf eine Erhöhung der Keyword-Dichte abzielen, lässt sich mit Tools zur WDF/IDF-Berechnung die Relevanz einer ganzen Website erhöhen. Diese stellen somit ein optimales Tool für die OnPage-Optimierung dar.

Wie berechnet man WDF/IDF?

Die "Within Document Frequency" wird berechnet, indem man die Häufigkeit eines Terms in einem Text ins Verhältnis zur Anzahl aller Terme in dem selben Text setzt. Der Logarithmus sorgt dabei dafür, dass eine starke Erhöhung der Keyword-Dichte den WDF-Wert nicht positiv beeinflussen kann. Dies ist zu verhindern, weil die Keyword-Dichte nur die prozentuale Verteilung eines Worts im Verhältnis zur Anzahl aller Wörter eines Texts berechnet, während die "Within Document Frequency" das Verhältnis aller im Text vorkommenden Wörter mit einbezieht.

Die "Inverse Document Frequency" erhält man, indem man die Häufigkeit eines Terms in einem Dokument mit der Häufigkeit des gleichen Terms in einem relevanten Dokumentenkorpus multipliziert. Daraus erhält man die Gewichtung des Terms im Dokument, also welche Relevanz ein Text in Bezug auf ein bestimmtes Keyword hat. Der IDF-Wert gibt Aufschluss über die Häufigkeit an Dokumenten zu einem bestimmten Term.

Multipliziert man die beiden Formeln miteinander, ergibt sich der WDF*IDF-Wert, das heißt die relative Termgewichtung eines Dokuments im Verhältnis zu allen Dokumenten, die das gleiche Keyword enthalten. Das Ergebnis ist nur dann von Nutzen, wenn die Berechnung für jedes Wort in einem Text durchgeführt wird. Um ein möglichst präzises Ergebnis zu erhalten, sollte man für die Berechnung eine möglichst große Datenbasis heranziehen.

Warum ist WDF/IDF wichtig für SEO?

Mit WDF/IDF können User die Textinhalte ihrer Webauftritte so optimieren, dass sie ein hohes Suchmaschinenranking erreichen. Sie haben die Möglichkeit, die Häufigkeit der auf ihrer eigene Webseite vorkommenden Begriffe mit der Häufigkeit derselben Begriffe auf Webseiten zu vergleichen, die das beste Ranking für ein bestimmtes Keyword haben. In der Regel geben die entsprechenden Tools dem User anschließend Begriffe vor, die in ihrer Anzahl verringert, erhöht oder ergänzt werden sollten, um den Text möglichst einzigartig zu gestalten. Folgt man den Anweisungen, erreicht man das bestmögliche Ranking bei Google.

Viele Anbieter von SEO-Tools haben die WDF/IDF-Analyse inzwischen in ihre Tools aufgenommen. Nachdem man einen Suchbegriff eingegeben hat, den man ranken möchte, zeigt das Tool die Begriffe an, die einen hohen WDF/IDF-Wert besitzen und für die Suchmaschine relevant sind.

Während in der Suchmaschinenoptimierung früher vor allem die Keyword-Dichte als Maßstab galt, bietet die WDF/IDF-Formel eine sehr viel präzisere Möglichkeit zur Content-Optimierung. Heute darf WDF/IDF bei keiner OnPage-Optimierung fehlen. Der positive Effekt einer Steigerung des WDF/IDF-Werts auf das Ranking wurde wiederholt nachgewiesen.

Reichen WDF/IDF alleine für die Suchmaschinenoptimierung aus?

Das Analysetool WDF/IDF berücksichtigt lediglich die Termgewichtung von Texten und keineswegs Elemente wie Struktur, Tonalität, Stilmittel und Lesefluss. Diese spielen für die Userfreundlichkeit eines Texts aber eine bedeutende Rolle. Um lesbare, qualitativ hochwertige Texte zu erhalten, die dem Leser einen echten Mehrwert bieten, sollten Inhalte also immer für den User geschrieben werden, nicht für die Suchmaschine.

Darüber hinaus schließt die Analyse einige weitere Faktoren aus, die der tatsächlichen Optimierung von Content dienen können. Termini, die mit den Keywords in engem Zusammenhang stehen, oder Wörter, die auf die Suchintention des Nutzers hinweisen, werden beispielsweise nicht berücksichtigt. Orientiert man sich ausschließlich an den WDF/IDF-Werten, kann es passieren, dass Inhalte ohne wirklichen Sinn als optimiert eingestuft werden. Die Tools bieten zum Beispiel auch keine Option, Mehrdeutigkeiten von Begriffen abzubilden.

Häufige Fragen und Antworten

WDF*IDF – Der Keyword Density Killer?
WDF/IDF ist eine Weiterentwicklung der Keyworddichte.
Wie lässt sich WDF*IDF am besten beschreiben?
WDF bedeutet Within Document Frequency. WDF gibt die Häufigkeit der Wörter, die im Text vorkommen an. IDF bedeutet Inverse Document Frequency und gibt das Verhältnis des vorkommenden Wortes zu allen anderen Wörtern an. Nimmt man also das Ergebnis von WDF und multipliziert dies mit IDF, dann erhält man die Gewichtung des Terms im Verhältnis zum Vorkommen der anderen Wörter.
Was, wenn ich Keywords laut WDF*IDF zu oft verwendet habe?
Kein Problem. Stören Deine Keywords den Lesefluss, hast Du sie ungünstig eingebaut oder zu häufig verwendet. Tausche 1 oder 2 Schlagworte aus, das kann schon viel bewirken.