WDF*P*IDF relevant für SEO und Keyworddichte

Der alte Faktor Keyworddichte bekommt durch die neue Formel für SEO-Texte einen Arschtritt verpasst.WDF*P*IDF heißt die neue Formel, welche nach Bemessung der Keyworddichte sogar Relevanz für das Ranking einer Internetseite hat. In der Vergangenheit ging es immer darum, Texte richtig für die Suchmaschinen zu optimieren, indem man eine Vielzahl von Keywords untergebracht hat. Doch dem wird mit WDF*P*IDF ein Ende gesetzt. Denn zukünftig wird es nicht mehr so stark darauf ankommen, wie oft man bestimmte Begriffe im Text unterbringt. Google checkt vielmehr inwiefern ein Zusammenhang zwischen der Thematik einer Webseite und dem Content besteht. Die Formel an sich ist nicht neu, denn sie dient als Grundlage für alle Suchmaschinen (Google, Bing, Yahoo und Co.).

Was ist überhaupt WDF?

wdf*p*idf

Tony Hegewald / pixelio.de

WDF heißt Within-document Frequency. Damit wird die dokumentspezifische Gewichtung des Wortes gemessen. Donna Harman hat diese Formel ins Leben gerufen. Ein nutzbarer Gewichtungswert auf Basis der Informationswissenschaft wird bestimmten Worten zugeteilt und auf ein gesamtes Dokument abgestimmt. Dieser Wert wird gemeinsam in einer Formel mit dem Wert IDF (Inverse Document Frequency) oder auch „Inverse Dokumentfähigkeit“ kombiniert und in ein Bestimmtes Verhältnis gesetzt. Duch den Wert WDF wird nicht die relative Häufigkeit eines Wortes im Dokument festgestellt, sondern ein gestauchter Wert, der besser verwendbar ist. Je höher die WDF eines Wortes ist, desto häufiger kommt dieses Wort im Dokument vor.

Die Formel

WDF(i) = frac{log_2(mathrm{Freq}(i,j)+1)}{log_2(L)}

i=:Wort
j=:Dokument
L=:Gesamtzahl der Wörter in Dokument j
Freq(i,j)=:Häufigkeit des Wortes i im Dokument j

Erklärung zu „+1“: falls Freq(i,j) = 0 ist, erreicht man mit dem „+1“ dass im Zähler log2(1) = 0 steht.


Beispiel

Ein Dokument besteht aus 12000 Wörtern, also ist L=12000. Das Wort i kommt in diesem Dokument 23 mal vor, also ist Freq(i,j)=23.
Nun braucht man nur noch einsetzen und es entsteht:

WDF(i)= frac{log_2(23+1))}{log_2(12,000)}

Als Ergebnis erhält man den Gewichtungswert WDF(i)= 0,3 (gerundet), zum Vergleich ist die relative Häufigkeit des Wortes i hier 0,001 %.

Und was heißt nun IDF?

Inverse Dokumenthäufigkeit (IDF)

Inverse Dokumenthäufigkeit (Inverse Document Frequency (IDF)) zeigt die Information Information Retrieval zur Bestimmung der Trennfähigkeit eines Wortes bzw. Termes für die Indexierung von Dokumenten. Ein Wort, das nur in wenigen Dokumenten oft vorkommt, ist geeigneter als eines, das in fast jedem Dokument oder nur sehr gering auftritt. Zusammen mit der Termfrequenz (Tf-idf-Maß) wird sie zur Gewichtung von Wörtern bei der Automatischen Indexierung eingesetzt.

 

Die Inverse Dokumenthäufigkeit lässt sich berechnen als

IDF_{t}=logleft(1+frac{N_D}{f_t}right)

wobei N_D die Anzahl der Dokumente bezeichnet und f_t die Anzahl der Dokumente, die den Term t enthalten. Wenn die Dokumentenhäufigkeit wächst, wird der Bruch kleiner.

Relevant für Dokumente hinsichtlich SEO sind Keyworddichte und Termfrequenz

Termfrequenz

Die Termfrequenz ist die Häufigkeit des Wortes im gesamten Text einer Webseite. Die Termfrequenz lässt sich einfach feststellen, doch sie gibt nicht unbedingt Auskunft darüber wie gut oder schlecht eine Webseite optimiert wurde. Relevant ist die Gesamtzahl der Wörter im Verhältnis zum eigentlich relevanten Keyword. D.h. wenn es bei einer Webseite um Bücher geht und andere Begriffe wie Auto oder Motorrad darin vorkommen, sind diese nicht direkt relevant für die Optimierung des Begriffes „Bücher“.

Keyworddichte oder Keyword-Density

Die Keyworddichte hat etwas mehr Aussagekraft als die Termfrequenz. Dabei wird die Häufigkeit eines Begriffes mit der Gesamtzahl aller Wörter in eine Verhältnis gesetzt. Die Suchwort- oder Keyworddichte (von Englisch keyword density) beschreibt, wie häufig ein Begriff (das Suchwort) in einem Dokument vorkommt. Sie ist der Quotient aus absoluten Anzahl eines bestimmten Terms (Wort- oder Wortkombination) und der Anzahl aller Terme im Dokument.

Doch die reine Keyworddichte ist nicht mehr so stark relevant für das Ranking einer Internetseite. Die Meinungen gehen dabei weit auseinander. Ob 3 Prozent, 5 Prozent oder 10 Prozent. Wer weiß das schon so genau? Manche Seiten ranken unter bestimmten Begriffen auf einer guten Position, obwohl der Begriff mit dem Sie vorne ranken, nicht oder ganz selten im Text oder den Meta-Tags der Seite vorkommt.

Formel WDF*P*IDF

Diese Formel ist statt einer Keyworddichte relevant. D.h. nicht mehr nur die Keyword-Density in einem Dokument wird wahrgenommen, sondern WDF*P*IDF. Mehrere Faktoren eines Dokumentes spielen ein Rolle. Die gesamte Thematik einer Webseite wird aufgegriffen und von Google bewertet und nicht nur der Text einer Hauptseite. Alle Keywords werden mit dem Rest der Seite gegenübergestellt. Vergessen darf man nicht, dass dies nur ein Faktor von vielen anderen darstellt und es in der Praxis nicht nur darauf ankommt, aber wenn man jeden einzelnen Rankingfaktor berücksichtigt, verbessert sich auch das Ranking. In der Praxis berücksichtigt die Suchmaschine auch die Relevanz von Title, Discription, Text und Thema einer Webseite ganz stark.

 

Wie sieht Google das?


Quelle:

Wikipedia

1 Antwort

Hinterlassen Sie einen Kommentar

Wollen Sie an der Diskussion teilnehmen?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.