Blog

TF-IDF: entenda o uso desse cálculo pelo Google

TF-IDF: entenda o uso desse cálculo pelo Google.img

TF-IDF é um cálculo estatístico adotado pelo algoritmo do Google para medir quais termos são mais relevantes para um tópico, analisando a frequência com que aparecem em uma página, em comparação à sua frequência em um conjunto maior de páginas.

Ainda assim ficou confuso? Então vamos lá: TF é Term Frequency ou em português: Frequência do Termo. Corresponde à frequência com que o termo aparece no documento. Quanto maior for sua frequência, maior sua importância. IDF é Inverse Document Frequency que em português seria algo como: frequência inversa dos documentos. É esta parte que vai verificar dentre tantos outros documentos lidos pelo Google, qual a frequência com que aquele termo aparece. Veja o esquema:

tf-idf

Desta forma, quando o fator IDF é incorporado o peso dos termos que ocorrem com muita frequência no conjunto de documentos e aumenta o peso dos termos que ocorrem raramente. A importância do valor TF-IDF aumenta conforme o número de vezes que a palavra aparece no documento (TF) mas é compensada pelo número de repetições na coleção de documentos (IDF), para ajustar o fato de que algumas palavras aparecem com mais frequência em geral.

O Google utiliza um robô para rastrear os conteúdos da web. O cálculo TF-IDF ajuda o buscador a enfatizar os termos e frases do conteúdo de sites e blogs que realmente importam para classificação no ranking. Este cálculo faz com que, por exemplo, seja possível processar a linguagem utilizada nos conteúdos.

Essa otimização pode ser utilizada para otimizar seus conteúdos, deixando assim, o seu trabalho SEO melhor posicionado.

Continue nos acompanhando para saber mais sobre as novidades do mundo do marketing digital.

Comente a matéria abaixo

Compartilhe esta notícia