Como Google funciona – II



Na língua inglesa, já virou até verbo: “did you google today?” A língua portuguesa não permite tão facilmente essas liberdades, mas o fato é que o termo está no nosso dia a dia. Você já parou pra pensar quantas vezes por dia você fala em google, em buscar no google, em usar o google, etc.?

 

E, no entanto, nós, buscadores mortais, sabemos muito pouco do que está por trás, do que acontece quando digitamos uma palavra ou uma frase na janela de buscas. O que acontece, então? Como é que Google vasculha a Internet tão rapidamente e com tão bons resultados?

 

O segredo está no fato de que a busca não é feita na Internet. Em vez disso, Google faz uma busca em seu próprio banco de dados, um monumental banco de dados que cresce e se atualiza 24 horas por dia, 7 dias por semana.

 

E tudo acontece sem intervenção humana. Pequenos programas chamados “spiders” (aranhas) ou “crawlers” (rastejadores) seguem links de uma página a outra (como uma aranha passeando em uma teia). E, assim, coletam informação sobre cada sentença, cada imagem, cada número de telefone e qualquer outras informação que encontrem. Eles escaneiam cada página que visitam, indexam palavras-chave e anotam os links de e para a página. Então, essa informação é armazenada. Os links e páginas são “rastejadas” o tempo todo, garantindo que a informação está atualizada.

 

O passo seguinte é o ranqueamento das páginas, onde Google usa o seguinte:


  • frequencia e localização das palavras-chave (mais palavras-chave em localizações mais proeminentes são melhor)


  • idade da página (quanto mais bem estabelecida for uma página, melhor)


  • número de páginas com links para uma página (quanto mais links, melhor)

(continua)