segunda-feira, 22 de junho de 2009

Como funcionam os sites de busca na internet?

Como funcionam os sites de busca na internet?



Na essência, todos os sites de busca funcionam do mesmo jeito: montam um banco de dados com o texto de milhões de páginas e mostram aquelas que têm a ver com a palavra que você digitou na tela de procura. A diferença está nos detalhes. Tipo: que página deve aparecer primeiro? Se você digita algo como "São Paulo", o site de buscas não sabe se você está atrás de informações sobre a maior cidade do país ou sobre o santo. Mas ele tem que dar um jeito de "saber o que você está pensando". Cada site usa fórmulas específicas para ordenar os resultados de uma pesquisa. O jeito mais comum, hoje, é colocar no topo da lista as páginas que recebem mais links de outros sites.

Mas o endereço de busca mais popular na rede, o Google (www.google.com.br), inventou um jeito de ir mais longe: o link de uma página respeitada vale mais que um link qualquer. Os gênios por trás da tecnologia de busca do site são dois engenheiros da computação: Sergey Brin e Larry Page, que apresentaram o Google num artigo de divulgação científica de 1998. Na época, o site era só um projeto de faculdade, para a Universidade de Stanford, na Califórnia. Hoje, vale pelo menos 20 bilhões de dólares!

Oráculo da rede
Google usa até texto de links para ordenar páginas
1. Todo site de busca tem um gigantesco banco de dados que serve de base para as pesquisas na rede. Isso é feito por programas chamados "robôs" ou "aranhas". Eles varrem a internet e gravam o texto de todos os sites que encontram, num ritmo de algumas centenas de páginas por segundo

2. O programa de busca guarda informações como a posição de cada palavra nos sites varridos e o tamanho em que ela aparece. Por exemplo: se você digitar "beatles" no campo de busca e essa palavra estiver no título de uma página, com letras grandes, esse site tende a aparecer bem ranqueado, ou seja, entre os primeiros resultados da pesquisa

3. Mas o fator que mais influi para o ranqueamento é outro: a quantidade de links que apontam para o site. O Google atribui mais valor aos links de páginas que, por sua vez, também são apontadas por muitas outras. Então vale mais um link que esteja indicado no site da Universidade de Harvard, por exemplo, do que num blog qualquer

4. Também conta se o link que leva à página der uma informação extra. Imagine que você tenha um site sobre os Beatles e alguém digite "letras dos beatles" no Google. Se outras páginas tiverem um link escrito "letras dos beatles" que leve ao seu site, ele ganha mais valor

Qual foi o site mais visitado em um único dia?


Qual foi o site mais visitado em um único dia?

Foi o da rede americana CNN, que declarou ter recebido, em 4 de novembro de 2008, 27 milhões de visitantes na página de cobertura da última eleição presidencial nos EUA. Mas esse troféu de popularidade pode não estar nas mãos do verdadeiro vencedor. "É difícil saber se a CNN bateu mesmo um recorde mundial, pois não há uma ferramenta que meça a audiência de todas as páginas de todos os sites do mundo", explica Fernando Frota, pesquisador do Laboratório de Arquitetura e Redes de Computadores (Larc), da Universidade de São Paulo. Em outras palavras, cada site é o responsável por registrar a quantas anda sua popularidade, podendo liberar ou não essa informação ao público. O navegador Firefox, por exemplo, marcou 8,39 milhões de usuários em 18 de junho de 2008, no chamado Firefox Day, dia em que uma atualização foi disponibilizada para ser baixada gratuitamente.

Saiba como se tiram as medidas da visitação em um site

Quando você acessa um site, seu computador manda um bocado de informações suas ao servidor geral desse site, como o seu IP (número que identifica o computador na rede), a data e a hora da visita e em quais páginas você entrou. No servidor do site, um software junta todas as informações de acesso – suas e das outras pessoas conectadas –, descobrindo, entre outras coisas, quais são as páginas mais vistas e quanta gente perambula por lá. Há ainda sites como o Alexa, que analisam o tráfego na web de forma independente, mais ou menos como o Ibope faz para a TV – escolhem um grupo de pessoas que representaria a população total e instalam medidores no computador de cada uma delas. O computador do usuário envia todas as informações de visitação ao Alexa. Em troca, o Alexa repassa informações sobre os sites em que ele navega, como as páginas que estão bombando.

Os sites mais visitados no mundo...

1) Yahoo 2) Google 3) YouTube 4) Windows Live 5) MSN

... e no Brasil

1) Google.br 2) Orkut 3) Windows Live 4) UOL 5) YouTube