Um ALGORITMO de busca que vale bilhões de dólares? | Algoritmos #9
Com intenções muito nobres em mente, o Google decidiu introduzir uma atualização chamada Panda Update. A idéia foi muito clara, para penalizar farms de conteúdo e sites de scraper e melhorar os resultados da pesquisa.
Para aqueles que não sabem, um site scraper é um site que copia todo ou parte de seu conteúdo de outros blogs ou sites. Isso pode ser feito copiando e colando manualmente, usando feeds RSS e exibindo seu conteúdo de feed por conta própria ou qualquer outra técnica de demolição da web. O objetivo é claro - encapsular o conteúdo gerado por outros, manipular rankings nos mecanismos de busca, aumentar o tráfego e ganhar receita com publicidade.
Infelizmente, algo parece ter dado errado em algum lugar.
Panda puniu as pessoas erradas! O Panda Update quebrou muitos corações de blogueiros genuínos… e também está de volta! Eles descobriram que, em questão de pouco tempo, seu tráfego de pesquisa do Google, cuidadosamente cultivado, desabou.
Existem vários relatórios na Internet mostrando como, em muitos casos, os sites de raspadores estão de fato funcionando melhor agora. Nós também escrevemos anteriormente sobre como um blog de blogspot que exibia nosso feed RSS em seu site era mais alto que nosso site.
O que aconteceu foi que em vários casos muitos sites e blogs de boa qualidade começaram a ficar mais baixos nos resultados de pesquisa do Google.
Aqui, deixe-me dar o nosso próprio exemplo. Um site específico distribui e recolhe o conteúdo do The Windows Club. Nós somos o gerador de conteúdo original e, no entanto, ele está acima de nós no Google.com!
Conteúdo original em nosso site:
Conteúdo distribuído ou desmembrado no outro site:
Resultados da pesquisa no Google.com.
O Google lançou pequenas atualizações no Panda e as rotulou como melhorias. Enquanto o Google os está chamando de melhorias, tenho certeza de que estão em vigor correções para tentar corrigir essas anomalias. A última atualização lançada é o Panda 2.4.
Embora o Google não queira reconhecê-lo, talvez tenha percebido que algo deu errado em algum lugar e está tentando consertá-lo.
O Google agora está buscando ajuda de todos para descobrir o que, se alguma coisa, deu errado! Ele está convidando as pessoas a apontarem exemplos em que os sites de raspagem estão mais altos do que os sites de conteúdo original e pedindo que todos relatem
aqui . O Google está testando alterações algorítmicas para sites de raspadores (especialmente scrapers de blog). Solicitamos exemplos e podemos usar os dados enviados para testar e melhorar nossos algoritmos.
Se o seu site ou blog foi afetado negativamente pela Atualização do Panda, talvez você queira verificar alguns desses serviços de limpeza geralmente bons. dicas para tentar se recuperar da atualização do Panda.
Para um leigo como eu, que é, por padrão, um usuário da Pesquisa do Google, parece que o Google usou um pouco as coisas e o Panda Update estragou até seus resultados de pesquisa em um grau. Enquanto um usuário comum pode não perceber as mudanças, o usuário perspicaz certamente perceberá que algo está errado. Enquanto o TWC estava classificando o pré-Panda decente, hoje nós classificamos abaixo dos sites que descartam ou distribuem nosso conteúdo. Embora acreditemos que nosso conteúdo seja bom, também compreendemos e respeitamos a prerrogativa do Google em formar sua própria opinião sobre nosso site.
Mas às vezes é realmente assustador quando você percebe que todo o seu trabalho ou seu reconhecimento depende de apenas uma pesquisa particular. motor que é livre para criar seu próprio algoritmo de busca. O Google pode não ser mau, mas com certeza pode cometer erros. E, por menor que seja a minha opinião, acho que o Google cometeu um erro com o Panda Update.
ATUALIZAÇÃO:
16 de setembro de 2011 Mais um exemplo de como outro site de scrapers que está exibindo nosso feed RSS está mais alto do que nosso conteúdo! Mais
aqui . Só podemos esperar que o Google corrige e melhora seu algoritmo de busca em breve. Muito está em jogo aqui… para todos… incluindo o Google!
A Cisco está em muito melhor forma hoje porque 25% de sua receita agora vem de sua tecnologias adicionadas e a empresa está trabalhando em mais 30 novas tecnologias e mercados, disse Chambers. A empresa também tem mais caixa agora, ele apontou: tinha US $ 34 bilhões em dinheiro em 2008, disse ele.
Em vez de cortar e reconstruir com a economia, os cortes que a Cisco está fazendo hoje são quase todos permanentes, como como reduzir as despesas de viagem para US $ 240 milhões por ano, de US $ 750 milhões, usando seus próprios sistemas de TelePresença para reuniões virtuais, disse Chambers. A empresa espera reduzir seus custos anuais em US $ 1,5 bilhão este ano.
A Dell busca expandir sua oferta no Linux Para expandir suas ofertas no Linux, a Dell está pesquisando novos dispositivos do tipo netbook e em breve oferecerá atualizações do sistema operacional Linux Em um esforço para expandir suas ofertas de Linux, a Dell está pesquisando novos dispositivos do tipo netbook e em breve oferecerá atualizações de netbooks para o Linux, disse uma autoridade da empresa na quarta-feira. A empresa está pesquisando a possibilidade de oferecer novos produtos Linux. bas
Smartbooks são dispositivos do tipo netbook que são alimentados por chips projetados pela Arm. Os dispositivos suportam principalmente o sistema operacional Linux e são projetados para aqueles que dependem da Web para a maior parte de sua computação. A Dell não pôde dizer se ofereceria um livro inteligente.
O Yahoo começará a inserir posts no Twitter diretamente em sua página geral de resultados de busca na Web na quinta-feira, expandindo uma integração inicial do Twitter em seu mecanismo de busca. Agora, os "Tweets" aparecerão em uma seção do Twitter nos resultados de busca da Web para consultas relacionadas ao que o algoritmo determinar. são tópicos quentes em um determinado momento, disse Larry Cornett, vice-presidente de experiência do consumidor no Yahoo Search.
"Isso mostra que continuamos a trazer essas informações em tempo real para a experiência de pesquisa, mas também diretamente a página de pesquisa da Web em si ", disse Cornett.