Componentes

Bem-vindo à Web 3.0: pesquisas semânticas

Internet 3.0: información para todos | Juan Reutter | TEDxPUCdeChile

Internet 3.0: información para todos | Juan Reutter | TEDxPUCdeChile
Anonim

"Ao contrário de uma nova geração das chamadas tecnologias semânticas. classificando algoritmos como o PageRank do Google para prever a relevância, a busca semântica diminui o significado da linguagem para produzir resultados de pesquisa altamente relevantes ", de acordo com um relatório publicado pelos analistas Mike Davis e Madan Sheina, da Ovum.

Notável Os provedores da web destacados pelos analistas incluem o Expert System, Powerset, Yedda, Trovix e Hakia. Segundo os autores, a consciência da busca semântica aumentou quando a Microsoft escolheu duas empresas de busca semântica Powerset e Zoomix.

No caso do Expert System, sua aplicação, chamada Cogito, é projetada em torno dos princípios da compreensão humana para permitir o conteúdo. ser entendido na maneira em que o autor pretendia que fosse. Isso é algo que a pesquisa por palavras-chave ignora.

"Uma pesquisa no Google pela palavra 'jaguar' continha o conteúdo do animal e do carro. A pesquisa semântica não olhava apenas para a palavra-chave, mas também para outras palavras como" selva "ou 'saloon' para separar os dois significados", disseram os autores.

Análise mais profunda

Além da busca semântica, há outras formas, incluindo heurística e ontologia, lingüística e mineração de texto e estatística. No entanto, o Expert System está afirmando que essas abordagens são insuficientes, abordando apenas os aspectos morfológicos e gramaticais da análise.

Outros mecanismos de busca geralmente atingem uma parede de tijolos quando se trata de uma análise profunda. Por exemplo, quando um mecanismo de busca heuristicamente orientado vê dois adjetivos em uma frase, normalmente ele os lava e pontua a sentença como neutra porque não tem entendimento de onde os dois adjetivos separados estão apontando.

Em comparação, a busca semântica parece em ambas as sentenças - como as palavras em uma frase se relacionam - e análise semântica - entendendo o contexto das palavras-chave

Quando um termo é ambíguo, significando que pode ter vários significados, por exemplo, latido, é necessária análise semântica em outras palavras, envolvê-lo para dar a ele seu verdadeiro significado e contexto.

Um banco de dados léxico

Os engenheiros da Expert Systems estão dizendo que o Cogito pode ir além porque tem uma rede semântica - um banco de dados léxico que fornece uma representação do conhecimento das definições de palavras e seus relacionamentos. Ele despejou o dicionário de Webster em um banco de dados in-memory - compreendendo 350.000 palavras e 2,8 milhões de relacionamentos.

"A rede semântica do Expert System também se concentra em palavras comuns. Isso é diferente da maioria das abordagens ontológicas que se preocupam em envolver significado e contexto em torno de conteúdo, como termos científicos, e pular palavras comuns que compreendem 90% de todo o conteúdo ", disseram os autores da Ovum.

No entanto, a busca semântica ainda está repleta de" muita propaganda teórica, mas pouca substância real ou prova de que funciona melhor do que a tecnologia de pesquisa atual.

"As redes semânticas são difíceis de construir e nem todas são iguais. É improvável que as tecnologias semânticas sejam capazes de fornecer 100 por cento de precisão em suas análises e resultados. Além disso, ainda há pontos de interrogação sobre problemas de desempenho potencialmente complicados com pesquisas semânticas que consomem mais ciclos de processamento. "