Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?
Os usuários da plataforma de processamento de dados Hadoop agora têm mais duas ferramentas para ajudá-los a classificar suas montanhas de informações.
[Leitura adicional: Os melhores serviços de streaming de TV]
“Usar a pesquisa como interface de usuário para big data é muito interessante. A pesquisa é bem adequada para alavancar muitos tipos diferentes de informações, especialmente informações não estruturadas ”, disse Jack Norris, diretor de marketing da MapR. "Estamos vendo alguns aplicativos realmente interessantes com os mecanismos de pesquisa em seu núcleo, mesmo que um usuário típico não pense neles como um motor de busca."LucidWorks Search é a versão comercial do Apache Lucene / Solr de código aberto completo mecanismo de pesquisa de texto. Com a nova integração do MapR, o LucidWorks Search pode pesquisar dados no Hadoop File Systems (HDFS) ou em arquivos em outros sistemas de arquivos.
O LucidWorks Search oferece snapshots e espelhos para alta disponibilidade e elimina grande parte do trabalho necessário para instale o Lucene / Solr do zero. Ele também oferece suporte nativo para mais fontes de dados, uma interface gráfica de usuário e uma estrutura de segurança.
O mecanismo de pesquisa pode ser usado em um aplicativo Web dinâmico para recuperar rapidamente fotos, publicidade, recomendações de produtos e outras informações que podem ser usadas para preencher sites da Web em tempo real. “Esse não é um substituto de menor custo para data warehouses. Trata-se de alavancar novas fontes de dados e fazer algumas coisas que têm um impacto dramático nos negócios ”, disse Norris.
A MapR e a LucidWorks trabalham juntas no emparelhamento de suas tecnologias desde 2011, quando formaram um acordo de marketing conjunto. No início deste ano, eles lançaram um conector que facilita o uso do Lucene / Solr com a distribuição MapR Hadoop.
O LucidWords Search trabalha com a recém-lançada distribuição M7 do MapR, em formato beta. Além de suportar o LucidWorks Search, a edição M7 foi reprojetada para eliminar compactações ou verificações de consistência em segundo plano, acelerando o desempenho.
Também nesta semana, a Cloudera lançou a versão 1.0 do Cloudera Impala, um mecanismo de consulta compatível com SQL de código aberto. Hadoop. SQL é a linguagem de interface de banco de dados usada em sistemas de gerenciamento de banco de dados relacional (RDMS) e é bem conhecida pelos administradores de banco de dados.
O Impala foi projetado para executar consultas mais rapidamente que o Hadoop do Hadoop, porque não usa a estrutura MapReduce, que requer resultados da pesquisa sejam gravados no disco. Em vez disso, os usuários podem consultar dados armazenados no HDFS e no HBase diretamente. Os usuários podem consultar os dados de forma interativa ou por meio de processos em lote.
A Cloudera lançou uma versão desse mecanismo em outubro passado como um beta. Desde então, o software foi testado por empresas como a 37signals e a Expedia.
O Impala é o componente principal do pacote suplementar Cloudera Enterprise RTQ (Real-Time Query) para a plataforma Cloudera Hadoop. O Impala pode ser baixado sem custo.
Atualizado em 6 de maio para corrigir informações sobre a tecnologia Cloudera Impala.
A pesquisa ajudará a empresa a longo prazo também, disse ele. "Eu penso na pesquisa como uma das coisas que temos que fazer e decidir fazer para garantir que sobrevivamos a longo prazo", disse ele. As empresas que cortam pesquisas em face de pressões de curto prazo ou nunca iniciam pesquisas puras tendem a não durar muito tempo, disse ele. "Minha crença é que a empresa lutaria para sobreviver e prosperar se não tivéssemos investimento em pesquisa." Uma área específica de dese

A computação atualmente é controlada principalmente pelo teclado e mouse. "A realidade é que muitas pessoas no mundo não são realmente alfabetizadas em computação nesse sentido", disse Mundie.
Cloudera Intros Ferramentas de gerenciamento do Hadoop

A Cloudera está lançando um conjunto de aplicativos que facilitam o trabalho com a estrutura de processamento de dados do Hadoop.
Cloudera Preps Hadoop para o Enterprise

Cloudera expande seus pacotes comerciais do Hadoop.