Get Started with Hadoop Using Cloudera Enterprise | Part 2
Cloudera revelou um novo conjunto de ferramentas de gerenciamento do Hadoop, chamado Cloudera Enterprise, que a empresa oferecerá por uma taxa de assinatura anual, anunciou na terça-feira. Também atualizou seu pacote de distribuição de código aberto do Hadoop.
Ambos os novos lançamentos, bem como várias novas parcerias com fornecedores de software de gerenciamento de dados, mostram a empresa se preparando para oferecer a tecnologia de banco de dados emergente - agora usada principalmente por gigantes da Web como Google e Yahoo - para o mercado corporativo como uma alternativa aos bancos de dados relacionais.
"Nossa aposta não é apenas as grandes empresas da Web, mas bancos, hospitais e seguradoras descobrirão que precisam analisar projetos complexos e estruturados". dados juntos, e Hadoop foi feito para isso ", disse o CEO da Cloudera, Mike Olson. "O Hadoop resolve um novo problema, de uma nova maneira."
Um de um número crescente de bancos de dados não SQL ou NoSQL, o Hadoop é baseado no Google MapReduce, uma estrutura para processar dados em paralelo em grandes números de computadores. nós. O Hadoop, agora sendo desenvolvido como um projeto de código aberto pela Apache Software Foundation, oferece uma alternativa aos bancos de dados relacionais tradicionais, pelo menos para casos de análise de grandes conjuntos de dados que mudam rapidamente.
Ele pode trabalhar com SQL e não O Cloudera está empacotando o Hadoop para organizações de nível médio, tanto com sua distribuição do Hadoop, quanto com o recém-lançado conjunto de ferramentas de gerenciamento. Ambos os pacotes devem permitir que organizações sem muita experiência técnica aprofundada no Hadoop executem o software, disse Olson. "Há esse mito de que o Hadoop é utilizável se você tiver dados escalonados pelo Google. Há muitos usuários que têm apenas alguns terabytes de dados que desejam analisar", disse Olson.
A distribuição de Cloudera para o Hadoop (CDH) é um pacote de software de código aberto pré-integrado construído em torno do Hadoop Common, anteriormente denominado Hadoop Core. O pacote inclui: Hive, que fornece uma infraestrutura de data warehouse; HBase, o banco de dados subjacente ao Hadoop; Pig, um compilador para programas de redução de mapas; Zookeper, um agendamento para a execução de aplicativos em vários servidores e o MapReduce.
Na versão 3 recém-lançada, o pacote inclui três programas que a empresa lançou como projetos de código aberto, sob a licença de código aberto Apache V2. Uma delas é o Flume, que pode ajudar no carregamento de dados no Hadoop. Outra novidade é o Oozie, que é um software de gerenciamento de fluxo de trabalho. O último é o código do Hadoop User Environment (HUE), que fornece uma interface de usuário para gerenciar o Hadoop.
"HUE permite que qualquer pessoa crie aplicativos voltados para analistas. Ele sabe como falar com os clusters do Hadoop", disse Olson.
O pacote Cloudera Enterprise aumenta a versão 3 do CDH com ferramentas de gerenciamento adicionais. Este novo software, que não é de código aberto, permite que os administradores controlem o gerenciamento de acesso através do uso do Lightweight Directory Access Protocol. Programas também são fornecidos para provisionar recursos, para fazer o monitoramento de configuração e desempenho.
Olson não discute quanto Cloudera fez com as taxas de assinatura e consultoria até agora, mas observa que no primeiro trimestre de 2010, a empresa fez o máximo o que ganhou até a metade de 2009. Entre diferentes indústrias, serviços financeiros, telecomunicações, varejo, governo e empresas de comércio na Web demonstraram interesse na tecnologia, disse Olson.
"As coisas que as empresas estão fazendo com o Hadoop variam. Em geral, essas pessoas estão pegando muitos dados de muitos lugares e precisam submetê-los a análises sofisticadas ", disse Olson. "Os serviços financeiros estão interessados em usar o Hadoop para detecção de fraudes. Nas telecomunicações, existe uma necessidade real de otimizar as redes e reduzir a rotatividade de clientes".
Além de oferecer esses pacotes, a Cloudera vem reunindo o suporte do Hadoop a provedores de BI (Business Intelligence) e software de gerenciamento de dados.
Olson planeja anunciar, durante sua palestra no Hadoop Summit 2010, em Santa Clara, Na Califórnia, na terça-feira, a MicroStrategy, fabricante de BI, dará suporte ao uso do Hadoop.
Outro novo parceiro é a Talend, fornecedora de software de integração de dados de código aberto. A empresa ampliou seu Talend Integration Suite para fazer interface com os bancos de dados do Hadoop. Seu conjunto permite que os administradores gerenciem e agreguem várias fontes de dados a partir de um único console. Com o Hadoop, o software "pode inserir ou recuperar dados nativamente e processar os dados dentro da arquitetura Hadoop", disse Yves de Montcheuil, vice-presidente de marketing da Talend.
Microstrategy e Talend se juntam a um número crescente de empresas que estão preparando o código aberto ou ferramentas de gerenciamento comercial para o Hadoop. Na semana passada, Cloudera e Quest embarcaram em um projeto para construir software que pudesse conectar o Hadoop com bancos de dados Oracle. Em maio, a empresa de inteligência comercial Pentaho anunciou que sua suíte de BI funcionaria com bancos de dados do Hadoop.
Em entrevista separada ao IDG News Service, o diretor de tecnologia do Yahoo Raymie Stata apontou que o Hadoop poderia reduzir a necessidade de construir supercomputadores. para analisar grandes conjuntos de dados. Tradicionalmente, grandes conjuntos de dados foram movidos do armazenamento para o supercomputador, que é um conjunto de servidores em pool, para ser analisado. Em contraste, o Hadoop move a computação analítica para onde os dados residem, eliminando a necessidade de uma máquina gigante de processamento de numeração. O Yahoo foi um dos primeiros principais colaboradores do Hadoop.
Além da oferta da Cloudera, o Hadoop também está sendo comercializado pela IBM, que recentemente começou a oferecer um conjunto de serviços analíticos que usam a tecnologia.
Notícias de última hora da tecnologia para
O Serviço de Notícias IDG. Siga Joab no Twitter em @Joab_Jackson. O endereço de e-mail de Joab é [email protected]
EMC eleva oferta para Data Domain para US $ 2,1 bilhão A EMC aumentou sua oferta para adquirir o Data Domain, de US $ 1,8 bilhão para US $ 2,1 bilhões de dólares em seu último esforço para empurrar a licitadora original… A EMC aumentou sua oferta para adquirir a Data Domain de US $ 1,8 bilhão para US $ 2,1 bilhões em seu último esforço para empurrar para o lado a NetApp.
Oferta em dinheiro é "claramente superior" à proposta de 1,9 bilhão de dólares da NetApp, que inclui ações e dinheiro, disse o CEO da EMC, Joe Tucci, em uma carta ao conselho da Data Domain divulgada publicamente pela EMC. Em comunicado divulgado na segunda-feira, o CEO da NetApp, Dan Warmenhoven, disse que o conselho da empresa "pesará cuidadosamente suas opções".
Cloudera Intros Ferramentas de gerenciamento do Hadoop
A Cloudera está lançando um conjunto de aplicativos que facilitam o trabalho com a estrutura de processamento de dados do Hadoop.
O Hadoop obtém mais pesquisas com o MapR, Cloudera libera
Os usuários da plataforma de processamento de dados Hadoop agora têm mais dois mecanismos de pesquisa para ajudá-los a classificar através de suas montanhas de informações.