Windows

Red Hat, Hortonworks prep OpenStack for Hadoop

Hortonworks & Red Hat: Bringing Hadoop innovation to data-driven enterprises

Hortonworks & Red Hat: Bringing Hadoop innovation to data-driven enterprises
Anonim

Combinando os mundos de big data e cloud computing, a Red Hat, a Hortonworks e a integradora do Hadoop Mirantis estão construindo um software em conjunto chamado Savanna, que facilitará a implantação do Apache Hadoop em um serviço de nuvem OpenStack.

O software "permitirá que o Hadoop aproveite a arquitetura de armazenamento scale-out que o OpenStack oferece", disse Adrian Ionel Mirantis CEO. "As empresas terão uma maneira muito mais fácil de implantar e usar o Hadoop em escala."

A Mirantis lançou o projeto no início deste mês, doando o código para a OpenStack Foundation. O OpenStack é uma coleção de software de código aberto projetado para oferecer serviços compartilhados de computação, armazenamento e rede sob demanda. E o Apache Hadoop é uma estrutura de processamento de dados para analisar grandes quantidades de dados em vários servidores em um cluster. Ambos os conjuntos de software estão sendo cada vez mais testados e implantados pelas organizações.

[Mais leitura: Os melhores serviços de streaming de TV]

"A nuvem oferece uma infra-estrutura econômica de baixo custo que se expande facilmente. E isso é algo que é É muito importante no mundo do Hadoop, pois muitos desses projetos estão se desenvolvendo rapidamente dentro das unidades de negócios, e eles não necessariamente falam com o pessoal de TI ", disse Shaun Connolly, vice-presidente de estratégia da Hortonworks. O Savanna funcionará com qualquer distribuição padrão do Hadoop, não apenas com a própria distribuição da Hortonworks.

O Savanna fornecerá uma maneira fácil de instalar um cluster do Hadoop em uma nuvem do OpenStack. Os administradores podem especificar a topologia do cluster, o número de nós, o hardware necessário e outros atributos. O projeto está preparando o Savanna para ser um elemento do pacote OpenStack, acessível por uma API (interface de programação de aplicativos) ou por uma GUI disponível para o painel OpenStack.

Com o tempo, o software oferecerá funcionalidades adicionais, como o auto -scaling, a capacidade de agendar quando uma implantação do Hadoop é executada e a capacidade de gerenciar vários clusters do Hadoop. O Savanna também poderá realocar a capacidade computacional não utilizada em uma grade do OpenStack para cargas de trabalho do Hadoop. E a Savanna fornecerá um ponto de integração para softwares de provisionamento e gerenciamento de terceiros do Hadoop, especialmente o Apache Ambari.

A equipe espera ter demonstrações do software pronto para o Hadoop Summit em junho.

Além de fornecer um potencial de tempo economizando ferramentas para administradores, a Savanna é notável por mostrar como as empresas estão se tornando mais dependentes de software de código aberto. "Estamos começando a ver grandes projetos como o Hadoop e o OpenStack para integrar, porque há essa enorme iniciativa na empresa para chegar a uma infraestrutura unificada de código aberto", disse Ionel.

Joab Jackson cobre software corporativo e quebra de tecnologia em geral notícias para O Serviço de Notícias IDG. Siga Joab no Twitter em @Joab_Jackson. O endereço de e-mail de Joab é [email protected]