Componentes

Base de dados analítica 'frontline' das actualizações de dados da Aster

038 - ProjetoGeral - REGISTAR NOVO UTILIZADOR NA BASE DE DADOS

038 - ProjetoGeral - REGISTAR NOVO UTILIZADOR NA BASE DE DADOS
Anonim

"Tradicionalmente, pensamos em data warehousing como uma tarefa de back-office", escreveu Mayank Bawa, CEO da Aster. postar terça-feira. "O data warehouse pode ser carregado em janelas de carregamento separadas; as cargas podem ser executadas com atraso (o efeito líquido é que os usuários comerciais receberão seus relatórios com atraso); carregamentos, backups e scale-up podem colocar os data warehouses offline - o que é OK desde essas tarefas podem ser executadas fora do horário comercial (noites / fins de semana). "

Mas os clientes da Aster, que incluem a Acono, uma rede de distribuição de publicidade na Internet," dependem de análise de dados para suas receitas ", disse Bawa. O nCluster 3.0 da Aster distribui cargas de trabalho em vários servidores e facilita a adição de mais máquinas para mais energia. O software também divide os vários componentes de uma carga de trabalho de análise de dados em partes distintas.

Uma camada de "carregador" lida com o carregamento de dados e a exportação para e de fontes externas; uma camada "worker" armazena dados em discos conectados localmente para consulta; e uma camada de nós "rainha" executa planejamento e processamento de consultas inteligentes.

Enquanto isso, os usuários trabalham com o cluster como se fosse uma entidade única.

A capacidade de dimensionar segmentos de maneira seletiva significa que os usuários podem adicionar recursos

Para esses recursos principais, a versão 3.0 adiciona várias funções para uso "sempre ativo", incluindo a capacidade de adicionar capacidade, reequilibrar dados e recuperar dados enquanto O sistema está vivo.

Aster também trabalhou para adicionar paralelização em todo o sistema, de acordo com um funcionário da empresa.

"Queremos construir sistemas que possam lidar com 10x, 100x mais dados do que qualquer outro sistema hoje. Mas isso é muito muitos dados para qualquer servidor de commodity único ", disse o CTO Tasso Argyros em um post no blog. "Por isso, colocamos muito esforço de P & D em paralelizar todas as funções do sistema - não apenas consultando, mas também carregando, exportando dados, fazendo backup e atualizando. Além disso, permitimos que nossos usuários escolham o quanto querem paralelizar todos Estas funções, sem ter que escalar todo o sistema. "

O lançamento também inclui suporte para MapReduce, uma técnica de programação originalmente desenvolvida pelo Google que torna mais fácil para os desenvolvedores escrever programas para analisar grandes conjuntos de dados. O concorrente da Aster, Greenplum, também anunciou recentemente o suporte do MapReduce.

Recursos adicionais incluem a capacidade de selecionar níveis de compressão de dados para tabelas individuais, uma ferramenta de atualização "de um clique"; e melhores recursos de segurança, como LDAP (Lightweight Directory Access Protocol) para autenticação e capacidade de gerenciar privilégios de usuário nos níveis de cluster, banco de dados e tabela.

Muitos dos clientes iniciais da Aster, que também incluem o MySpace, são focados na Web, disse Curt Monash, presidente da Monash Research.

"Uma tremenda fração do crescimento e da oportunidade no armazenamento de dados está em lidar com tipos relativamente novos de dados", disse ele. "Existem grandes armazéns de dados lidando com dados transacionais OLTP tradicionais, mas a Aster não é necessariamente um concorrente líder na análise disso. O ponto ideal na análise de grandes quantidades de dados são dados da Web e eventos de rede associados."

Monash citou Administração de processamento paralelo e suporte para o MapReduce como as principais forças do Aster: "O Aster é uma startup com um produto relativamente imaturo, mas eles estudaram muito como tornar o processamento paralelo fácil de administrar."

NCluster 3.0 é executado em servidores x86 padrão. O preço é baseado em quantos dados estão sendo gerenciados. A empresa disse anteriormente que os custos começam em US $ 100.000.