Car-tech

O Amazon Web Services acomoda o armazenamento de big data

Big Data Analytics on Amazon Web Services (AWS)

Big Data Analytics on Amazon Web Services (AWS)
Anonim

De olho no crescente mercado de análise de big data, a Amazon Web Services (AWS) introduziu um pacote de armazenamento, chamado High Storage, que pode oferecer acesso rápido a grandes quantidades de dados. > High Storage, um pacote Amazon Elastic Compute Cloud (EC2), foi projetado para executar tarefas de análise intensivas de dados, como análise sísmica, processamento de logs e data warehousing, de acordo com a empresa. Ele é construído sobre uma arquitetura de sistema de arquivos paralela que permite que os dados sejam movidos e desligados de vários discos de uma só vez, acelerando os tempos de processamento.

"Instâncias dessa família fornecem densidade de armazenamento proporcionalmente maior por instância e são ideais para aplicativos que se beneficie do alto desempenho seqüencial de E / S em conjuntos de dados muito grandes ", afirma a AWS na literatura de marketing on-line deste serviço. A empresa está lançando o serviço como um complemento ao serviço Elastic MapReduce, que fornece uma plataforma para análise de big data do Hadoop. A própria AWS está usando as instâncias do High Storage para alimentar seu serviço de data warehouse Redshift.

[Mais leitura: Os melhores serviços de streaming de TV]

Uma instância da AWS é um conjunto de unidades de computação, memória, armazenamento e outros serviços configurados para as características de um determinado tipo de carga de trabalho. High Storage é o nono tipo de instância de computação que a AWS introduziu. Ele se junta a outros tipos instantâneos personalizados para cargas de trabalho específicas, como instâncias otimizadas para o uso de GPUs (unidades de processamento gráfico) ou para tarefas de HPC (computação de alto desempenho).

A instância de Alto Armazenamento oferece 35 unidades de computação EC2 (ECUs) de capacidade de computação e 117 GB de memória de trabalho. Até 48 TB de armazenamento é distribuído por 24 unidades de disco rígido de armazenamento anexado direto (DAS). A disseminação de dados em vários discos pode acelerar as transferências de dados, pois a velocidade de leitura e gravação de um único disco não é mais um gargalo. O sistema pode oferecer mais de 2,4 GB por segundo de desempenho sequencial de E / S.

Os clientes podem evocar instâncias do High Storage no AWS Management Console, nas linhas de comando do EC2 ou Elastic MapReduce ou no AWS SDK) ou bibliotecas de terceiros. A instância do High Storage está atualmente disponível na costa leste dos EUA e estará disponível em outras partes do mundo nos próximos meses. Instâncias de alta capacidade de armazenamento podem ser adquiridas em és sob demanda ou reservadas antecipadamente a custo reduzido.

Além de ajudar potenciais clientes preocupados com big data, a Amazon também ativou seu data pipeline para uso geral, que a empresa anunciou no mês passado

Joab Jackson cobre software empresarial e tecnologia geral de notícias de última hora para

O IDG News Service. Siga Joab no Twitter em @Joab_Jackson. O endereço de e-mail de Joab é [email protected]