Whatsapp

SLURM-Um gerenciador de carga de trabalho projetado para clusters Linux de qualquer tamanho

Anonim

Slurm que significa (Simple Linux Utility For Resource Management)é um gerenciador de carga de trabalho e agendador de trabalhos excelente, poderoso, modular e de código aberto criado para clusters Linux de qualquer tamanho. O Slurm é um sistema de gerenciamento de cluster e agendamento de tarefas tolerante a falhas e altamente conectável com muitos plug-ins opcionais que você pode usar. Ele fornece gerenciamento de carga de trabalho em vários computadores e data centers poderosos em todo o mundo.

As principais funções do Slurm

Slurm tem três funções principais, em primeiro lugar, aloca acesso exclusivo e/ou não exclusivo a recursos para usuários que desejam fazer algum trabalho por um determinado período de tempo. Em seguida, o Slurm disponibiliza uma estrutura que ajuda a iniciar, executar e monitorar o trabalho em um conjunto de hosts alocados em um cluster e sua função final é controlar o uso de recursos gerenciando uma fila de trabalhos pendentes.

Recursos exclusivos do Slurm

Você pode encontrar muitos gerenciadores de carga de trabalho por aí, mas o Slurm tem muitos recursos exclusivos que o diferenciam de outros gerenciadores de carga de trabalho e esses recursos incluem:

Slurm Architecture

O sistema Slurm é baseado em um gerenciador centralizado, slurmctld que monitora diferentes recursos e trabalhos, podendo incluir um gerenciador de backup responsável para proteger o estado do sistema em caso de falha. Cada host no cluster tem um daemon slurmd que é comparado a um shell remoto e recebe o trabalho, executa-o, retorna o status e aguarda a execução de mais trabalho, o daemon também permite a comunicação tolerante a falhas na hierarquia de configuração do sistema. Há também um slurmdbd(daemon de banco de dados slurm) opcional usado para registrar informações contábeis de vários clusters gerenciados pelo Slurm em um único banco de dados. Você pode ler sobre a arquitetura completa em aqui

Abaixo está uma imagem mostrando os diferentes componentes do sistema Slurm

Slurm System Components

Uma imagem mostrando diferentes entidades do sistema Slurm

Slurm System Entities

Leia o cliente testimonials sobre Slurm. Você pode querer verificar e experimentar o gerenciamento de cluster Slurm e o sistema de agendamento de tarefas se estiver trabalhando em clusters Linux de qualquer tamanho. Para qualquer informação adicional, você pode deixar sua opinião sobre o Slurm aqui, deixando um comentário na seção de comentários abaixo.