Como funciona a desduplicação de dados?

Uma das grandes preocupações do setor de TI de uma empresa é o armazenamento da grande quantidade de dados que é gerada a todo instante. Gerenciar tanta informação demanda um grande investimento em servidores bem robustos, com bastante espaço em disco e alto poder de processamento. Porém, o uso de recursos computacionais pode ser otimizado com a desduplicação de dados.

Não sabe como funciona a desduplicação? Fique ligado nesse post e confira, vamos explicar de uma forma bem simples e didática, apesar de ser um recurso bastante técnico.

O que é a desduplicação de dados

A desduplicação é um processo usado para diminuir a quantidade de dados armazenada. Essa tecnologia permite substituir a manutenção de múltiplas cópias de um mesmo arquivo pelo armazenamento de apenas um, mas com múltiplas referências a ele.

Todas as alterações realizadas na cópia do arquivo relacionadas aos usuários, como permissões, segurança e regras de compartilhamento, são aplicadas apenas a essa cópia. O que segue sendo compartilhado é sempre o arquivo original, criado e enviado para os vários usuários que podem modificar suas versões conforme necessário, sem gerar novas cópias do arquivo por inteiro.

Desse modo, dados redundantes são evitados e temos uma redução do espaço em disco que eles ocupam.

Por exemplo: um funcionário de uma empresa criou uma planilha de custos com gráficos e imagens em um arquivo com 100 MB de dados. Em seguida, o enviou para dez colegas que o armazenaram em suas pastas no servidor. O resultado? Apenas um conteúdo passou a ocupar 1 GB de espaço em disco.

Isso impacta tanto no armazenamento dos arquivos para o trabalho, quanto para o backup de todas as cópias desses arquivos.

O que acontece quando os arquivos são alterados

Em um servidor configurado para realizar a desduplicação, quando um usuário altera o arquivo, uma cópia dessas modificações é salva na pasta que contém a versão que o usuário tem dele. Porém, apenas as alterações feitas (inclusão de textos, imagens, gráficos) são adicionadas.

Utilizando nosso exemplo, se na planilha de 100 MB foi incluída uma imagem de 3 MB na cópia mantida por um usuário e um gráfico de 2 MB na cópia usada por outro, apenas 5MB adicionais foram usados no disco.

O arquivo original continua tendo 100 MB, porém, uma referência a ele aponta para um arquivo de 102 MB e outra para um arquivo de 103 MB. Nesse caso, o armazenamento de disco é de 105 MB.

Caso não seja feita a desduplicação, duas cópias do arquivo serão mantidas. Assim, as mesmas duas alterações levam à utilização de 103 MB de dados na pasta de um usuário e de 102 MB na pasta de outro, ocupando, assim, 205MB, ou seja, aproximadamente 95% a mais de disco ocupado.

Esse percentual cresce exponencialmente em função da quantidade de usuários e da intensidade com que produzem e compartilham arquivos.

Quais as vantagens de desduplicação

A desduplicação de dados tem como principal vantagem uma significativa redução de espaço em disco utilizado. Consequentemente, a empresa passa a ter um custo reduzido em relação à aquisição de servidores ou contratações de armazenamento em nuvem, tanto para o armazenamento dos arquivos utilizados para a realização do backup destes.

Sem falar no tempo de realização do Backup e Restore de dados, que com a desduplicação, faz com que as janelas de backup e restore sejam reduzidas consideravelmente, aumentando a disponibilidade dos recursos de TI.

Dessa forma, a desduplicação de dados contribui para a eficiência e redução de custos do setor de TI. Esse processo mantém apenas uma cópia no servidor de um arquivo que foi criado e enviado para diversos colaboradores que, ao modificarem suas versões, não ocupam o disco com dados redundantes, apenas com os novos conteúdos.

Ficou alguma dúvida? Gostaria de mais informações sobre esse processo? Deixe um comentário abaixo!

O post Como funciona a desduplicação de dados? apareceu primeiro em Experiência Digital.

Compartilhe a postagem:

Posts relacionados

Assine nossa newsletter