Uma das grandes preocupações do setor de TI de uma empresa é o armazenamento da grande quantidade de dados que é gerada a todo instante. Gerenciar tanta informação demanda um grande investimento em servidores bem robustos, com bastante espaço em disco e alto poder de processamento. Porém, o uso de recursos computacionais pode ser otimizado com a desduplicação de dados.
Não sabe como funciona a desduplicação? Fique ligado nesse post e confira, vamos explicar de uma forma bem simples e didática, apesar de ser um recurso bastante técnico.
O que é a desduplicação de dados
A desduplicação é um processo usado para diminuir a quantidade de dados armazenada. Essa tecnologia permite substituir a manutenção de múltiplas cópias de um mesmo arquivo pelo armazenamento de apenas um, mas com múltiplas referências a ele.
Todas as alterações realizadas na cópia do arquivo relacionadas aos usuários, como permissões, segurança e regras de compartilhamento, são aplicadas apenas a essa cópia. O que segue sendo compartilhado é sempre o arquivo original, criado e enviado para os vários usuários que podem modificar suas versões conforme necessário, sem gerar novas cópias do arquivo por inteiro.
Desse modo, dados redundantes são evitados e temos uma redução do espaço em disco que eles ocupam.
Por exemplo: um funcionário de uma empresa criou uma planilha de custos com gráficos e imagens em um arquivo com 100 MB de dados. Em seguida, o enviou para dez colegas que o armazenaram em suas pastas no servidor. O resultado? Apenas um conteúdo passou a ocupar 1 GB de espaço em disco.
Isso impacta tanto no armazenamento dos arquivos para o trabalho, quanto para o backup de todas as cópias desses arquivos.
O que acontece quando os arquivos são alterados
Em um servidor configurado para realizar a desduplicação, quando um usuário altera o arquivo, uma cópia dessas modificações é salva na pasta que contém a versão que o usuário tem dele. Porém, apenas as alterações feitas (inclusão de textos, imagens, gráficos) são adicionadas.
Utilizando nosso exemplo, se na planilha de 100 MB foi incluída uma imagem de 3 MB na cópia mantida por um usuário e um gráfico de 2 MB na cópia usada por outro, apenas 5MB adicionais foram usados no disco.
O arquivo original continua tendo 100 MB, porém, uma referência a ele aponta para um arquivo de 102 MB e outra para um arquivo de 103 MB. Nesse caso, o armazenamento de disco é de 105 MB.
Caso não seja feita a desduplicação, duas cópias do arquivo serão mantidas. Assim, as mesmas duas alterações levam à utilização de 103 MB de dados na pasta de um usuário e de 102 MB na pasta de outro, ocupando, assim, 205MB, ou seja, aproximadamente 95% a mais de disco ocupado.
Esse percentual cresce exponencialmente em função da quantidade de usuários e da intensidade com que produzem e compartilham arquivos.
Quais as vantagens de desduplicação
A desduplicação de dados tem como principal vantagem uma significativa redução de espaço em disco utilizado. Consequentemente, a empresa passa a ter um custo reduzido em relação à aquisição de servidores ou contratações de armazenamento em nuvem, tanto para o armazenamento dos arquivos utilizados para a realização do backup destes.
Sem falar no tempo de realização do Backup e Restore de dados, que com a desduplicação, faz com que as janelas de backup e restore sejam reduzidas consideravelmente, aumentando a disponibilidade dos recursos de TI.
Dessa forma, a desduplicação de dados contribui para a eficiência e redução de custos do setor de TI. Esse processo mantém apenas uma cópia no servidor de um arquivo que foi criado e enviado para diversos colaboradores que, ao modificarem suas versões, não ocupam o disco com dados redundantes, apenas com os novos conteúdos.
Ficou alguma dúvida? Gostaria de mais informações sobre esse processo? Deixe um comentário abaixo!
O post Como funciona a desduplicação de dados? apareceu primeiro em Experiência Digital.