Om te beginnen ja het kan, maar het werkt niet voor alles. Data deduplication is nog een reden om de overstap te maken naar Windows Server 2012 of Windows Server 2012r2. Zoals misschien bekend wordt data opgeslagen in segmenten, verspreid over de harde schijf en tegenwoordig is het geen lineaire groei meer. Veel bedrijven merken dat de groei van digitale data nagenoeg exponentieel is en de maximale capaciteit steeds sneller bereikt wordt. Uiteraard gebruikt men quota’s, maar uitbreiden van de opslag capaciteit lijkt de enige optie. Data deduplication is een manier om op zeer eenvoudige wijze meer data op te slaan met dezelfde capaciteit zonder uit te breiden.

 
 
Wat is data deduplication?
Data deduplication vindt en verwijdert duplicatie van data zonder de integriteit en de bruikbaarheid aan te tasten. Het doel is om meer data op te slaan door de bestaande data te segmenteren, te identificeren en de duplicaten te verwijderen.
Hoe werkt het?
Data deduplication werkt op block niveau. Dit wil zeggen dat alle data in segmenten gedeeld wordt (32-128 KB) en deze met elkaar vergeleken worden. Als er duplicaten ontdekt worden, wordt 1 segment bewaard en de andere segmenten verwijderd. Dit werkt alleen voor bestanden groter dan 32 KB aangezien dit de minimum grootte is van een segment.
Op het moment dat de data gebruikt moet worden, worden de segmenten die "missen” geheel transparant toegevoegd aan de datastroom. Voor de eindgebruiker verandert er eigenlijk niets. De bestanden staan nog steeds op dezelfde plaats, zien er nog steeds het zelfde uit. Voor de systeembeheerder houdt het in dat er meer opgeslagen kan worden, zonder dat er nieuwe hardware aangeschaft moet worden.
De onderstaande afbeeldingen laten eenvoudig zien hoe het proces werkt en hoe achteraf de "missende delen” toegevoegd worden.
De segmenten A, B en C zijn hetzelfde in de 2 bestanden. De segmenten M, N, X, en Y zijn verschillend. Van de duplicaten wordt er maar 1 bewaard en met de unieke delen wordt verder niets gedaan.
Bestand 1 is nog steeds hetzelfde, maar bestand 2 bestaat eigenlijk alleen nog uit de segmenten X en Y. Als het bestand 2 opgevraagd wordt, worden de segmenten A, B en C (de duplicaten) toegevoegd in de datastroom zodat het weer 1 geheel wordt.
Volgens Microsoft kan het een besparing van maximaal 90% opleveren, afhankelijk van de data die op de harde schijven staat.
 
 
Vereisten
Een van de vereisten om data deduplication te gebruiken is dat op de server Windows Server 2012 of 2012 R2 geïnstalleerd is en het data volume hier ook aangesloten is. Met andere woorden, de fileserver moet geïnstalleerd zijn met Windows Server 2012 of 2012 R2.