Checksummer og kopier af elektroniske dokumenter

De fleste løfter et øjenbryn og tror ikke helt på det, når vi påstår, at det er ret almindeligt at 25% af alle dokumenter på en fællesdrev er ekstra kopier af dokumenter. Men det er nu ofte tilfældet, og vi er jævnligt mødt med ønsket om at kunne eliminere disse kopier nemt. I denne artikel fokuseres på checksummer som hjælpemiddel til at finde identificere kopier.

Forbedring af dårlige scanninger

Mange virksomheder var hurtige til at reagere og gå ind i den digitale tidsalder og skanne deres dokumentation for at have fordelene ved digitale versioner. Med nutidens øjne er mange af disse skannede dokumenter for ringe. Dokumentet kan være skannet med lav opløsning og teksten bliver derfor uskarp at læse, papiret kan have ligget lidt skævt eller der kan være kommet lidt skævt lys ind, som giver sorte skjolder osv. Og så kan man ofte ikke søge i dokumentet og dermed heller ikke søge det frem.

Kunstig intelligens og dokumenter – brugbart? betalbart?

Der er meget hype omkring kunstig intelligens og sci-fi-agtige fortællinger om, hvordan det vil ændre vores liv og hverdag. Men hvor er vi lige nu med udviklingen ifht. at kunne bruge kunstig intelligens til klassifikation af dokumenter – og kan det købes for rimelige penge?

Det korte svar er, at vi er så ganske bestemt i gang – og ja, noget er bestemt betaltbart. Det lidt længere svar følger herunder og der går en lille smule nørderi i den.

Dokumentformater og teknologi til konvertering

Kender du det?

  • Gamle oplysninger i gamle ulæselige formater
  • Skannede dokumenter, som ikke er søgbare, nussede, skæve og delvist ulæselige
  • Problemer med at den nyeste software ikke fungerer godt med de gamle dokumenter
  • Bøvl med at modtager af dokumenterne ikke kan læse dem – eller ser noget lidt andet
  • osv

Man kan faktisk gøre noget  ved det – automatisk. Der findes teknologier, som laver konvertering fra et format til et andet (på engelsk: “rendering”) – og de kan afhjælpe disse problemer mere eller mindre avanceret.