Ørjan Stenseng

I den fysiske verden er vi opptatt av å rydde etter oss, ser vi noen kaste søppel på fortauet, blir vi irritert. Men i den digitale verden ser vi ikke søppelet vi etterlater oss. Mørke Data er benevnelsen på informasjon som samles, lagres og organiseres, men som aldri brukes. I den fysiske verden kalles det hamstring. Mørke data, er digital hamstring som koster på mange måter.

Hvordan skapes mørke data?

Mørke data skapes ved neste alle digitale interaksjoner. Her en noen eksempler:

  • Kunde logger og web analyser: Hvert klikk og aktivitet lagres for fremtidige analyser som sjelden blir noe av.
  • IoT & strømmer av sensor data: Tusenvis av sensorer i smarte fabrikker eller byer strømmer data 24/7. Ofte blir bare 1% av dette brukt til analyse.
  • Duplikatfiler: Flere versjoner av samme presentasjon eller dokument lagret på tvers av forskjellige datasentre (som noen fortsatt kaller Sky)
  • Eldre kommunikasjon: Vedlegg i Slack, Teams eller gamle e-posttråder som aldri åpnes igjen.
  • Redundante, foreldede og trivielle (ROT) data: Duplikatfiler og tidligere ansattkontoer forblir aktive «bare i tilfelle».

Vi sletter aldri data

En bekymringsfull egenskap ved mørke data er dens omfang og varighet. Ifølge Veritas Global Databerg-rapporten er anslagsvis 52 % av alle data som organisasjoner har «mørke», og ytterligere 33 % er «ROT» (redundante, foreldede eller trivielle). Bare omtrent 15 % er identifisert som forretningskritiske.

Fordi skylagring historisk sett har vært billig, iverksetter selskaper sjelden sletteprotokoller. Disse dataene ligger i «kald lagring», hvor de fortsatt krever konstant strøm til servere og kjølesystemer. Og jevnlig må maskinvare og programvare oppgraderes for å fortsette lagringen.

Digital smog: CO2-sammenligningen

Data kan føles vektløs, men infrastrukturen for å lagre dem krever store mengder energi.

  • Strømforbruket: Datasentre står for omtrent 1 % til 2,5 % av de globale klimagassutslippene, et fotavtrykk som nå er på nivå med luftfartsindustrien.
  • Bilsammenligningen: Lagring av mørke data alene skaper anslagsvis 6,4 millioner tonn CO2 årlig. For å sette det i perspektiv tyder forskning fra Tessi og akademiske studier på at hvis veksten av ubrukte data fortsetter ukontrollert, kan utslippene fra mørke data skaleres til å matche effekten av 80 millioner fossildrevne biler som kjører i et helt år.

Nøkkelstatistikk: Digitalisering ble anslått å stå for 4 % av de globale klimagassutslippene allerede i 2020, og med økningen av AI-genererte data i 2026 er dette tallet under økende press. Som Jason Miklian sier i dette innlegget, er AI generert innhold en fare for demokratiet.

Hvorfor er det viktig?

Mørke data er ikke bare et miljøproblem, det er også en sikkerhetsrisiko. Hver gigabyte med mørke data er en «blindsone» der sensitiv informasjon – som PII (personlig identifiserbar informasjon) – være skjult og representere et sikkerhetsbrudd.

For å løse dette trenger vi «digital dekarbonisering». Som skrevet av eksperter ved Loughborough University, må bedrifter gå fra datahamstring til datahygiene. Å slette en gammel e-post eller tømme en overflødig skymappe er en liten, men nødvendig handling for å bevare miljøet. Og det er bra for lommeboken. Hvem vil betale for noe man ikke bruker?

Dokumentasjon og videre lesning