Vad orsakade driftstörningen i våra system?

15 augusti 2018

Under tisdagen den 14 augusti uppstod ett stort antal driftstörningar i universitetets system och tjänster. Bland annat påverkades umu.se och intranätet, men även Ladok för hela Sverige slogs ut under dagen. Hur kunde detta ske?

Sent på måndagen den 13 augusti genomförde Akademiska Hus ett planerat strömavbrott i samband med ett elarbete. Ett fel i strömförsörjningsledet gjorde att den reservkraftförsörjning som normalt ska träda in inte kom igång vilket i sin tur slog ut den primära serverhallen i MIT-huset. Ovetande om detta allvarliga problem fortsatte strömavbrott och elarbetet i fler byggnader. I samband med det inträffade olyckligt ett annat fel som slog även ut den sekundära serverhallen i Förvaltningshuset. Detta medförde att servrarna slogs ut, system stängdes ner okontrollerat med driftsstörningar som följd för umu.se, intranätet, vissa inloggningar i andra system, Infocenters växel och det nationella Ladok som Umeå universitet ansvarar för.

Under tisdagen orsakade ett strömavbrott stora driftstörningar i universitetets system.

Foto: Per Melander

ITS arbetade intensivt från natten mot tisdag för att se över och starta om systemen i kontrollerade former. Vissa delar kunde startas redan under förmiddagen, men först sent på tisdagskvällen kunde ITS få igång i stort sett alla de över 1 000 servrarna och fler system och tjänster. Arbetet med övervakning av det hela samt igångsättning av system med kvarstående störningar fortsätter.

Förutom olägenheten för universitetets personal som är beroende av våra system medförde driftstörningen att flertalet nya studenter som inte kunde hitta sina välkomstbrev hörde av sig. Webbgruppen som arbetar för att genomföra lanseringen av vår nya webb som var planerad till 16 augusti tvingades dessutom avbryta sitt arbete. Webblanseringen kommer ändå att genomföras som planerat.

– Det är omfattande och komplexa system som är nödvändiga att ha men också gör oss sårbara. Störningar sker kontinuerligt men tas om hand utan att verksamhet drabbas. Men avbrott som detta ställer till det och tar tid att bena ut och åtgärda, säger Ali Foroutan Rad, chef för ITS, som beklagar de olägenheter dessa avbrott har medfört men är glad över att vi rätt snabbt är på banan igen.

Redaktör: Anna Lawrence

Logga in för att kommentera och läsa kommentarer.