Driftunderhåll väderstation
Idag fredag 1 april kommer uppdateringen av väderdata att störas då jag tyvärr måste ta ner servern för att den relativt nya SSD-disken fått massor med ”sektor-fel” och måste bytas ut innan allt rasar. Nu gör jag inte om misstaget och skippar RAID denna gång utan har två nya SSD-diskar klara som ska installeras som RAID-1 så operativsystem och databaser speglas och blir säkrare ifall liknande fel uppstår i framtiden.
Tyvärr tar det några timmar att installera om allt, men nya väderdata buffras och sparas i 42 timmar så förhoppningsvis förlorar jag inga aktuella data från väderstationen. För så lång tid ska det normalt inte behöva ta innan allt är uppe och fungerar igen!
Ingen aning om detta är vanligt eller inte, men av en tillfällighet så läste jag om en stor myndighet som också blev tvungen att göra samma sak pga sektor-fel på SSD:er. Måhända hanteras dessa sämre än gamla diskar. Skönt att du är proaktiv i alla fall och inte väntar ut crashen
Hej! Jag tänkte i min enfald att SSD-diskar skulle vara så pass mycket säkrare än gamla mekaniska diskar. Sedan är ju belastningen minimal på servern, bara en databasuppdatering var femte minut, annars händer inte mycket mer. Men nu har man lärt sig läxan och de gamla RAID- och SQL-kunskaperna kom väl till pass igen. Äldre data i databasfilen var nämligen korrupt på SQL-mastern på grund av fel på diskens sektorer men nya skrivs in okej. Som tur är hade jag både SQL-dumpar och att SQL-slaven ute på internet var helt felfri.
Så jag gjorde en ny dump från slaven och importerade den i mastern och sedan synkade om allt. Inga mätvärden, gamla eller nya förlorade! 🙂
Tur att man har för vana att köra smartctl och övervaka diskarnas status, det ligger i ryggmärgen på något sätt, även om man numera nästan bara arbetar på hobbynivå. Tack vare det såg jag vart det barkade innan ett totalras. Det hade inte varit kul!