Stromausfall bei LiveJournal

Nico —  15.01.2005

Wenn ich die Infos zum Stromausfall bei LiveJournal lese, dann wird mir schlecht. Bei über 100 Servern mal eben zu gucken, ob alles okay ist, das ist eine Sau-Arbeit.

Update #2, 10:11 pm: So far so good. Things are checking out, but we’re being paranoid. A few annoying issues, but nothing that’s not fixable. We’re going to be buying a bunch of rack-mount UPS units on Monday so this doesn’t happen again. In the past we’ve always trusted Internap’s insanely redundant power and UPS systems, but now that this has happened to us twice, we realize the first time wasn’t a total freak coincidence. C’est la vie.

Also unser Provider dachte auch immer, er hätte genügend USV rumstehen. Dann gab es einmal im gesamten Stadtteil für paar Stunden keinen Strom. Seitdem steht da ein schnuckeliges Diesel-Aggregat rum, man weiss ja nie.

7 responses to Stromausfall bei LiveJournal

  1. Ein Diesel-Aggregat ist zu wenig. In Zürich im TIX, dem grössten Internet Exchange Point der Schweiz, gingen mal alle Lichter aus, weil der Diesel nicht angesprungen ist. 3 Stunden wahren mehrere Stockwerke Server unten.

  2. Eine USV hat man in der Regel auch nicht, um den Betrieb bei Stromausfall aufrecht zu erhalten, sondern um das sichere herunterfahren der Server in einem solchen Fall zu garantieren. Sonst helfen wirklich nur Dieselaggregate.

  3. wir haben zur sicherheit noch ein trimmdichrad neben den servern stehen, da muss unser admin dann immer raddeln um den strom zu erzeugen…

  4. Auch Dieselaggregate helfen nicht gegen alles, da sie keine räumliche Redundanz schaffen.

  5. USV = unnötige Ivestition und Mehrarbeit.
    Eine USV hat wirklich nur den Sinn, die Rechner sauber runter zu fahren, statt plötzlich ohne Strom zu sein. Bis dieser Fall eintritt, sind die Akkus meistens schon platt, es sei denn man hat genug Manpower, um die Dinger regelmäßig zu überprüfen.
    Das Aggregat plus Pufferzellen im Keller sind die einzig wahre Alternative. Allerdings ist der Platzbedarf enorm.

  6. in unserem rechenzentrum haben wir das komplette spektrum, inkl. pufferzellen und wasweissichnochalles. nächstes mal mache ich bilder…

  7. Hrm, die USVen unserer Übertragungstechnik halten die Laser eine Stunde am Laufen. Sofern soll so eine USV, je nach Ausführung, nicht nur das runterfahren gewährleisten ;).

    Einer unserer Telefonswitche steht bei der HEW … Wenn dann aber einer mit der Leiter den, vorgeschriebenen, Notausschalter für die 48V Anlage von der Wand fegt hilft auch die redundante Anbindung an 2 Kraftwerke, mehrere Schiffsdiesel und riesige USVen nichts. *schepper* schon können 25.000 Kunden nicht telefonieren.

    Es gibt keine absolute Sicherheit ;)