Standort: fm4.ORF.at / Meldung: " Götterdämmerung beim Cloud-Computing"

Erich Möchel

Netzpolitik, Datenschutz - und Spaß am Gerät.

28. 4. 2011 - 06:00

Götterdämmerung beim Cloud-Computing

Der Großausfall in der Amazon-Wolke sei nur die Spitze des Eisbergs an Problemen, die Cloud-Computing mit sich bringt, sagte Internetpionier Dave Farber zu ORF.at. Am Montag gab erneut ein Cloud-Anbieter das Geschäftsfeld auf.

"Seit Jahren warne ich in meinen Vorträgen, dass Cloud-Computing auf einer gefährlichen Vereinfachung beruht, die zwangsläufig zu Problemen führen muss. Meiner Ansicht nach sind die Probleme Amazons nur die Spitze eines Eisbergs, der in der näheren Zukunft echte Troubles bringen wird." So kommentierte Farber den Großausfall des Cloud-Computing-Systems von Amazon auf Anfrage von ORF.at.

Der Professor Emeritus für High Speed Networking an der Carnegie-Mellon-Universität und anderen akademischen Institutionen weiß, wovon er spricht. Mitte der 70er Jahre hatte ein Forscherteam um Farber an der University of California das erste hochverfügbare System für verteiltes Rechnen (Distributed Computing) zu entwickeln begonnen.

Die nebulöse Cloud: Die mittlerweile in der IT-Branche omnipräsente Wolke im schnellen Überblick von Conny Lee.

Web 2.0 ist down

Um nichts anderes handelt es sich bei allen Cloud-Computing-Systemen wie dem von Amazon, das in der vergangenen Woche in Teilen ausgefallen war. Genau genommen war nur ein kleines Segment des riesigen Systems in den USA betroffen, dafür waren die Folgen des Ausfalls dort umso nachhaltiger.

Bis zu 36 Stunden waren vor allem Web-2.0-Unternehmen wie Reddit und BigDoor unerreichbar, deren Geschäftsmodell auf ständiger Verfügbarkeit ihrer Services beruht. Daneben war eine Unzahl vorwiegend amerikanischer Start-up-Firmen von den Ausfällen betroffen, für die Cloud-Services vor allem in der Anfangsphase unerlässlich sind.

Start-ups, Hype und Wettbewerb

Gut ein Jahrzehnt nach dem Platzen der Dot.com-Blase zur Jahrtausendwende bläht sich eine weitere Blase gerade schillernd auf. Von Risikokapital befeuerte junge Unternehmen entwickeln gerade eine neue Generation von Webservices, der Wettbewerb dabei ist mörderisch - wie immer, wenn ein neuer Hype grassiert.

Eine eigene, verteilte Rechnerinfrastruktur aufzubauen ist nicht nur deutlich teurer als das Hosting bei Cloud-Anbietern wie Amazon, es dauert vor allem viel zu lange, so ein Service aus dem Boden zu stampfen, das weltweit binnen kürzester Zeit funktionieren soll.

Dave Farber wird gern als "Großvater des Netzes" bezeichnet, zumal er in den 1960er Jahren an der Entwicklung des ersten elektronischen Switches in den legendären Bell Labs beteiligt war. Später mischte Farber am Aufbau aller akademischen Vorläufernetze des Internets maßgeblich mit. Jon Postel , der mit Vint Cerf als einer der "Väter des Internets" bezeichnet wird, hatte seine Doktorarbeit 1974 bei Professor Farber absolviert.

"Gamification" over

Vom Ausfall bei Amazon war auch das erst Ende 2009 gegründete Unternehmen BigDoor betroffen, ein Dienstleister für Web-2.0-Unternehmen. BigDoor stattet bestehende Publikumswebsites mit "Gamification" aus, es integriert dort Spielelmente aller Art, die wiederum auf Rechnern von BigDoor laufen. Ist BigDoor nicht verfügbar, sind die entsprechenden Angebote dieser Kunden ebenfalls offline.

In den zehn Monaten, in denen die "Gamification"-Plattform online ist, gab es eine Milliarde Zugriffe darauf, schrieb der CEO von BigDoor, Keith Smith, vergangene Woche. Der dafür nötige Aufwand ist dementsprechend hoch: Alles in allem sind es gut 70 Server, die Datenbanken oder Applikationen hosten und rund um die Uhr verfügbar sein müssen. Ohne die Amazon-Webservices wäre das angesichts des kleinen Teams und begrenzter finanzieller Mittel in weniger als einem Jahr unmöglich zu schaffen gewesen, so Smith.

Abschuss durch Back-ups

Genau das aber ist die Crux dabei. Verteiltes Rechnen sei an sich eine gute Sache, außer es werde dabei zu wenig Wert auf Zuverlässigkeit und Sicherheit der Systeme gelegt, sagte Farber weiter, das hätten alle Erfahrungen mit Distributed Computing der vergangenen Jahrzehnte ausführlich gezeigt.

Im Fall von Amazon hatte sich am Donnerstag nach einem nicht näher erläuterten "Netzwerkzwischenfall" eines der größten Datencenter des Unternehmens verabschiedet, nicht ohne dabei auch andere Rechenzentren im Mitleidenschaft zu ziehen.

Amazons Wolke

Anders als für die reinen Cloud-Anbieter waren derartige Services für den führenden Einzelhändler Amazon von Anfang an ein Geschäft. Eine ohnehin vorhandene Infrastruktur, die auf die überbordende Belastung des Weihnachtsgeschäfts ausgelegt war, wurde im übrigen Jahr untervermietet. Im "Service Health Dashboard" von Amazon nehmen sich die Ausfälle von 21. bis 23. April als sechs rote Pünktchen in einem Meer grüner Punkte aus.

Erst wurde routinemäßig versucht, den Ausfall eines wichtigen Elements durch Back-ups wettzumachen, was einen Dominoeffekt zur Folge hatte. Immer mehr virtuelle Maschinen versuchten ebenfalls, Ad-hoc-Sicherheitskopien anzulegen, bis die Speicherkapazität des - unter Vollbetrieb stehenden - Rechenzentrums in Virginia erschöpft war. Ab dann ging nichts mehr, 36 Stunden lang.

"Alle Lehren großzügig ignoriert"

Aus Kostengründen hatten Reddit, BigDoor und zahllose andere Start-ups - so gut wie alle stammen aus den USA - darauf verzichtet, eine weiteres komplettes Abbild ihrer Unternehmens-IT in einem weiteren Datencenter anzulegen. Die Back-ups standen alle im selben Rechenzentrum, das durch zu viele parallele Back-ups vollständig abgeschossen worden war.

An Paradoxa, dass etwa die eigenen Sicherungsmaßnahmen letale Auswirkungen haben können, mangelt es in der Netzwerkerei leider überhaupt nicht. Das meinte Farber mit "gefährlichen Vereinfachungen", die komplexe, wechselseitige Vorgänge simplifiziert, aber eben falsch darstellen. "Cloud-Computing ist zwar ein Musterbeispiel eines verteilten Rechensystems - aber eines, das alle Lehren aus den Experimenten der Vergangenheit großzügig ignoriert", so Farber zu ORF.at.

Trivial, aber letal

Wem jemals der wohl häufigste und trivialste aller Back-Up-Fehler unterlaufen ist, nämlich die Daten in die "falsche Richtung" zu synchronisieren, weiß, von welchen Effekten hier die Rede ist. Statt eine Sicherungskopie anzufertigen, hat man die aktuellen mit alten Datensätzen überschrieben.

In Amazons Cloud war es bereits in der Vergangenheit immer wieder zu Problemen gekommen, doch konnten die Systeme stets verhältnismäßig rasch wiederhergestellt werden. Zumeist waren nämlich Großkunden betroffen, die ihre Daten in mindestens einem weiteren Rechenzentrum abgelegt hatten.

Im Wolkenkuckucksheim

Die Start-ups, die eben nicht über derartige Mittel verfügen, hatte der Ausfall hingegen kalt erwischt. Das Hauptproblem ist in den heutigen vernetzten Zeiten dabei längst nicht mehr, dass Datensätze unwiderruflich verloren gehen.

Die Daten selbst finden sich fast immer wieder, doch bis dahin steht das gesamte Unternehmen, denn die gesamte Firmen-IT befindet sich in einem fernen Datenwolkenkuckucksheim, das derzeit eben nicht erreichbar ist.

Start-up-Dämmerung

Der Markt für Cloud-Computing hatte am Montag noch einen weiteren schweren Dämpfer abgekriegt. Das erst im November 2010 bekanntgewordene und sofort heftig gehypte Start-up Cirtas kündigte fast alle seine Mitarbeiter. Im Jänner noch hatte eine Finanzierungsrunde 22,5 Millionen Dollar für die Firma eingebracht.

Bereits Anfang April hatte der Cloud-Anbieter Iron Mountain seine Wolkenspeicher schließen müssen, weitere zwei Mitbewerber waren noch 2010 eingegangen. Bei allen handelt es sich um Unternehmen, die sich ausschließlich über Cloud-Speicherservices finanzieren. Von dieser Sorte sind nur noch zwei der neuen, größeren Start-ups übrig geblieben, von denen eines ausgerechnet Nirvanix heißt.

In den 80er Jahren, als Farber seine Experimente mit verteiltem Rechnen durchführte, kursierte unter den akademischen Netzwerkern folgende Definition: "Distributed Computing ist ein System, an dem ich nicht arbeiten kann, weil ein Rechner, von dem ich noch nie etwas gehört habe, nicht funktioniert."