Der Gesprächspartner muss auf jede unserer Fragen antworten. Anschließend bekommt er seine Antworten vorgelegt und kann sie autorisieren.
Zum journalistischen Leitbild von t-online.Experte über weltweite IT-Panne "Das war ein menschlicher Fehler – ein gewaltiger"
Das Software-Update eines Sicherheitsunternehmens führt zu Ausfällen und Störungen auf Flughäfen, in Banken und Krankenhäusern. Wie kann das sein?
Weltweites Chaos: Millionen von Rechnern sind durch ein fehlerhaftes Update des Sicherheitsunternehmens Crowdstrike lahmgelegt. Die Firma wurde 2011 gegründet und hat sich auf die Erkennung, Untersuchung und Abwehr von Cyberbedrohungen bei großen Unternehmen und Organisationen spezialisiert. Das Kernprodukt von Crowdstrike überwacht und schützt Endgeräte wie PCs, Laptops oder mobile Geräte in Echtzeit vor Schadprogrammen und anderen Cyberbedrohungen.
Darüber hinaus berät Crowdstrike die Unternehmen bei der Entwicklung und Optimierung ihrer Cybersicherheitsstrategien. Dazu gehören Risikoanalysen und Schutzmaßnahmen: Wenn Unternehmen etwa Opfer von Cyberattacken werden, unterstützt Crowdstrike, die Vorfälle zu analysieren, einzudämmen und zu beheben.
Nach eigenen Angaben zählen rund 70 Prozent der 100 umsatzstärksten Unternehmen der Welt zu den Kunden von Crowdstrike, entsprechend groß ist das Ausmaß der Störung. Doch wie konnte ein einziger Fehler zu solch massiven weltweiten Ausfällen und Beeinträchtigungen führen? t-online hat darüber mit dem finnischen IT-Sicherheitsexperten Mikko Hyppönen gesprochen.
t-online: Herr Hyppönen, wie kann ein einziges Treiber-Update weltweit Chaos verursachen?
Mikko Hyppönen: Weil Crowdstrike so viele Kunden hat – sowohl im privaten Sektor als auch im öffentlichen. Das Problem ist, dass der Fehler nicht im Netzwerk oder in der Cloud liegt, sondern direkt auf dem Endgerät des Kunden. Es ist etwas ironisch, dass das System, das die Maschinen schützen und am Laufen halten soll, sie ausfallen lässt.
Zur Person
Mikko Hyppönen ist Leiter der Forschungsabteilung beim finnischen Sicherheitsanbieter WithSecure und ein weltweit anerkannter Experte für IT-Sicherheit. Seine Hintergrundberichte und Forschungsergebnisse erschienen in der "New York Times", bei "Wired" und "Scientific American", zudem lehrte er an den Universitäten Oxford, Stanford und Cambridge. Im Oktober 2021 veröffentlichte er sein erstes Buch "Was vernetzt ist, ist angreifbar: Wie Geheimdienste und Kriminelle uns im Netz infiltrieren".
Crowdstrike hat den Fehler nach eigener Aussage gefunden und behoben. Warum laufen die Systeme nicht schon wieder?
Wenn ein Server abstürzt, kann man einfach auf einen anderen Server wechseln. Hier reden wir aber von Millionen einzelner Computer, die betroffen sind – und das dauert. Außerdem ist hier ein Sicherheitsprogramm betroffen, das auf dem Gerät Administratorenrechte besitzt und tief ins System eingreifen kann. Das bedeutet, dass der Fehler den Rechner zum Abstürzen bringt, bevor er überhaupt richtig gestartet ist.
Gibt es für einen solchen Fall nicht eine Art Back-up, mit dem ich das alte System wiederherstellen kann?
Klar, aber auch dazu müssten Sie den Computer erst einmal hochfahren, damit Sie das Back-up aufspielen können. Vermutlich wird es langfristig eine Art Hack geben, um so etwas künftig zentral zu erledigen. Aktuell existiert eine solche Lösung aber nicht. Es wird also eine Weile dauern, bis die Probleme behoben sind.
Lässt sich ein solcher oder ähnlicher Vorfall künftig verhindern?
Hier hat jemand wirklich Mist gebaut. Ein solches Update wird mehrmals am Tag installiert – das machen wir bei unseren Kunden auch. Und da müssen wir einfach verdammt noch mal aufpassen, dass wir nichts falsch machen oder zum Absturz bringen. Diese Updates werden etliche Male getestet, auf verschiedenen Systemen, mit verschiedenen Sprachen, Windows-Versionen und in allerlei verschiedenen Kombinationen.
Der Crowdstrike-Fehler betrifft aber alle Systeme und nicht nur einzelne.
Ganz genau. Das spricht also dafür, dass das Update nicht richtig oder sogar gar nicht getestet wurde. Meine Vermutung ist, dass eine bestimmte Version getestet, am Ende aber versehentlich eine andere Version verschickt wurde. Ich denke, das war ein menschlicher Fehler – und zwar ein gewaltiger. Kann so etwas wieder passieren? Auf jeden Fall. Es ist aber höchst unwahrscheinlich, weil die Sicherheitsvorkehrungen sehr hoch sind. Und mir tun die Entwickler bei Crowdstrike leid, die werden heute einen ziemlich miesen Tag haben.
Verlassen wir uns vielleicht zu sehr auf die Technik?
Gegenfrage: Verlassen wir uns zu sehr auf Elektrizität? Seit 150 Jahren ist sie für uns extrem wichtig, um zu arbeiten. Bei Computern und Vernetzung ist es ähnlich. Jede gute und wichtige Erfindung ist eines Tages notwendig für uns. Natürlich ist die Abhängigkeit von der Technologie ein Nachteil, die moderne Welt würde ohne sie nicht funktionieren. Aus meiner Sicht überwiegen aber die Vorteile, außerdem gibt es ohnehin kein Zurück.
Welche Schlüsse können wir aus diesem Vorfall ziehen?
Eine wichtige Möglichkeit für Unternehmen wäre es, Updates nicht sofort zu installieren, sondern sie erst einmal einen Tag lang zu testen. Das ist aber natürlich auch mit einem gewissen Risiko verbunden: Wenn es zum Beispiel eine Cyberattacke gibt, ist dieses System dann möglicherweise nicht sofort geschützt. Auf der anderen Seite wäre man aber nicht betroffen, wenn es Fehler in einem Update gibt. Das muss jedes Unternehmen für sich abwägen – aber eine Testgruppe für Updates wäre aus meiner Sicht sinnvoll. Dadurch wäre das derzeitige Crowdstrike-Problem aufgefallen.
Vielen Dank für das Gespräch!
- Interview mit Mikko Hyppönen