Anthropic hat Anfang April 2026 ein Projekt vorgestellt, über das es sich lohnt nachzudenken. Weniger als Produkt, mehr als Realitätscheck für unsere Softwarequalität.
Was ist Glasswing?
Projekt Glasswing ist eine Initiative von Anthropic zusammen mit zwölf grossen Unternehmen: Apple, Microsoft, Google, AWS, Cisco, CrowdStrike, Nvidia, JPMorgan Chase, Broadcom, Palo Alto Networks und die Linux Foundation.
Im Kern geht es darum: Anthropic hat ein KI-Modell namens Claude Mythos Preview entwickelt. Eigentlich als nächste Stufe ihrer Coding-KI, nicht als Sicherheitstool. Aber beim Testen stellte sich heraus, dass das Modell nebenbei Sicherheitslücken findet. Massenhaft. Autonom. Besser als alles, was bisher existiert. Ein Nebenprodukt, das sich als Haupterkenntnis entpuppte.
Mythos Preview hat Tausende Zero-Day-Schwachstellen aufgespürt. In jedem grossen Betriebssystem, in jedem grossen Browser, in einer Reihe weiterer kritischer Software. Eine der gefundenen Lücken steckte 27 Jahre lang in OpenBSD. Eine andere überlebte 16 Jahre in FFmpeg. Automatisierte Tests hatten den betroffenen Code über fünf Millionen Mal durchlaufen. Fünf Millionen Mal, ohne den Fehler zu finden.
«Ich habe in zwei Wochen mehr Bugs gefunden als im Rest meines Lebens.»
Warum Anthropic das Modell nicht veröffentlicht
Mythos Preview ist nicht frei verfügbar. Bewusst nicht. Denn dasselbe Modell, das Schwachstellen findet, kann sie auch ausnutzen. Es kann Exploits schreiben, mehrere Lücken verketten und daraus funktionierende Angriffe bauen.
Anthropics Strategie heisst «Defender's Head Start»: Die Verteidiger bekommen das Werkzeug zuerst. Bevor es in die falschen Hände gerät. Anthropic stellt dafür bis zu 100 Millionen Dollar an Nutzungsguthaben bereit und spendet weitere 4 Millionen direkt an Open-Source-Sicherheitsorganisationen wie OpenSSF und die Apache Software Foundation.
Was das für Software-Qualität bedeutet
Und hier wird es für mich interessant. Seit Jahren predige ich, dass Qualität kein nachgelagerter Prozess sein darf. Dass Testing alleine nicht reicht. Dass wir aufhören müssen, Software zu reparieren, und anfangen müssen, sie ordentlich zu produzieren.
Glasswing zeigt, wo wir stehen: Ein KI-Modell findet in Wochen, was Jahrzehnte menschlicher Code-Reviews und Millionen automatisierter Testläufe übersehen haben. Das ist kein Vorwurf an die Entwickler. Viele dieser Projekte werden von kleinen Freiwilligen-Teams gepflegt, die mit begrenzten Mitteln Infrastruktur betreiben, auf der die halbe Welt läuft.
Aber es ist ein Weckruf.
Wenn dein Qualitätskonzept daraus besteht, am Ende ein paar Tests laufen zu lassen und zu hoffen, dass nichts durchrutscht: Du hast jetzt Zahlen, die zeigen, wie gut das funktioniert. Nämlich nicht.
Drei Dinge, die ich mitnehme
Erstens: Statische Analyse, Fuzzing und klassische Testverfahren haben Grenzen. Sie waren nie dafür gemacht, das zu leisten, was ein Modell wie Mythos Preview kann. Nämlich Code im Kontext zu verstehen und logische Fehler zu erkennen. Nicht nur syntaktische.
Zweitens: Die Asymmetrie zwischen Angriff und Verteidigung verschärft sich. Angreifer brauchen eine Lücke. Verteidiger müssen alle schliessen. KI-Werkzeuge können diese Asymmetrie verringern. Aber nur, wenn die richtigen Leute sie zuerst in die Hände bekommen.
Drittens: Qualität wird noch stärker zum Wettbewerbsvorteil. Wer heute in Qualitätsprozesse investiert, steht morgen besser da. Nicht nur in Tools, sondern in die Denkweise, in die Kultur, in die Methodik. Nicht weil es nett ist. Sondern weil die Angriffsfläche für Software, die schlampig gebaut wurde, exponentiell wächst.
Was heisst das konkret?
Glasswing wird nicht die letzte Initiative dieser Art sein. Die Richtung ist deutlich: KI wird immer besser darin, Software zu analysieren. Zum Schutz genauso wie zum Angriff. Wer seine Qualität im Griff hat, hat weniger Angriffsfläche. Wer Qualität als Kostenstelle betrachtet, wird die Rechnung später bezahlen.
Und «später» kommt schneller, als die meisten denken.