Mythos

on Belgrad nach Neos Marmaras sind es zehn Stunden Fahrt.

Man überquert die serbische Grenze im Morgengrauen, durchquert Nordmazedonien, bevor die Hitze einsetzt, und betritt Griechenland irgendwo beim dritten Kaffee und dem zweiten Streit über die Playlist. Zehn Stunden mit zwei Kindern auf der Rückbank. Zehn Stunden Vorfreude.

Aber es gibt kaum eine bessere Belohnung für so eine Reise als den Moment, in dem man endlich ankommt. Das Auto parken. An den Tavernen vorbeigehen. Seinen Platz am Strand finden. Sich in den Stuhl unter dem Sonnenschirm fallen lassen. Und dann — das tiefe Blau der Ägäis, das sich vor einem erstreckt, unmöglich lebendig, und ein kaltes Mythos-Bier, das in der Hand beschlägt.

Falls du noch nie auf Halkidiki warst, solltest du das ändern. Und falls doch — dann weißt du es bereits. Dieser erste Schluck, mit den Füßen im Sand und der griechischen Sonne warm auf der Haut, ist eines der reinsten Gefühle, die ich kenne. Die Fahrt verschwindet. Die Welt vereinfacht sich. Du bist einfach da.

Ich mache diese Reise mit meiner Familie seit Jahren. Und bis vor Kurzem war der Deal einfach — sobald ich an diesem Strand ankam, war Arbeit vorbei. Erledigt. Nicht erreichbar. Das Telefon war für Fotos da und sonst nichts.

Das hat sich geändert.

Ein Telefon, ein Bier und eine Maschine in Belgrad

Diesen Sommer, wenn ich an diesem Strand in Neos Marmaras sitze, wird etwas anders sein.

In Belgrad wird ein Mac mini laufen. Immer eingeschaltet. Eingeloggt in meine Konten. Verbunden mit meinen Tools. Claude Code läuft darauf — der KI-Agent, der leise verändert hat, wie ich Software baue, Dokumente schreibe, Projekte manage und denke.

Ich nehme mein Telefon. Öffne eine Nachricht. Sage, was ich brauche. Und während ich ein weiteres Mythos bestelle und meinen Kindern zusehe, wie sie etwas Ambitioniertes aus Sand bauen, macht sich die Maschine in Belgrad an die Arbeit.

Kein Chatbot, der Fragen beantwortet. Ein Agent — der Dateien liest, Code schreibt, Befehle ausführt, Ergebnisse prüft, iteriert, bis die Arbeit erledigt ist. Features baut. Vorschläge entwirft. Daten verarbeitet. Echte, sinnvolle Arbeit erledigt, während ich 900 Kilometer entfernt bin, mit einem Bier in der einen Hand und dem Telefon in der anderen.

Vor sechs Monaten war das Science-Fiction. Heute ist es Infrastruktur, die ich bereits aufbaue. Und der Grund, warum ich jetzt darüber schreibe, ist, dass das, was als Nächstes kommt, alles bisher Beschriebene wie ein Aufwärmprogramm aussehen lassen wird.

Sein Name ist, wie es der Zufall will, ebenfalls Mythos.

Das Modell, das Anthropic gebaut hat, aber nicht herausrückt

Am 7. April kündigte Anthropic Claude Mythos Preview an — das leistungsfähigste KI-Modell, das je gebaut wurde.

Das ist keine Marketingsprache. Die Benchmarks sprechen für sich.

Mythos vs. Claude Opus 4.6

97,6%

USAMO 2026 (von 42,3%)

93,9%

SWE-bench Verified (von 80,8%)

100%

Cybench (erstes Modell überhaupt)

181

Firefox-Exploits (vs. 2)

Quellen: Anthropic System Card, METR

Bei USAMO 2026, einer Mathematik-Olympiade auf Wettbewerbsniveau, erreichte Mythos 97,6 Prozent. Der bisherige Spitzenreiter — Claude Opus 4.6, den ich seit Dezember täglich nutze — erreichte 42,3 Prozent. Das ist ein Sprung von 55 Punkten in einer einzigen Modellgeneration. Bei SWE-bench Verified, einem Maßstab für reale Softwareentwicklung, stieg der Wert von 80,8 auf 93,9 Prozent. Bei Cybench, einem Cybersecurity-Benchmark, erreichte Mythos 100 Prozent — als erstes Modell überhaupt.

Diese Zahlen erzwingen eine Frage, die ich in einem früheren Artikel aufgeworfen habe: Ist der Fortschritt, den wir sehen, linear oder exponentiell?

Die Antwort ist jetzt klar. Wenn ein Modell in einer Generation von 42 auf 97 Prozent bei einer Mathematik-Olympiade springt, ist das kein stetiger Anstieg. Das ist eine Stufenfunktion. Die Forschungsgruppe METR verfolgt das unabhängig: Die Fähigkeit von KI bei zeitintensiven Aufgaben verdoppelt sich alle fünf bis sieben Monate — und beschleunigt sich. Wir sind auf einer Kurve, und die Kurve biegt nach oben ab.

Aber das Bemerkenswerteste an Mythos sind nicht die Benchmarks. Sondern das, was Anthropic damit zu tun beschloss.

Sie haben es nicht veröffentlicht.

Projekt Glasswing

Hier ist der Grund.

Während der Tests entdeckte Mythos autonom Tausende von Zero-Day-Schwachstellen in allen großen Betriebssystemen und allen großen Webbrowsern.

Eine Zero-Day-Schwachstelle ist eine Sicherheitslücke, von der niemand weiß — nicht die Leute, die die Software gebaut haben, nicht die Leute, die sie nutzen, nicht die Sicherheitsteams, die bezahlt werden, sie zu schützen. Der Name kommt daher, dass die Verteidiger, sobald ein Angreifer die Lücke entdeckt, null Tage hatten, um sie zu beheben. Sie ist bereits ausnutzbar. Die Uhr startete bei null.

Das sind die gefährlichsten Bugs in Software — und die am schwersten zu findenden. Einige der besten Sicherheitsforscher der Welt verbringen ganze Karrieren damit, sie zu jagen. Mythos fand Tausende.

Einen 16 Jahre alten Bug in FFmpeg, der Videobibliothek, die auf Milliarden von Geräten läuft. Automatisierte Testtools hatten genau diesen Codepfad fünf Millionen Mal durchlaufen, ohne ihn zu finden. Mythos brauchte Stunden.

Einen 27 Jahre alten Bug im TCP-Stack von OpenBSD — einem der am besten gehärteten Betriebssysteme der Welt. Ein Angreifer konnte das System durch simples Verbinden zum Absturz bringen.

Einen 17 Jahre alten Bug im Netzwerk-Dateisystem von FreeBSD, der Root-Zugriff gewährte. Mythos hat ihn nicht nur gefunden, sondern autonom die gesamte Exploit-Kette gebaut. Sechs verkettete Anfragen. Ohne menschliche Anleitung.

Als Opus 4.6 gegen denselben Firefox-Schwachstellendatensatz getestet wurde, produzierte es 2 funktionierende Exploits. Mythos produzierte 181.

Anthropic betrachtete diese Ergebnisse und traf eine beispiellose Entscheidung in der KI-Geschichte: Sie gründeten Projekt Glasswing — ein Konsortium aus zwölf Gründungspartnern, darunter Amazon, Apple, Google, Microsoft, Nvidia und die Linux Foundation, plus über vierzig weitere Organisationen. Das Ziel: Mythos einsetzen, um die kritischsten Schwachstellen der Welt zu finden und zu patchen, bevor ein Modell dieser Leistungsfähigkeit öffentlich verfügbar wird.

Sie stellten 100 Millionen Dollar an Nutzungsguthaben und 4 Millionen Dollar an Spenden für Open-Source-Sicherheitsstiftungen bereit. Sie veröffentlichten kryptographische Nachweise der entdeckten Schwachstellen. Sie legten verantwortungsvolle Offenlegungsfristen fest.

“„Der große Fähigkeitszuwachs von Claude Mythos Preview hat uns zu der Entscheidung veranlasst, ihn nicht allgemein verfügbar zu machen."”
— Anthropic, Claude Mythos Preview System Card

Dies ist das erste Mal, dass ein führendes KI-Modell der Öffentlichkeit vorenthalten wurde — wegen dem, was es kann.

Was die Benchmarks wirklich für dich bedeuten

Lass mich die Zahlen in etwas Praktisches übersetzen.

Eine 13-Punkte-Verbesserung bei SWE-bench klingt isoliert betrachtet nicht dramatisch. Aber Zuverlässigkeitsverbesserungen über sequenzielle Schritte hinweg multiplizieren sich — sie addieren sich nicht. Wenn ein Modell von 80 auf 94 Prozent Genauigkeit bei einzelnen Codieraufgaben geht, steigt die Wahrscheinlichkeit, eine Aufgabe mit zehn Schritten fehlerfrei abzuschließen, von 10 auf 54 Prozent.

Wo Opus 4.6 mein Eingreifen vielleicht alle paar Minuten brauchte, könnte Mythos theoretisch stundenlang autonom arbeiten.

Das verändert die Gleichung für alle, nicht nur für Softwareentwickler. Denk an einen beliebigen komplexen, mehrstufigen Workflow — Finanzanalyse, Content-Produktion, Datenverarbeitung, Projektmanagement. Ein Modell, das zuverlässig genug ist, um Dutzende von Schritten ohne Fehler aneinanderzureihen, macht nicht einfach schneller, was du schon tust. Es erledigt Dinge, die du nie versucht hast, weil die Fehlerquote sie unpraktisch machte.

Das ist der wahre Unterschied zwischen linearer und exponentieller Verbesserung. Linear bedeutet: dieselben Aufgaben werden etwas schneller. Exponentiell bedeutet: völlig neue Kategorien von Aufgaben werden möglich.

Die Infrastruktur ist bereits da

Hier ist, was die meisten noch nicht bemerkt haben: Die Infrastruktur für die nächste Welle existiert bereits.

Im März lancierte Anthropic Dispatch — Aufgaben vom iPhone zuweisen, während Claude sie auf dem Desktop erledigt. Im selben Monat veröffentlichten sie Cowork mit Mac Computer Use — Claude kann jetzt Anwendungen öffnen, Browser bedienen, Tabellenkalkulationen ausfüllen, E-Mails schreiben. Alles, was du am Schreibtisch sitzend tun würdest.

Die Community hat den Rest erledigt. Mac minis als dedizierte KI-Server, die rund um die Uhr laufen. Claude Code im 24/7-Betrieb, per Telefon ferngesteuert. Die Leute bauen im Grunde einen digitalen Mitarbeiter — unermüdlich, immer verfügbar, tief integriert in ihre Tools und Konten.

Ich weiß das, weil ich einer von ihnen bin.

Seit Dezember, als Opus 4.6 und Claude Code grundlegend veränderten, wie ich arbeite, erweitere ich dieses Setup Stück für Stück. Was als Terminal in VS Code begann, ist zu einem Ökosystem gewachsen — MCP-Tools, verbunden mit E-Mail, Kalender, Dateisystemen, Browsern, Datenbanken. Eine Maschine, die nicht nur Fragen beantwortet, sondern handelt. Eine Maschine, mit der ich von überall aus kommunizieren kann, auch von einem Strand in Griechenland.

Und hier ist das Timing, das zählt: Am 4. April — drei Tage vor der Mythos-Ankündigung — kappte Anthropic den Abonnementzugang für Drittanbieter-Tools. Cline, Cursor, Windsurf — alle auf API-Preise umgestellt, 15- bis 30-mal teurer. Nur Anthropics eigene Tools — Claude Code, Dispatch, Cowork — behielten den erschwinglichen Pauschaltarif.

Die Botschaft ist klar. Anthropic baut nicht nur die leistungsfähigsten Modelle. Sie bauen den einzigen bezahlbaren Weg, sie zu nutzen. Und Claude Code ist das Gefäß.

Was kommt

Mythos ist noch nicht öffentlich verfügbar. Basierend auf den Glasswing-Offenlegungsfristen — neunzig Tage plus eine 45-Tage-Verlängerung ab dem 7. April — könnte eine Consumer-Version im Spätsommer oder Frühherbst erscheinen.

Wenn es soweit ist, hört der Mac mini in deinem Homeoffice auf, ein cleveres Setup zu sein, und wird zu einem echten Wettbewerbsvorteil. Die Aufgaben, die du von deinem Telefon aus delegierst, hören auf, einfache Erledigungen zu sein, und werden zu komplexen, mehrstündigen Projekten. Der Agent, der momentan alle paar Minuten deine Anleitung braucht, beginnt, stundenlang eigenständig zu arbeiten.

Im Dezember 2024 veränderte Claude Code, wie Entwickler Software schreiben. Das war die erste Welle. Die nächste Welle — Mythos-Klasse-Fähigkeiten, die auf Always-on-Agenten-Infrastruktur treffen — wird dieselbe Transformation auf alle ausweiten, die Wissensarbeit leisten.

Der Entwickler, der in VS Code mit Claude Code sitzt, wird erleben, wie seine KI von sehr gut zu außergewöhnlich wird. Die Führungskraft, die vom Telefon aus managt, wird ganze Workflows übergeben können — nicht nur Aufgaben, sondern Projekte, die Urteilsvermögen und mehrere Schritte erfordern — und fertige Arbeit zurückbekommen.

Und die Person am Strand von Halkidiki, Bier in der Hand, wird einen bedeutenden Teil ihres Geschäfts von der Sonnenliege aus führen können.

Ich habe vor, diese Person zu sein.

Fang jetzt an zu bauen

Hier ist mein ehrlicher Rat.

Warte nicht, bis Mythos verfügbar wird. Die Zeit zur Vorbereitung ist jetzt — nicht weil du etwas verpasst (wirst du nicht), sondern weil die Infrastruktur Zeit braucht, um gut aufgebaut zu werden. Ich habe Monate gebraucht, um von „Claude Code im Terminal" zu einem System zu kommen, das tatsächlich Teile meines Geschäfts autonom führt.

Bring Claude Code zum Laufen. Lerne, wie Dispatch funktioniert. Wenn du einen übrigen Mac mini hast — oder den Kauf rechtfertigen kannst — richte ihn als dedizierten Agenten-Server ein. Beginne, MCP-Integrationen zu bauen, die deine KI mit den Tools verbinden, die du tatsächlich nutzt. Fang mit kleinen Aufgaben an und erweitere, wenn das Vertrauen wächst.

Es geht nicht darum, dem neuesten Trend hinterherzulaufen. Es geht darum, ein Fundament zu bauen, das jedes Mal dramatisch leistungsfähiger wird, wenn ein besseres Modell erscheint. Und die Modelle erscheinen schnell.

Bei Orange Hill ist genau das die Art von Transformation, durch die wir Organisationen begleiten. Keine Folien darüber, was KI tun könnte. Funktionierende Setups, die beweisen, was sie bereits tut — und die für das skalieren, was kommt. Ich werde meine eigene Mac-mini-und-Claude-Code-Reise in den kommenden Wochen detailliert dokumentieren, einschließlich Kurse und Leitfäden, die auf Orange Hill veröffentlicht werden.

Denn die Skalierungskurve verlangsamt sich nicht. Sie biegt nach oben ab.

Und diesen Sommer, wenn ich zurück auf Halkidiki bin, mit einem Mythos in der einen Hand und dem Telefon in der anderen — plane ich, einen sehr fähigen Kollegen in Belgrad zu haben, der dafür sorgt, dass die Arbeit erledigt wird, während ich die Aussicht genieße.

Prost.

Mythos

Ein Telefon, ein Bier und eine Maschine in Belgrad

Das Modell, das Anthropic gebaut hat, aber nicht herausrückt

Mythos vs. Claude Opus 4.6

Projekt Glasswing

Was die Benchmarks wirklich für dich bedeuten

Die Infrastruktur ist bereits da

Was kommt

Fang jetzt an zu bauen

Hat sich's gelohnt?

Kommentare

Am Puls der Zeit

Verwandte Artikel

Der Mac mini in Belgrad hat einen Namen

Denken ohne Worte

Immer noch derselbe Witz