KI und Ich

Ein Blog über KI, Auswirkungen und Experimente von Karlheinz Agsteiner

AGI, Kensington und die Politik

Ist es schon passiert? Ist AGI, oder besser "Super-Intelligenz" jetzt da, mit Claude Mythos / Fable? Zumindest in der Softwareentwicklung scheint es mir so. Und scheinbar nicht nur mir. Warum, fragst du?

Es begann ganz harmlos. Mit Kensington.

Kensington

Das Kensington-Board (aus der Wikipedia-Seite)

Kensington ist eine schön gemachte Variante von Mühle. Jeder Spieler hat 15 Steine, die abwechselnd erst auf Schnittpunkte der Linien gesetzt und dann entlang der Linien gezogen werden. Besetzt man ein Dreieck (kleine Mühle), darf man einen gegnerischen Stein irgendwoanders hin setzen, bei einem Viereck 2 Steine. Besetzt man ein Hexagon der eigenen oder neutralen Farbe, hat man gewonnen.

Das Spiel wurde 1979 erfunden und war kein besonders großer Erfolg. Es gibt eine englische Wikipedia-Seite, ein paar Spiele-geeks-Seiten, ein halb-fertiges Github-Repository. Wenn ein LLM eine Kensington-App bauen kann, dann durch eigenes "Denken", nicht durch Kopieren von Code, den es vorher gelernt hat.

Ausserdem ist das Kensington-Board brutal schwierig einem Rechner beizubringen. Für Software ist Schach oder go gut geeignet. Kann man auf zweidimensionale Arrays mappen, es ist einfach, über Koordinaten zu reden, "zieht eins vorwärts" hat eine einfach zu programmierende Bedeutung.

Nicht in Kensington - ich habe keine Ahnung, wie ich hier das Spielbrett bauen würde. Vermutlich so, wie das besagte Github-Repo - Kensington auf GitHub - umständlich alles aufzählen.

Ganz aufgeregt habe ich eine kleine Spec geschrieben - wirklich minimal: die Wikipedia-Seite und das Brett genannt, gesagt, ich will ein schönes UI und nur HTML/CSS/Javascript, und los gings.

Sauber gelöst

Claude hat etwa 20 Minuten nachgedacht, und dann diese schöne App gezaubert:

Screenshot des generierten Spiels

Abgesehen davon, dass ich mit langem Nachdenken als Anfänger die AI auf höchstem Level manchmal schlagen kann, und glaube, ein guter Spieler könnte hier zielgerichteter agieren, in jeder Hinsicht perfekt. UI sieht gut aus, viele Details, die ich nicht spezifiziert habe (undo, Spielregeln) sinnvoll, UI ist perfekt responsive und passt sich den Bildschirmdimensionen des Gerätes gut an - etwas, das ich früher den LLMs mit großer Mühe beibringen musste.

Hier auf meinem Handy:

Kensington auf einem Handy

Doch der Wahnsinn, warum ich darüber einen Blogeintrag schreiben muss, zeigt sich in der Erklärung, was es programmiert hat, und im Code.

Die Mysterien der Rhombitrihexagonalität

Anders als ich jämmerliches Menschenkind hat die AI nämlich nicht nur alles über Softwareentwicklung, sonder auch über jedes andere Thema im Internet gelesen, und verstanden, und kennt die Zusammenhänge.

Also auch z.B. Rhombitrihexagonal tiling auf Wikipedia - eine Seite über Rhombitrihexagonale Pflastermuster, und wie man sie mathematisch konstruiert. Kensington ist wohl ein solches Pflastermuster (was die Wikipedia-Seite kurz erwähnt).

Seine Gedankengänge dazu beschrieb Fable so:

"Visually the board is intricate, but combinatorially it's a clean piece of the 3.4.6.4 rhombitrihexagonal tiling. I verified against your Kensington_board.svg that the seven hexagons form a flower (centers at distance side·(1+√3)), so board.js generates the whole board mathematically: each hexagon gets a "rosette" of 6 edge-squares and 6 corner-triangles, and the union is deduplicated by coordinates."

Und dann hat es das auch gemacht. Ich habe mir das Coding angeschaut, und komme mir vor wie ein Junior Developer, der den Code eines alten Hasen anschaut, wie ein Student vor dem Beweis des Mathe-Professors. Ich kapiere nichts, bin aber beeindruckt von der Eleganz und Kürze der Lösung des Problems.

Hier ein Auszug:

Quelltext-Auszug

Und zack, weg war's

Tags drauf wieder mit Claude Code losgelegt, und als erstes dieses gelesen:

Anthropic-Mitteilung zu Fable und Mythos

Anthropic schreibt:
"The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees."

Harte Exportsanktion der Modelle für alle nicht-Amerikaner (der bewirkt, dass Anthropic komplett den Zugriff sperren musste). Ist das, wie der kalte AI-Krieg beginnt, primär zwischen China und den USA, aber mit allen anderen als Beifang?

Das ist schon bestürzend. Hier spielen die USA hart ihre Technologie-Dominanz aus, um sicher zu stellen, dass sie den AI-Wettlauf, der sich wohl den letzten Metern nähert, zu gewinnen. Vermutlich wird Anthropic, sich seines anstehenden Börsengangs bewusst, eine Passkontrolle implementieren, so das US-Amerikaner weiter Zugriff haben. Wir können gespannt sein, wie sich das weiter entwickelt.

Update: habe die gleiche Aufgabe Opus 4.8 (high) gegeben.

Opus hat viermal so lange gebraucht, einige Programmierfehler gemacht, die es in automatischen Tests gefunden und behoben hat. Im Ergebnis ist auch eine funktionierende Version mit ähnlich schönem UI aber viel schlechterer Engine - scheinbar ist die Stellungsanalyse viel weniger ausgefeilt als die von Fable entwickelte, so dass die AI nur mehr oder minder random Züge macht, bis Alpha-Beta den drohenden Untergang sieht. Und statt des unheimlich eleganten Algorithmus, um das Board aufzubauen, den Fable sich ausgedacht hat, hat Opus zwar clever aber doch das dumme Verfahren von Normalsterblichen angewandt, das Spielbrett geparst und alle Knoten und Kanten und deren Koordinaten und Verbindungen extrahiert. Wo Fable der Mathe-Prof ist, ist Opus ein normaler Entwickler.