Höhlenmensch-Start: AI-Blabla reduzieren, Tokens um 75% kürzen, mehr Genauigkeit

Einstiegsschwierigkeit | ca. 10 Minuten | Du lernst die komplette Installations- und Konfigurationsstrecke für caveman, verstehst die vier Kompressionsmodi Lite / Full / Ultra / Wenyan und holst aus jedem AI-Output-Token das Maximum heraus.

Projektvorstellung

caveman ist eine Output-Kompressions-Skill für einen KI-Coding-Assistenten, entwickelt von Julius Brussee; GitHub: JuliusBrussee/caveman.

Der Kern ist ganz simpel: Die Antworten der KI sollen nur die relevanten Teile enthalten. Bei gleicher technischer Präzision komprimierst du die Output-Tokens um etwa 75%. Eine Studie aus dem Jahr 2026 (arxiv:2604.00025) fand sogar: Wenn man großen Sprachmodellen mit schlichten, präzisen Vorgaben Grenzen setzt, steigt die Trefferquote in bestimmten Benchmarks um 26 Prozentpunkte – viel Text heißt nicht automatisch richtig.

caveman ist kein reines Spaßprojekt. Es ist mit vier Stufen der Kompressionsstärke eingebaut (Lite / Full / Ultra / Wenyan) plus drei Sub-Skills: caveman-commit (ultraknappe Commit-Nachrichten), caveman-review (Einzeilige Code-Reviews) und caveman-compress (Komprimieren von Merker-/Erinnerungsdateien). Unterstützt 40+ AI-Coding-Assistenten wie Claude Code, Codex, Cursor, Windsurf, Cline, Copilot, Gemini CLI und mehr.

Zielgruppe

Du nutzt täglich einen AI-Coding-Assistenten, um Probleme zu bearbeiten – aber du stößt ständig auf dasselbe: Antworten sind zu ausschweifend, die Kernaussage tritt nicht deutlich hervor, und am Ende musst du selbst erst den Inhalt herauskristallisieren. Schnellere Ergebnisse und weniger Kosten sind für dich Pflicht – du willst keine Token und Zeit mit nutzlosen Höflichkeitsfloskeln verschwenden.

Kernabhängigkeiten und Umgebung

Abhängigkeit	Beschreibung
AI-Coding-Assistent	Claude Code / Codex / Cursor / Gemini CLI etc., mindestens einer
Node.js	npx-Installation per `npx skills` erfordert es
Python 3.10+	caveman-compress benötigt ein Kompressionstool
Git	Plugin-Installation erfordert es

Vollständige Projektstruktur

my-project/
├── CLAUDE.md                    # Nach der Installation von caveman geschrieben, immer aktiv (Claude Code)
├── .caveman/                    # Status-Markierungsverzeichnis (wird automatisch erzeugt)
│   └── .caveman-active          # Aktiver Modus: full / lite / ultra / wenyan
├── .cursor/rules/caveman.mdc    # Cursor always-on Regel (automatisch generiert)
├── .windsurf/rules/caveman.md   # Windsurf always-on Regel (automatisch generiert)
├── .clinerules/caveman.md      # Cline Regel (automatisch generiert)
└── .github/copilot-instructions.md  # Copilot Regel (automatisch generiert)

Schritt-für-Schritt

Schritt 1 — caveman installieren

caveman unterstützt 40+ AI-Coding-Assistenten. Wähle je nach Plattform einen passenden Befehl:

Claude Code (empfohlen)

# Variante 1: Plugin-Marktplatz (am einfachsten)
claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman

# Variante 2: Script-Installation (ohne Plugin-System)
# macOS / Linux / WSL
bash <(curl -s https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.sh)

# Windows PowerShell
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/hooks/install.ps1 | iex

Codex (VS Code + Codex)

# macOS / Linux
# 1. Repo klonen → im Zielordner Codex öffnen → /plugins → nach "Caveman" suchen → Install

# Windows (zuerst symbolische Links aktivieren)
git config --global core.symlinks true
# Dann wie oben: klonen → VS Code → Codex Settings → Plugins → Caveman installieren

Gemini CLI

gemini extensions install https://github.com/JuliusBrussee/caveman

Cursor / Windsurf / Cline / Copilot

npx skills add JuliusBrussee/caveman -a cursor
npx skills add JuliusBrussee/caveman -a windsurf
npx skills add JuliusBrussee/caveman -a cline
npx skills add JuliusBrussee/caveman -a github-copilot

Andere Agents (opencode / Roo / Goose / Kiro etc. 40+ )

npx skills add JuliusBrussee/caveman    # automatische Erkennung
# oder explizit
npx skills add JuliusBrussee/caveman -a opencode
npx skills add JuliusBrussee/caveman -a roo

WARNING

npx skills add installiert nur die Skill-Datei selbst, aber nicht die always-on-Regeldatei des Agents. Deshalb müssen Cursor / Windsurf / Cline / Copilot nach der Installation in jeder Sitzung manuell aktiviert werden. Schritt 7 zeigt, wie man es auf always-on umstellt.

Schritt 2 — caveman-Modus aktivieren

Nach der Installation kannst du in jedem beliebigen Chat eine der folgenden Anweisungen eingeben, um caveman zu aktivieren:

/caveman          # Standard: Full-Modus
$caveman          # Codex verwendet $ statt /

Oder direkt per Sprechbefehl auslösen:

talk like caveman
caveman mode
less tokens please

TIP

In Claude Code / Gemini CLI / Codex triggert /caveman automatisch im Rahmen jedes neuen Chats den SessionStart Hook. Nach der Installation musst du es daher nicht jedes Mal manuell aktivieren. Cursor / Windsurf etc. benötigen die zusätzliche Konfiguration aus Schritt 7.

Schritt 3 — Kompressionsstufe wählen

caveman hat vier Stufen der Kompressionsstärke; schalte per Befehl um:

Stufe	Auslösebefehl	Besonderheit	Typische Einsatzfälle
Lite	`/caveman lite`	Entfernt Füllwörter, behält vollständige Syntax; professionell, aber knapp	Formelle Kommunikation, wenn Struktur erhalten bleiben muss
Full	`/caveman full`	Entfernt Artikel (a/an/the), erlaubt Zeilenumbrüche; kurze Wortersetzungen	Alltagsentwicklung (Standard)
Ultra	`/caveman ultra`	Maximale Kompression: abgekürzte Wörter, Kausalitätspfeile (→)	Schnelles Debugging, High-Pressure-Situationen
Wenyan	`/caveman wenyan`	Kompression im Wenyan-Stil (klassisch-chinesische Syntax)	Geekiges Feinschliff-Showcase, Entwickler:innen im Chinesischen

Vergleich für dieselbe React-Frage:

🗣️ Normale Antwort (69 Tokens):
"Your React component re-renders because you are creating a new object reference on each
render cycle. When you pass an inline object as a prop, React's shallow comparison sees
it as a different object every time, which triggers a re-render. I'd recommend using
useMemo to memoize the object."

🪶 Lite (39 Tokens):
"Your component re-renders because you create a new object reference each render.
Inline object props fail shallow comparison every time. Wrap it in useMemo."

🪨 Full (19 Tokens):
"New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo."

🔥 Ultra (15 Tokens):
"Inline obj prop → new ref → re-render. useMemo."

📜 Wenyan (11 Tokens):
"物出新參照，致重繪。useMemo Wrap之。"

caveman-Modus beenden:

stop caveman
normal mode

IMPORTANT

Inhalte in Codeblöcken werden nicht komprimiert. caveman komprimiert nur natürliche Sprachantworten; Code, Dateipfade, URLs und Befehle bleiben stets unverändert.

Schritt 4 — caveman-commit: ultraknappe Commit-Nachrichten

caveman-commit ist eine Sub-Skill, die speziell Commit Messages erzeugt. Das Format folgt Conventional Commits; das Subjekt bleibt stets unter 50 Zeichen:

/caveman-commit

Beispielausgabe:

# Commit eines normalen Claude (zu lang):
"Added user authentication functionality including JWT token generation and validation,
password hashing with bcrypt, and session management middleware. This improves security
by implementing proper authentication flows."

# Ergebnis von caveman-commit:
"feat(auth): JWT + bcrypt login, session middleware"

Subjekt-Format: type(scope): subject – immer max. 50 Zeichen, warum vor was.

Schritt 5 — caveman-review: Einzeilige Code-Reviews

caveman-review macht bei PRs oder Code-Snippets einen Einzeilen-Review im festen Format, ohne Gelaber:

/caveman-review

Kopiere deinen Diff oder Code ein – er gibt dir dann aus:

L42: 🔴 bug: user null. Add guard.
L58: 🟡 perf: N+1 query. Prefetch in ORM.
L71: 🟢 nit: unused import. Remove.

Du musst nicht mehr in PR-Kommentaren eine lange Passage lesen wie: „Ich glaube, hier könnte man etwas verbessern“ – stattdessen wird dir direkt gesagt, was an welcher Zeile falsch ist und wie du es behebst.

Format: L<Zeilennummer>: <🔴🟡🟢> <Problemtyp>: <Beschreibung>. <Vorschlag zur Reparatur>.

Schritt 6 — caveman-compress: Komprimieren von Projekt-Erinnerungsdateien

Das ist eine der praktischsten Sub-Skills von caveman. Deine CLAUDE.md wird in jeder Sitzung von der KI gelesen – wenn dort viele menschenfreundliche, ausführliche Erklärungen stehen, verschwenden jedes Mal Token allein fürs Lesen. caveman-compress komprimiert diese Erinnerungsdateien in eine Form, die von KI effizient verarbeitet werden kann, und behält gleichzeitig ein Original-Backup für dich zum Bearbeiten.

/caveman:compress CLAUDE.md

Nach dem Lauf:

CLAUDE.md          ← komprimierte Version (wird von Claude jedes Mal gelesen)
CLAUDE.original.md ← Original-Backup (bearbeitest du dieses; Kompression ist einseitig)

Gemessene Kompressionswirkung:

Datei	Original-Tokens	Nach Kompression	Ersparnis
claude-md-preferences.md	706	285	59,6%
project-notes.md	1145	535	53,3%
claude-md-project.md	1122	636	43,3%
todo-list.md	627	388	38,1%
mixed-with-code.md	888	560	36,9%
Durchschnitt	898	481	46%

TIP

caveman-compress komprimiert nur Prosa (natürliche Sprachabsätze). Codeblöcke, URLs, Dateipfade, Befehle, Überschriften und Datumsangaben, Versionsnummern bleiben komplett erhalten und werden nicht versehentlich „falsch“ komprimiert.

Schritt 7 — Always-On Konfiguration

Claude Code / Gemini CLI: Nach der Installation ist always-on automatisch aktiv, keine zusätzliche Konfiguration nötig.

Cursor / Windsurf / Copilot etc., installiert mit npx skills add: Du musst manuell noch einen Snippet ergänzen, damit es dauerhaft aktiv bleibt. Schreib deine bevorzugte Stufe in die Regeldatei des Agents:

Terse like caveman. Technical substance exact. Only fluff die.
Drop: articles, filler (just/really/basically), pleasantries, hedging.
Fragments OK. Short synonyms. Code unchanged.
Pattern: [thing] [action] [reason]. [next step].
ACTIVE EVERY RESPONSE. No revert after many turns.
Code/commits/PRs: normal. Off: "stop caveman" / "normal mode".

Platzierung je Agent:

Agent	Dateipfad
Cursor	`.cursor/rules/caveman.mdc`
Windsurf	`.windsurf/rules/caveman.md`
Copilot	`.github/copilot-instructions.md` oder eigene Anweisungen
opencode	`.config/opencode/AGENTS.md`
Roo	`.roo/rules/caveman.md`

Schritt 8 — Deinstallieren / Zurücksetzen auf Standard

# Claude Code Plugin deinstallieren
claude plugin uninstall caveman

# Standalone Hooks deinstallieren
bash hooks/uninstall.sh           # macOS / Linux
powershell -File hooks\uninstall.ps1  # Windows

# npx skills deinstallieren
npx skills remove caveman

# Gemini CLI deinstallieren
gemini extensions uninstall caveman

Nach der Deinstallation müssen das Verzeichnis .caveman/ (Status) und die Regeldateien ggf. manuell bereinigt werden (falls vorhanden).

Häufige Probleme beheben

1. Plugin installiert, aber caveman wird nicht automatisch aktiviert

Claude Code nutzt dafür den SessionStart Hook. Prüfe, ob der Hook korrekt eingetragen wurde:

# Prüfe, ob in ~/.claude/settings.json SessionStart-Hook vorhanden ist
cat ~/.claude/settings.json | grep -i "SessionStart"

# Oder einmal neu installieren
claude plugin uninstall caveman
claude plugin install caveman@caveman

2. Cursor / Windsurf always-on funktioniert nicht

npx skills add schreibt nicht automatisch always-on-Regeln ein. Füge den Snippet aus Schritt 7 manuell zur jeweiligen Regeldatei hinzu. Speichern und danach den Agent neu laden.

3. Wenyan-Modus: Output ist nur Kauderwelsch oder Fragezeichen

Stelle sicher, dass sowohl Terminal als auch Editor UTF-8 unterstützen. Auf Windows kann die Standardkodierung in PowerShell Probleme machen:

chcp 65001
$env:LESSCHARSET=utf-8

Bestätige in VS Code in der Statusleiste unten, dass die Zeichenkodierung auf UTF-8 steht.

4. caveman-compress komprimiert auch Codeblöcke

Das ist nicht möglich – Codeblöcke, URLs, Dateipfade und Befehle sind ausgeschlossen und nehmen nicht an der Kompression teil. Wenn du dennoch Anomalien siehst, liegt es meistens an Problemen im Dateiformat (z. B. fehlende Codeblock-Markierung ```). Du kannst dann manuell mit CLAUDE.original.md abgleichen und wiederherstellen.

5. Der Befehl /caveman reagiert nicht

Möglicherweise blockiert eine andere Skill den Slash-Befehl. Probiere in Claude Code testweise die Sprachaktivierung: „talk like caveman“. Wenn es immer noch nicht klappt, prüfe, ob es eine Namenskonkurrenz bei Skills gibt.

6. Wenn mehrere Agents laufen: caveman funktioniert in einem Agent nicht

Die Konfiguration von caveman ist pro Agent unabhängig und beeinflusst sich nicht gegenseitig. Wenn es in einem Agent nicht greift, prüfe, ob in dessen Regelordner caveman-relevante Dateien vorhanden sind.

Weiterführendes Lesen / Erweiterte Richtung

1. caveman Triple-Arm-Auswertung: Wie stellt man Ehrlichkeit der Daten sicher

Die meisten Evaluierungen von „Kompressionstechniken“ vergleichen nur Skill-Responses mit normalen Responses – das ist nicht fair, weil Terseness (Knappe Form) die Qualität an sich bereits verbessern kann. caveman nutzt einen Triple-Arm-Ansatz: _baseline_ (ohne System-Prompt), _terse_ (nur „Answer concisely“), <skill> (caveman mit vollständigen Regeln). Die echte Ersparnis ist die Differenz zwischen skill vs terse, nicht zwischen skill vs baseline. Dieses Vorgehen lohnt sich als Methodik in jeder Evaluation von AI-Hilfswerkzeugen.

2. Interpretation echter Benchmark-Daten

In Tests mit 10 Aufgaben sank die durchschnittliche Output-Token-Zahl von 1214 auf 294 – 65% Ersparnis. Die Spanne reicht von 22% (git rebase vs merge, weil die Erklärung selbst schon lang ist) bis 87% (React-Fehler-Grenzfälle: Standardantworten werden massiv überdehnt). Je leichter „Over-Explaining“ ist, desto mehr spart caveman.

3. Cavekit: ein Spezifikations-getriebenes Toolchain-Setup vom selben Autor

JuliusBrussee/cavekit ist ein passendes Projekt: Mit der caveman-Sprache Spezifikationen schreiben → parallel zu Claude bauen → lauffähige Software ausgeben. Wenn du caveman nutzt, um die Output-Effizienz zu erhöhen, kann cavekit auch an der Eingabeseite Ähnliches leisten.

4. Eigene Kompressionsstufen definieren

In skills/caveman/SKILL.md sind alle Stufenregeln definiert. Du kannst eine Kopie erstellen, die Abkürzungs-/Wortersetzungs-Liste anpassen oder beibehalten und die Kausalitäts-/Symbolregeln übernehmen oder ändern – so baust du deine eigenen Stufen. Zum Beispiel: Team-interne Terminologie als Kürzel ergänzen oder festlegen, dass bestimmte Fachbegriffe nicht ersetzt werden dürfen.

5. Sprachübergreifende Eignung von Wenyan-Kompression

Der Grundgedanke von Wenyan-Modus ist: die knappste schriftliche Sprache aus der Menschheitsgeschichte + extrem niedrige Token-Dichte pro Zeichen. In englischem Textmaterial komprimiert wenyan-full weiterhin etwa 40–60%, weil die klassischen chinesischen Konstruktionen („Subjekt weggelassen + Verb-Objekt-Inversion“) innerhalb eines einzelnen Sprachraums auch ohne große Änderungen wirken. Es passt vor allem zu Szenarien, in denen maximale Kompression nötig ist und du bereit bist, dich an spezielle Syntax anzupassen.