Ein-Satz-Ăberblick: Willst du aus dem ChatGPT/Claude-Web heraus âausbrechenâ und das komplette KI-Workspace-Setup auf deinem eigenen Rechner betreiben? Dieser Artikel fĂŒhrt dich Schritt fĂŒr Schritt durch Odysseus â eine lokal-first, datenschutz-first Alternative, die ChatGPT selbst hostet.
ProjektĂŒberblick
Odysseus ist ein selbst gehostetes KI-Workspace (Self-hosted AI Workspace) des GitHub-Users pewdiepie-archdaemon, Open Source unter der MIT-Lizenz. Ziel ist es: Du sollst auf deinem eigenen Rechner die UI-Erfahrung von ChatGPT/Claude haben â aber alle Daten, alle GesprĂ€che und alle Tool-Aufrufe bleiben lokal.
Im Vergleich zu klassischen ChatGPT-Apps ist der Unterschied klar:
- Chat: Ăbernimm beliebige lokale oder entfernte Modelle (vLLM / llama.cpp / Ollama / OpenRouter / OpenAI / GitHub Copilot)
- Agent: Wirklich âhands-onâ â ein Agent, der mit MCP / Web / Dateien / Shell / Skills / Memory arbeiten kann (basierend auf opencode)
- Cookbook: Scannt automatisch die Hardware deines Systems, empfiehlt Modelle, die laufen können, und bietet âOne-Click Download + Service startenâ (basierend auf llmfit, VRAM-aware)
- Deep Research: Mehrstufige Recherche â abrufen + lesen + synthetisieren â mit Ausgabe als visueller Report (umgebaut aus Tongyi DeepResearch)
- Compare: Mehrere Modelle blind gegeneinander testen und das wirklich brauchbare, ohne Bias auswÀhlen
- Documents: Du schreibst Text, die KI unterstĂŒtzt daneben â nicht umgekehrt
- Memory / Skills: Langzeit-âErinnerungenâ + Skills-System â der Agent versteht dich mit der Zeit immer besser (ChromaDB + fastembed ONNX)
- Email: IMAP/SMTP Posteingang â KI ĂŒbernimmt Auto-Kategorisierung, Zusammenfassungen, EntwĂŒrfe fĂŒr Antworten und Spam-Abwehr
- Notes & Tasks / Calendar: Notizen + Tasks + Kalender, Sync via CalDAV mit Radicale / Nextcloud / Apple / Fastmail
- PWA-UnterstĂŒtzung: Zugriff vom Handy fĂŒhlt sich nicht schlechter an als am Desktop â und lĂ€sst sich aufs Homescreen âinstallierenâ
Kurz gesagt: Das ist kein Chat-Fenster, sondern eine komplette KI-Umgebung â alles auf deinem Rechner, keine Cloud.
Schwierigkeit / Dauer / Nutzen
- Schwierigkeit: âââ (mittel; du solltest Docker- und Python-Grundlagen kennen)
- Dauer: 30â45 Minuten (Docker-Pfad); 1 Stunde (native Installation + Anbindung an ein lokales Modell)
- Nutzen:
- Eine vollstÀndig funktionsfÀhige selbst gehostete KI-Workspace-Lösung aufsetzen
- Den typischen Architekturaufbau von âlocal-firstâ-KI verstehen (FastAPI + ChromaDB + SearXNG + ntfy)
- Ollama / vLLM / OpenAI-kompatible APIs in ein gemeinsames UI integrieren
- Verstehen, wie Cookbook Modelle automatisch auswĂ€hlt, GPU durchreicht und ein Memory-System bereitstellt â âLong-Tailâ-FĂ€higkeiten, die sich am Ende richtig gut anfĂŒhlen
Zielgruppen-Profil
- Wer nicht mehr fĂŒr ChatGPT Plus / Claude Pro zahlen will und KI-Daten lieber lokal hĂ€lt
- Wer Open-Source-Modelle auf NUCs/Workstations/Servern mit 8G/16G/24G VRAM laufen lassen möchte â aber ein einheitliches Interface haben will
- Full-Stack / Indie-Developer, die Chat / E-Mail / Kalender / Agent-Tasks in einem Panel bĂŒndeln wollen
- Interessierte DevOps-/Platform Engineers, die ein Engineering-Beispiel fĂŒr eine âProduction-gradeâ FastAPI-App sehen wollen
- Leute, die bereits fĂŒr Cloud-LLMs bezahlt haben und eine Lösung suchen, die weniger weh tut
Wenn du nur ein leichtgewichtiges Chat-UI suchst, ist Odysseus möglicherweise nicht das Richtige â es hat viele Funktionen und ist beim Einstieg etwas komplexer als Open WebUI, dafĂŒr bekommst du im Gegenzug das ganze Paket: E-Mail, Memory, Cookbook, Agent.
Core Dependencies und Umgebung
Minimalanforderungen:
| Projekt | Anforderungen |
|---|---|
| Python | 3.11+ |
| Speicher | 2 GB (nur Web UI) / 8 GB+ (lokales Modell betreiben) |
| Festplatte | 5 GB (System + Dependencies) / 50 GB+ (mehrere GGUF-Modelle) |
| Docker | 20.10+ (Empfehlung: Docker Compose v2) |
| Betriebssystem | Linux / macOS / Windows (inkl. WSL2) |
Optional / Erweiterungen:
| Projekt | Zweck |
|---|---|
| Ollama | Das einfachste lokale Modell (Windows-freundlich) |
| vLLM / llama.cpp | High-Performance Local Inference (benötigt NVIDIA/AMD GPU) |
| NVIDIA Container Toolkit | GPU in Docker nutzen |
| Git for Windows | Windows: Cookbook-Backend herunterladen/starten |
| Tailscale + mkcert | Sichere LAN-/HTTPS-Exponierung |
TIP
Willst du keine GPU-TĂŒftelei? Nimm Ollama + irgendeine OpenAI-kompatible API als zweite Schiene â in 5 Minuten einsatzbereit. GPU ist ein âBonusâ, keine âVoraussetzungâ.
VollstÀndiger Projekt-Tree
odysseus/
âââ app.py # FastAPI-Entry
âââ setup.py # Initialisierungs-Skript (admin / DB / Verzeichnisse anlegen)
âââ requirements.txt # Kern-Python-Dependencies
âââ requirements-optional.txt # optionale Dependencies (PDF/Office/Audio/STT)
âââ docker-compose.yml # Default-Orchestrierung (CPU)
âââ docker-compose.gpu-nvidia.yml # NVIDIA GPU Override
âââ docker-compose.gpu-amd.yml # AMD ROCm Override
âââ Dockerfile
âââ core/ # Infrastruktur-Schicht
â âââ auth.py # Authentifizierung / Session
â âââ database.py # SQLAlchemy Initialisierung
â âââ middleware.py
â âââ constants.py
â âââ atomic_io.py
âââ src/ # Business-Logik-Schicht
â âââ llm_core.py # LLM-Abstraktion
â âââ agent_loop.py # Agent-Loop
â âââ agent_tools.py # Agent-Toolset
â âââ chat_processor.py # Chat-Verarbeitung
â âââ cookbook_serve_lifecycle.py # Cookbook Modell-Service-Lifecycle
â âââ memory_vector.py # ChromaDB Langzeit-âMemoryâ
â âââ deep_research.py # Deep Research
â âââ ...
âââ routes/ # FastAPI Routes (40+ Module)
â âââ chat_routes.py
â âââ agent_routes.py
â âââ cookbook_routes.py # Modell-Empfehlung/Download
â âââ memory_routes.py
â âââ email_routes.py
â âââ calendar_routes.py
â âââ ...
âââ services/ # Hintergrund-Services
â âââ docs/ # Dokumentenverarbeitung
â âââ hwfit/ # Hardware-Scan (Cookbook)
â âââ memory/ # Memory-Service
â âââ research/ # Research-Service
â âââ search/ # Suche
â âââ stt/ tts/ # Speech-to-Text / Text-to-Speech
â âââ shell/ # Shell-Tools
âââ static/ # Frontend (index.html + JS/CSS)
âââ docs/ # Doku-Seite + Screenshots + Demo
âââ config/ # Config fĂŒr Subservices wie SearXNG
âââ companion/ # Desktop Companion (macOS)
âââ data/ # Benutzerdaten (gitignored, Laufzeit generiert)
âââ app.db # SQLite
âââ chroma/ # Vektorbibliothek
âââ uploads/
âââ personal_docs/
âââ huggingface/ # Modell-Cache
Im Verzeichnis musst du dich nur um app.py / docker-compose.yml / .env kĂŒmmern â der Rest wird von Docker fĂŒr dich erledigt.
Schritt-fĂŒr-Schritt
Schritt 1: Repository klonen
git clone https://github.com/pewdiepie-archdaemon/odysseus.git
cd odysseus
WARNING
Der dev-Branch im Repository ist aktuell, aber möglicherweise instabil. FĂŒr Produktion empfiehlt es sich, auf den main-Branch zu wechseln: git checkout main. Im Folgenden gehen wir einmal ĂŒber dev.
Schritt 2: .env vorbereiten (optional, aber empfohlen)
cp .env.example .env
Die minimal nutzbare .env sieht so aus:
# === LLM-Anbindung ===
LLM_HOST=localhost
# Wenn du Cloud-APIs nutzen willst, greife in dem Container ĂŒber host.docker.internal auf deinen lokalen Ollama zu
OLLAMA_BASE_URL=http://host.docker.internal:11434/v1
# === Ports und Bindings ===
APP_BIND=127.0.0.1
APP_PORT=7000
# === Sicherheit (kritisch!) ===
AUTH_ENABLED=true
LOCALHOST_BYPASS=false
SECURE_COOKIES=false # nur auf true stellen, wenn du HTTPS hinter einem Reverse Proxy nutzt
ODYSSEUS_ADMIN_USER=admin
# ODYSSEUS_ADMIN_PASSWORD= # wenn leer gelassen, wird beim ersten Start zufÀllig generiert und ausgegeben
# === Suche (SearXNG) ===
SEARXNG_INSTANCE=http://searxng:8080
TIP
Ollama ĂŒber mehrere Hosts ansprechen: Beim Start von Ollama muss es auf 0.0.0.0 lauschen, nicht auf Loopback:
OLLAMA_HOST=0.0.0.0:11434 ollama serve
Sonst blockiert Ollama in deinem Container den Zugriff auf host.docker.internal:11434.
Schritt 3: Ein-Klick-Start mit Docker (empfohlener Pfad)
docker compose up -d --build
Beim Build werden Basis-Images geholt + Python-Dependencies installiert, das dauert beim ersten Mal etwa 3â5 Minuten. Wenn du siehst, dass die vier Container odysseus / chromadb / searxng / ntfy alle healthy / running sind, ist es geschafft:
docker compose ps
Ăffne http://localhost:7000 â der erste Screen ist die Login-Seite. Das initiale Admin-Passwort steht in den Terminal-Logs:
docker compose logs --tail=200 odysseus | grep -i "temporary\|admin\|password"
Du solltest etwas Ăhnliches sehen:
[odysseus] Created admin user 'admin' with temporary password: aB3x-9pQz-2vRt
WARNING
Dieses temporĂ€re Passwort wird nur beim ersten Start genau einmal ausgegeben. Danach sofort einloggen und unter Settings â Account in dein eigenes Passwort Ă€ndern.
Schritt 4: PrĂŒfen, ob alle Services gesund sind
# 1. Container-Status
docker compose ps
# 2. Logs von Odysseus ansehen (Achtung: beim ersten Start kann das Laden von Modellen verzögert sein)
docker compose logs --tail=120 odysseus
# 3. Ob ChromaDB wirklich lÀuft (kein HTTP-Downgrade)
docker compose logs odysseus | grep -E "ChromaDB|MemoryVectorStore|DEGRADED"
Wenn du DEGRADED siehst, liegt es sehr wahrscheinlich an einem Konflikt zwischen chromadb-client und chromadb. Die Diagnose findest du spĂ€ter im Abschnitt âHĂ€ufige Problemeâ.
Schritt 5: Dein erstes Modell anbinden
Geh zu Settings â Models / Providers, wĂ€hle abhĂ€ngig von deinem Setup einen Pfad:
Pfad A: Ollama lÀuft bereits (am einfachsten)
Base URL: http://host.docker.internal:11434/v1
API Key: (leer lassen)
Model: qwen2.5:7b (oder jedes andere Modell, das du lokal hast)
Pfad B: Cookbook soll automatisch herunterladen + starten
Gehe in Cookbook: Es scannt deinen VRAM, empfiehlt laufbare Open-Source-Modelle und vergibt eine Bewertung (fit score). Klick auf âDownloadâ, dann zieht es das Modell via huggingface-cli nach ./data/huggingface/ und startet es anschlieĂend direkt mit llama.cpp / vLLM.
Pfad C: Cloud-API anbinden â genau darĂŒber reden wir heute
Die Provider-Konfiguration von Odysseus ist protokollgetrieben: Das heiĂt, jede Service-Implementierung, die korrekt auf v1/chat/completions oder v1/messages reagiert, kann direkt eingetragen werden â nicht nur OpenAI/Anthropic offiziell, sondern auch selbst gebaute Gateways oder Drittanbieter-Forwarder.
In meinem Setup lĂ€uft die âAlltags-Agentâ-Kategorie (Code ausfĂŒhren / lange Dokumente) ĂŒber Cloud-APIs â aus zwei GrĂŒnden:
- Ein 24G-Setup und quantisierte 70B ist lokal schon grenzwertig; zusĂ€tzlich mehrere Agent-Runden fĂŒhren in der Praxis hĂ€ufig zu OOM
- Claude/GPT-Modelle liegen bei komplexem Reasoning immer noch etwas vor Qwen2.5-Coder
Dann kommt aber das Problem â offizielle APIs sind teuer. Claude Opus: Eine Wochenrechnung knackt locker die 100-Dollar-Marke, das ist fĂŒr private Nutzung im Grunde nur âfĂŒr Anyscale arbeitenâ.
Meine Lösung: Defapi. Dort nutze ich einen Endpoint, der kompatibel zu v1/messages ist:
# Odysseus Settings â Custom Anthropic Provider
Base URL: https://api.defapi.org
API Key: sk-xxxxx # im Defapi-Backend holen
Model: anthropic/claude-sonnet-4.5 # oder haiku-4.5 / opus-4.6
Beispiel-Konfigurationen: Defapi Claude Sonnet 4.5 (fĂŒr Programmierung/Langdokumente als Hauptarbeit), Claude Haiku 4.5 (fĂŒr tĂ€gliche Agent-Aufrufe als bevorzugte, gĂŒnstigere Option).
In der Praxis: Bei gleicher GesprĂ€chs-/Task-Menge ist die monatliche Rechnung im Vergleich zu Anthropics offizieller API um mehr als die HĂ€lfte niedriger. Und gleichzeitig gibt es keine echte Abweichung bei ModellfĂ€higkeit, Agent-Tool-Calls oder Prompt-Formaten â denn das Ganze ist auf Protokollebene nur ein Proxy; das Modell selbst bleibt dasselbe. Dieses âprotokollgetriebeneâ Design passt perfekt zu Odysseus.
TIP
Mit Defapi ist auf der Odysseus-Seite kein Code nötig. Die Tool-Calls in agent_tools.py und das Context-Management bleiben komplett unangetastet. Du kannst sogar in den Settings unterschiedlich konfigurieren: FĂŒr âChatâ Sonnet, fĂŒr âDeep Researchâ Opus, fĂŒr âAgent Tasksâ Haiku â jeweils ein eigener Provider, jeweils getrennte Abrechnung.
Pfad D: GitHub Copilot / OpenRouter etc. anbinden
Auch diese sind OpenAI-protokollkompatibel. Base URL entsprechend: https://api.githubcopilot.com / https://openrouter.ai/api/v1 â ohne weitere AusfĂŒhrung.
Schritt 6: Erstes Chatten + erster Agent-Task
ZurĂŒck auf der Hauptseite: wĂ€hle ein Modell und wirf einen einfachen Prompt rein, um die Verbindung zu testen:
Stell dich mir in drei SĂ€tzen vor, und gib mir dann eine Checkliste zur Performance-Diagnose fĂŒr Linux, die ich heute nutzen kann.
Wenn das klappt, ist der LLM-Pfad durchgÀngig.
Als NĂ€chstes testen wir Agent Mode: Erstelle eine neue Session, schalte auf âAgentâ und gib ein:
Liste die Zeilenzahlen aller .py-Dateien im aktuellen Verzeichnis auf und sag mir, welche Datei am ehesten refaktoriert werden sollte.
Der Agent plant selbst:
- Rufe das
shell-Tool auf und fĂŒhrefind . -name "*.py" | xargs wc -laus - Entscheide nach dem Ergebnis
- Gib Empfehlungen
Das ist der grundlegende Unterschied zwischen einem lokal-first Agent und dem ChatGPT-Web: Er kann wirklich âzupackenâ, und deine Codes/Dateien/Terminal â er hat darauf Zugriff.
Schritt 7 (optional): GPU aktivieren
Dieser Schritt ist nur nötig, wenn du vLLM / SGLang / llama.cpp CUDA in der Art von âHeavyweightâ-lokalem Inference nutzen willst. Wenn du nur Ollama oder Cloud-APIs verwendest, ĂŒberspringe das.
NVIDIA:
# One-Click Diagnose
scripts/check-docker-gpu.sh
# NVIDIA Container Toolkit installieren (Ubuntu/Debian, braucht sudo)
scripts/check-docker-gpu.sh --install-nvidia-toolkit
# Nur nach erfolgreichem GPU-Passthrough Overlay aktivieren
scripts/check-docker-gpu.sh --enable-nvidia-overlay
# Verifizieren
docker compose exec odysseus nvidia-smi -L
In .env wird ergÀnzt:
COMPOSE_FILE=docker-compose.yml:docker/gpu.nvidia.yml
AMD ROCm:
scripts/check-docker-amd-gpu.sh
# schreibe die ausgegebene RENDER_GID in die .env
COMPOSE_FILE=docker-compose.yml:docker/gpu.amd.yml
RENDER_GID=989
WARNING
GPU Passthrough â llama.cpp CUDA installiert. nvidia-smi im Container kann die Karte sehen â das zeigt nur, dass die GerĂ€te durchgereicht werden. llama.cpp benötigt auĂerdem cudart und CUDA-Toolkit-Laufzeit â das ist ein Cookbook â Dependencies ânochmal neu installierenâ-Schritt, der nicht auf Docker-Ebene gelöst wird. Wenn du im Log Unable to find cudart library siehst, ist genau das der Grund.
Schritt 8 (optional): Playwright MCP aktivieren (Browser-Agent)
Odysseus bringt ein paar MCP-Server mit, aber der Browser-Server muss erst per npx geholt werden:
npx -y @playwright/mcp@latest --version
Starte den Odysseus-Container neu: Im Agent kannst du dann Browser-MCP nutzen (Screenshots, Navigation, Formulare ausfĂŒllen):
Ăffne https://news.ycombinator.com, hole die ersten 10 Titel und Links, und fasse sie zu 5 zentralen Themen zusammen.
Schritt 9 (optional): Unter Windows nativ laufen lassen
git clone https://github.com/pewdiepie-archdaemon/odysseus.git
cd odysseus
powershell -ExecutionPolicy Bypass -File .\launch-windows.ps1
Das Skript erstellt automatisch ein venv â installiert Dependencies â fĂŒhrt setup aus â startet uvicorn. Ăffne dann http://localhost:7000.
TIP
Windows unterstĂŒtzt kein lokales vLLM / SGLang. Wenn du lokal Modelle laufen lassen willst, installiere Ollama for Windows und trage in den Settings den Endpoint als http://localhost:11434/v1 ein. Wenn du Claude/GPT nutzen willst, aber keine lokale Inferenz, kannst du auch einfach eine beliebige OpenAI-kompatible Cloud-API verwenden.
Schritt 10 (optional): Auch vom Handy aus nutzen
Unter der Voraussetzung, dass Tailscale bereits verbunden ist:
ODYSSEUS_HOST=0.0.0.0 docker compose up -d
# oder in der .env eintragen
APP_BIND=0.0.0.0
Aber: Nacktes HTTP auf LAN / Tailscale auszusetzen ist nicht sicher â dringend empfohlen ist, HTTPS mit mkcert zu aktivieren:
mkcert -install
mkcert -cert-file cert.pem -key-file key.pem 100.x.y.z # deine Tailscale-IP
python -m uvicorn app:app --host 0.0.0.0 --port 7000 \
--ssl-certfile=cert.pem --ssl-keyfile=key.pem
Am Handy öffnest du https://<tailscale-ip>:7000. Dann PWA auf dem Homescreen installieren â das Erlebnis ist fast identisch mit einer nativen App.
HĂ€ufige Probleme
Q1: Port 7000 belegt (hÀufig auf macOS)
macOS AirPlay belegt standardmĂ€Ăig 7000. Zwei Lösungen:
# Methode 1: Port in der .env Àndern
APP_PORT=7001
docker compose up -d
# Browser auf http://localhost:7001
# Methode 2: Apple-MenĂŒ â Systemeinstellungen â Allgemein â AirPlay-EmpfĂ€nger â aus
Q2: ChromaDB startet, aber Logs melden DEGRADED
Typisch, wenn chromadb-client und chromadb gleichzeitig installiert sind â dann fĂ€llt es oft still auf einen HTTP-only Modus zurĂŒck, wodurch die Vektor-FunktionalitĂ€t ausfĂ€llt. Fix:
# Im laufenden Container (oder in deiner lokalen venv)
./venv/bin/pip uninstall chromadb-client -y
./venv/bin/pip install --force-reinstall chromadb
docker compose restart odysseus
Validierung:
docker compose logs odysseus | grep -E "ChromaDB|MemoryVectorStore"â dann sollte die Initialisierung erfolgreich sein und keinDEGRADEDmehr auftauchen.
Q3: Cookbook sieht meine GPU nicht â nur iGPU oder CPU
Docker exponiert standardmĂ€Ăig alle GPUs des Hosts, aber wenn du nur die iGPU oder eine andere Karte mountest, liegt es meistens daran, dass entweder das NVIDIA Container Toolkit nicht installiert ist oder nicht korrekt konfiguriert wurde (z. B. fehlt nvidia-ctk runtime configure --runtime=docker):
# Diagnose
scripts/check-docker-gpu.sh
# anhand der Ausgabe siehst du, welcher Schritt fehlt
# Einmalig installieren + konfigurieren (Ubuntu/Debian)
scripts/check-docker-gpu.sh --install-nvidia-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
Q4: GPU Passthrough klappt, aber llama.cpp-Logs sagen Unable to find cudart
Das GerĂ€t ist nicht das Problem â es fehlt der CUDA-Runtime. Diese Schicht kann Docker fĂŒr dich nicht beheben. Geh zu Cookbook â Dependencies und installiere den CUDA-Build von llama-cpp-python neu:
Cookbook öffnen â Dependencies â llama-cpp-python finden â Reinstall (CUDA build)
Dann fĂŒhrt es intern pip install --no-cache-dir llama-cpp-python[cuda] aus, in etwa 2â3 Minuten.
Q5: Outlook / Office 365 Postfach nicht erreichbar
Das Odysseus-E-Mail-Modul unterstĂŒtzt derzeit nur IMAP mit Benutzername+Passwort. Microsoft hat nach 2024 die klassischen Passwort-Logins im Wesentlichen deaktiviert â OAuth ist nötig. Das ist aktuell eine bekannte EinschrĂ€nkung.
TemporĂ€re Workarounds: Nutze Gmail / Fastmail / ein selbst gehostetes Mailkonto oder verwende ein Microsoft App Password (fĂŒr Accounts mit 2FA), um Passwort-Login zu simulieren.
Q6: Ăffentlich ins Internet â wie macht man das sicher?
Direkt APP_BIND=0.0.0.0 ins öffentliche Netz zu hĂ€ngen = Katastrophe. LOCALHOST_BYPASS umgeht Authentifizierung, und der Agent hat zusĂ€tzlich Shell-Tools â in Shodan werden innerhalb von 24 Stunden massenhaft nackte Instanzen gefunden.
Der richtige Weg:
[Internet] â Cloudflare Access / Tailscale / WireGuard
â Caddy / Nginx / Traefik (HTTPS Termination)
â http://127.0.0.1:7000 (Odysseus, localhost-Bind beibehalten)
Und in .env:
AUTH_ENABLED=true
LOCALHOST_BYPASS=false
SECURE_COOKIES=true
Q7: Wie kontrolliert man die Cloud-API-Kosten?
Lass uns den Problem-Punkt aus Schritt 5 â Pfad C â kurz ausfĂŒhren.
Wenn man das privat macht, ordne ich die drei AnsÀtze nach Kostenhöhe absteigend:
- Offizielle API anbinden â bestes Erlebnis, aber am teuersten. Claude Opus + hĂ€ufige Agent-Aufrufe: Eine Wochenrechnung ĂŒber 100 Dollar ist völlig normal
- Protokoll-kompatible Transaktions-/Proxy-Schicht (ich nutze Defapi) â gleiche Claude/GPT/Gemini-Modelle, monatliche Rechnung deutlich niedriger als bei der offiziellen API (um grob eine ganze Stufe). Der konkrete Unterschied hĂ€ngt ab; vom wöchentlichen 100-Dollars-Niveau auf ein monatliches 100-Dollars-Niveau, also in genau dieser GröĂenordnung. Vorteil: Protokollebene ist komplett kompatibel â Odysseus bleibt bei der Konfiguration, du musst keine Prompt-/Agent-CodeĂ€nderungen machen
- Lokale quantisierte Modelle â in Cookbook z. B. ein
Q4_K_MGGUF nehmen, mit 16G VRAM laufen 30B grob im Rahmen, keine API-Kosten, aber deutlich langsamere Inferenz und bei komplexen Tasks eine Stufe schlechter in der QualitÀt
Meine Praxis-Kombi: Chat + Deep Research ĂŒber Defapi Claude Sonnet 4.5, Agent Tool-Calls ĂŒber Claude Haiku 4.5 (gĂŒnstig), einfache Klassifikations-/Zusammenfassungs-Tasks ĂŒber lokal quantisiertes Qwen2.5. Drei Provider werden jeweils separat abgerechnet, sie stören sich nicht â nach einem Monat landet man bei zweistelligen RMB-BetrĂ€gen.
TIP
SchlĂŒsseltechnik: Nicht mit demselben Modell alles machen. In Odysseus unterstĂŒtzt die Settings-Seite unterschiedliche Provider je nach Use Case â ein Feature, das viele ĂŒbersehen.
WeiterfĂŒhrende LektĂŒre / Richtung fĂŒr Fortgeschrittene
- MCP-Ăkosystem: Die von Odysseus automatisch registrierten eingebauten MCPs enthalten
playwright(Browser) /filesystem/shell. Du kannst auch eigene MCP-Server schreiben, sie inmcp_servers/registrieren und dem Agent verfĂŒgbar machen - Skills-System:
routes/skills_routes.pyverwaltet wiederverwendbare âSkillâ-Snippets â Ă€hnlich wie OpenClaw Skills: einmal schreiben, dann in jeder Session abrufen - Tailscale + mkcert HTTPS: In der letzten Sektion wurde der Basis-Flow gezeigt; als Upgrade könntest du automatische Erneuerung und DNS-01-Challenges hinzufĂŒgen
- Reverse-Proxy-Kombination: Caddy mit HTTPS + Cloudflare Proxy, damit bekommst du praktisch âPublic Internet ohne Wartungâ
- CalDAV-Sync: Selbst gehostetes Radicale (ein schlanker CalDAV-Service) â Odysseus Kalender lĂ€sst sich bidirektional mit dem Smartphone-Kalender synchronisieren
- E-Mail AI: automatisch in Buckets einsortieren: Wenn du IMAP angebunden hast, trainiere fĂŒr eine Weile â dann klassifiziert es automatisch âdringend / normal / Spamâ, EntwĂŒrfe werden vorab geschrieben, du musst nur noch âSendenâ klicken
- Cookbook Remote-Server: Cookbook â Settings â Servers kannst du eine entfernte GPU-Maschine konfigurieren. Modelle laufen/werden ĂŒber SSH geholt â Host klein, GPU weit weg, sieht sauber aus
- Deep Research: mehrstufige Reports: Umbau aus Ali Tongyi DeepResearch â ĂŒber SearXNG viele Quellen holen â zusammenfassen â synthetisieren â geeignet fĂŒr Wettbewerbs-/Industrie-Recherche
- Routing fĂŒr mehrere Provider: In Odysseus unterschiedliche Provider fĂŒr Chat/Agent/Research konfigurieren â lokal Ollama erledigt 80% AlltagsgesprĂ€che, komplexe Fragen gehen in die Cloud; Kosten und Experience stimmen zusammen
GitHub-Repository: pewdiepie-archdaemon/odysseus. Doku liegt im docs/-Ordner, Roadmap in ROADMAP.md. Wenn du beitragen willst, schau in CONTRIBUTING.md.