Projekte

Showcase meiner privaten technischen Projekte: AnaCredit-Pipelines, RAG-Systeme, MCP-Server und AWS-Infrastruktur – jeweils mit Tech-Stack, Problem und Lösung.

AnaCredit-Datenplattform mit PostgreSQL

Tech-Stack: PostgreSQL • Python • SQL • Podman

Aufbau einer vollständigen AnaCredit-Datenbank auf Basis der Bundesbank- und EBA-Vorgaben. Kern des Projekts ist ein sauber modelliertes PostgreSQL-Schema, das die granularen Meldeanforderungen (Loan-by-Loan, Borrower-by-Borrower) abbildet. Die Datenbank läuft containerisiert via Podman und bildet die Grundlage für darauf aufbauende RAG- und MCP-Dienste. Zusätzlich wurde eine interne Dokumentationsstruktur (Markdown, CLAUDE.md) aufgebaut, damit KI-Assistenten den regulatorischen Kontext sicher verstehen.

RAG-System für Regulatorik (ChromaDB / Qdrant)

Tech-Stack: Python • LangChain • ChromaDB • Qdrant • AWS Bedrock • Streamlit

Aufbau eines Retrieval-Augmented-Generation-Systems, das regulatorische Dokumente (Bundesbank-Handbücher, EBA-Guidelines) semantisch durchsuchbar macht. Nach einem eingehenden Vergleich beider Vektordatenbanken wurde von ChromaDB auf Qdrant migriert. Die Ingest-Pipeline lädt PDFs und Word-Dokumente, chunked sie mit LangChain und speichert Embeddings in Qdrant. Als Frontend dient Streamlit, das Modell läuft über AWS Bedrock.

Rückblick: Im Nachhinein war das eine gute Gelegenheit, RAGs und IngestPipelines zu bauen. Die verwendeten Modelle (Claude Sonnet 3.7 und 4.0) waren bereits ohne RAG in der Analyse sehr gut unterwegs.

Multi-MCP-Server-Architektur

Tech-Stack: Python • MCP • PostgreSQL • Qdrant • Podman • Docker Compose

Entwurf und Aufbau einer modularen KI-Infrastruktur mit spezialisierten MCP-Servern: ein Postgres-MCP-Server für granulare Datenbankzugriffe (mit schema- und tabellen-basierter Zugriffskontrolle via YAML) und ein Dokument-MCP-Server für unstrukturierte Quellen. Beide Server laufen als Container in einem Podman-Pod und werden von einem Multi-MCP-Client orchestriert. Das LLM wählt kontextabhängig automatisch zwischen strukturierten DB-Abfragen und semantischer Dokumentenrecherche.

Rückblick: Lehrreich war hier die Erkenntnis, dass man MCP Server recht schnell aufsetzen kann (auch nicht lokal laufend) und ohne weitere RAGs Datenbanken, hier meine Testdatenbank, analyiseren kann.

AWS-Cloud-Infrastruktur mit Terraform

Tech-Stack: Terraform • AWS EC2 • S3 • Bedrock • Docker • Bash

Aufbau einer vollständigen Cloud-Infrastruktur auf AWS per Infrastructure-as-Code mit Terraform. Kernstück ist eine EC2-Instanz, die per User-Data-Script automatisch Docker-Container startet (PostgreSQL, MCP-Server, Qdrant). Die Konfigurationen werden aus S3 bezogen. Das Setup ermöglicht ein reproduzierbares, versioniertes Deployment der gesamten KI-Plattform – von der Datenbank bis zum LLM-Zugriff via AWS Bedrock.

Rückblick: Dieses Projekt hat mir vor Augen geführt, wie schnell sich grundlegende Infrastruktur mit den richtigen Tools aufbauen lässt.

Regulatorischer Datenkatalog

Tech-Stack: Python • PostgreSQL • Markdown • Claude AI • MCP

Entwicklung eines internen Datenkatalogs speziell für regulatorisches Reporting. Der Katalog dokumentiert Datenquellen, Attribute, Transformationsregeln und Abhängigkeiten im Kontext von AnaCredit und verwandten Meldepflichten. Ein KI-Assistent (Claude) kann über MCP direkt auf den Katalog zugreifen und erste Fragen zu Datenobjekten, Gültigkeitsregeln und Meldeprozessen beantworten – ein erster Schritt in Richtung eines AI-nativen Compliance-Werkzeugs.

KI-gestützter Portfolio Analyzer

Tech-Stack: Python • Streamlit • Claude API • Perplexity API • SQLite • Plotly

Lokale Streamlit-App zur vollautomatischen Analyse eines Aktiendepots. Claude extrahiert Positionsdaten direkt aus PDF-oder CSV Auszügen, berechnet Gewinn/Verlust, schlägt Zielgewichte gegen eine hinterlegte, persönliche Anlagestrategie vor und leitet per Perplexity API Research zu einzelnen Positionen ein. Alle Analysen werden in einer SQLite-Datenbank versioniert gespeichert.

→ Zum Projektdetail