Kategorie: AI im Arbeitsalltag

Prompting, Copilot, RAG und konkrete Use Cases für KI im Meldewesen und RegTech.

  • Warum BIRD die perfekte Datenbasis für KI-gestützte Anomalieerkennung ist

    AnaCredit • BIRD • Machine Learning – drei Dinge, die zusammengehören

    Es ist kurz vor Meldeschluss. Ein Wert fällt auf. Irgendjemand hat irgendwo etwas in den angelieferten Daten geändert. Oder nicht geändert.

    Datenqualitätsprobleme im Meldewesen werden meistens dann sichtbar, wenn es zu spät ist – kurz vor der Abgabe, unter Zeitdruck, mit begrenztem Spielraum für Ursachenforschung.

    Was wenn KI diese Probleme Tage früher erkennen könnte – automatisch, in der Pipeline, bevor der Mensch überhaupt hinschaut?

    Warum BIRD die ideale Grundlage ist

    BIRD ist mehr als ein Datenbuch. Es ist ein strukturiertes Schichtmodell: Input Layer, Transformation Layer, Output Layer. Jede Schicht hat definierte Attribute, bekannte Beziehungen, erwartbare Werteverteilungen.

    Genau das braucht ein Machine-Learning-Modell für Anomalieerkennung:

    • Bekannte Struktur – BIRD definiert, welche Felder existieren und wie sie zusammenhängen
    • Erwartbare Muster – AnaCredit-Daten folgen regulären Logiken: Laufzeiten, Risikoklassen, Exposures haben historische Verteilungen
    • Klare Schichtgrenzen – Anomalien lassen sich einer Schicht zuordnen: Liegt das Problem im Input, in der Transformation, oder erst im Output?

    Ein Data Scientist ohne Meldewesenhintergrund sieht einen Datensatz mit Auffälligkeiten. Ein Regulatory Data Scientist sieht sofort: dieser Wert kann in diesem Kontext nicht stimmen – und weiß warum. Das ist der Heimvorteil.

    Das Konzept: Anomalieerkennung in drei Stufen

    Stufe 1 – Statistische Ausreißer im Input Layer

    Machine-Learning-Modelle wie Isolation Forest oder Autoencoder lernen die normale Verteilung historischer AnaCredit-Daten. Neue Datenanlieferungen werden dagegen geprüft – die Ausreißer werden markiert, nicht verworfen.

    Stufe 2 – Regelbasierte Plausibilitätsprüfung im Transformation Layer

    Hier kommt die Fachkompetenz ins Spiel. Bekannte Geschäftsregeln, bspw. keine negativen Nominalbeträge – werden als Validierungslogik kodiert. Das ist regelbasierte KI.

    Stufe 3 – Trendabweichungen im Output Layer

    Datasets, die sich von Periode zu Periode ungewöhnlich stark verändern, werden geflaggt. Nicht abgelehnt – sondern zur menschlichen Prüfung markiert.

    Die KI entscheidet nicht, sie priorisiert und gibt dem Anwender profunde Analyseergebnisse.

    Ein Blick in die Praxis: Erste Experimente

    Ich habe begonnen, dieses Konzept in einem ersten Experiment umzusetzen – mit synthetischen AnaCredit-Daten, Python und einem Isolation-Forest-Modell.

    import pandas as pd
    from sklearn.ensemble import IsolationForest
    
    # Synthetische AnaCredit-Daten laden
    df = pd.read_csv('anacredit_input_layer.csv')
    
    # Numerische Features für das Modell auswählen
    features = ['outstanding_amount', 'maturity_days', 'interest_rate']
    X = df[features].dropna()
    
    # Isolation Forest trainieren
    model = IsolationForest(contamination=0.05, random_state=42)
    df['anomaly_score'] = model.fit_predict(X)
    
    # Ausreißer markieren: -1 = Anomalie, 1 = normal
    anomalies = df[df['anomaly_score'] == -1]
    print(f"{len(anomalies)} potenzielle Anomalien gefunden")

    Das Modell hat mit synthetischen Daten bereits Muster erkannt, die ich fachlich nachvollziehen konnte. Nicht perfekt – aber als Frühwarnsystem vielversprechend.

    Was noch fehlt – und warum das ehrlich ist

    Ich bin noch nicht fertig. Das Modell läuft auf synthetischen Daten, nicht auf echten Meldedaten. Die Schnittstelle zur BIRD-API ist im Aufbau. Und die Frage, wie man False Positives sinnvoll reduziert – also Ausreißer, die technisch auffällig aber fachlich korrekt sind – ist noch offen.

    Aber genau das ist der Punkt dieser Serie: Den Weg zeigen, nicht nur das Ziel.

    Fazit: Fachkompetenz ist der eigentliche Algorithmus

    KI-Anomalieerkennung im Meldewesen ist kein Data-Science-Projekt. Es ist ein Fachprojekt mit Data-Science-Werkzeugen.

    • BIRD liefert die Struktur.
    • AnaCredit liefert die (historischen) Muster.
    • Der Meldewesenexperte liefert das Urteilsvermögen, das entscheidet, was eine echte Anomalie ist – und was nur ein ungewöhnlicher, aber korrekter Wert.

    Das kann kein Algorithmus alleine leisten.


    Welche Erfahrungen habt ihr mit automatisierten DQ-Prüfungen im Meldewesen? Und: Setzt ihr bereits ML-basierte Ansätze ein – oder ist das noch Zukunftsmusik in euren Häusern?

    Ich freue mich auf den Austausch.

    #BIRD #IReF #AnaCredit #Meldewesen #DataGovernance #KI #MachineLearning #RegulatoryDataScientist #Datenqualität #Bankenmeldewesen

  • Wo fange ich an? Wie ich den KI-Einstieg gefunden habe – und was mir geholfen hätte

    Wo fange ich an? Wie ich den KI-Einstieg gefunden habe – und was mir geholfen hätte

    Teil 3 der Serie „Von Meldewesen zu KI“ – Von Markus H., Manager msg for banking ag

    Ich stand vor dem Wald. ChatGPT, Claude, Gemini, Perplexity, LangChain, Hugging Face, PyTorch, TensorFlow, RAG, Fine-Tuning, Prompt Engineering, Agenten, Copiloten – und das war nur, was ich an einem Nachmittag gegoogelt hatte. Jeder schien zu wissen, wo er anfangen soll. Ich nicht.

    Das Paralysis-Problem

    Das Ironische: Je mehr ich recherchierte, desto weniger wusste ich, womit ich anfangen sollte. Jeder Artikel empfahl etwas anderes. Jeder LinkedIn-Post klang als wäre es selbstverständlich. Und ich saß da mit meinem Meldewesen-Hintergrund und dachte:

    Für wen ist das eigentlich geschrieben? Nicht für mich.

    Die meisten Einstiegsguides setzen entweder null technisches Verständnis voraus – oder ein abgeschlossenes Informatikstudium. Die Mitte, in der ich mich befand, wurde kaum adressiert.

    Was mir wirklich geholfen hat: Die Frage anders stellen

    Statt Was soll ich lernen? habe ich angefangen zu fragen:

    Was will ich damit lösen?

    Bei mir war die Antwort konkret: Ich hatte eine Idee – Datenqualitätsprüfung im BIRD-Umfeld, früher, automatisierter, weniger reaktiv. Ich wusste noch nicht, ob das mit KI funktioniert. Ich wusste noch nicht, wie.

    Und ich habe auch nicht eine präzise Frage gestellt und auf die perfekte Antwort gewartet. Ich habe eine Konversation gestartet. Mit Claude. Ohne klares Ziel, ohne fertigen Plan – einfach Ich habe dieses Problem, lass uns darüber reden.

    Das hat alles verändert. Plötzlich war der Wald kein Wald mehr – sondern ein Pfad.

    Mein tatsächlicher Einstieg – ohne Umwege

    Schritt 1: Eine Spielwiese bauen – so einfach wie möglich

    Ich habe nicht mit der perfekten lokalen Umgebung angefangen. Ich habe mit Google Colab angefangen – Browser auf, Python läuft, fertig. Kein Setup, keine Installation, kein warum funktioniert das nicht.

    Phase 1: Google Colab (Einstieg)Phase 2: Lokal / Cloud (Vertiefen)
    Browser auf, sofort startklarAnaconda & VS Code lokal installieren
    Kein lokales Setup nötigVolle Kontrolle über Umgebung
    Kostenlos, GPU auf KnopfdruckUnternehmens-AWS als nächster Schritt
    Ideal zum ersten AusprobierenWenn klar ist: Ich bleibe dran

    Schritt 2: Einen Kurs – aber den richtigen

    Ich habe nicht zehn Kurse angefangen. Ich habe einen durchgezogen. Das ist der Unterschied.

    RessourceWarum empfehlenswertFür wen
    fast.ai (kostenlos)Top-down-Ansatz: erst das Ergebnis, dann das Warum. Passt zu Praktikern.Wer Ergebnisse vor Theorie will
    Kaggle Learn (kostenlos)SQL & Python in je 4–6h, direkt im Browser. Kein Setup.Absoluter Einstieg, sofort anwendbar
    Hands-On ML – Aurélien GéronDas Standardwerk. Praxisnah, vollständig, gut erklärt.Wer es gründlich angehen will
    The 100-Page ML Book – BurkovKompakt, präzise. Kein überflüssiges Wort.Zum Nachschlagen & Überblick behalten
    DeepLearning.AI auf CourseraPrompt Engineering für Entwickler – auch ohne Code-Erfahrung umsetzbar.Für den LLM-Schwerpunkt

    Schritt 3: KI als tägliches Werkzeug – nicht als Projekt

    Den größten Sprung hat nicht ein Kurs gebracht. Sondern die Entscheidung, Perplexity und Claude täglich zu nutzen – für Recherche, für Texte, für Code den ich noch nicht selbst schreiben konnte.

    Das klingt banal. Aber der Unterschied zwischen ich probiere KI manchmal aus und KI ist mein erster Griff am Morgen ist enorm.

    ToolWofür ich es täglich nutzeEinstieg
    Perplexity.aiRegulatorische Recherche – IReF, BIRD, CRR – mit QuellenangabeKostenlos, sofort nutzbar
    ClaudeTexte strukturieren, Code generieren, Ideen durchdenkenClaude.ai, kostenlos
    Python / pandasDatenanalyse, DQ-Prüfungen, Gap-Analysen im BIRD-UmfeldGoogle Colab als Einstieg
    Jupyter NotebooksAnalyse-Umgebung für explorative ArbeitLokal oder in der Cloud

    Was ich gelernt habe

    KI ist kein Hype. Sie ist ein Werkzeug – wie Excel, wie SQL, wie ein Taschenrechner. Der Unterschied: Dieses Werkzeug multipliziert deine vorhandene Expertise, anstatt sie zu ersetzen.

    Wer das Meldewesen kennt, wer BIRD versteht, wer weiß wo Daten entstehen und wo sie fehlen – der hat einen Vorsprung vor jedem Data Scientist ohne regul. Hintergrund.

    Du musst keine KI bauen. Du musst KI nutzen können. Du brauchst kein Studium – du brauchst eine Spielwiese, Neugier, eine ordentliche Portion Frustrationstoleranz und den ersten Schritt.

    Was ich dabei unterschätzt habe: Frustrationstoleranz

    Der erste Code läuft nicht. Das Modell macht nicht, was man erwartet. Die Fehlermeldung ergibt keinen Sinn. Man googelt, findet eine Lösung, die beim nächsten Problem nicht mehr funktioniert. Das ist normal – und es gehört dazu.

    Wer im Meldewesen jahrelang komplexe Migrationsprojekte begleitet hat, bringt genau diese Resilienz bereits mit. Das ist ein weiterer Heimvorteil, den man nicht unterschätzen sollte.

    Ich habe schon um 22 Uhr auf eine kryptische Python-Fehlermeldung gestarrt und kurz daran gezweifelt, ob das alles Sinn ergibt. Spoiler: Es ergibt Sinn. Man muss nur weitermachen.

    Ich habe nicht alles davon komplett durchgearbeitet. Ich habe angefangen, bin auf Probleme gestoßen, habe gesucht, gelöst – und dabei gelernt. Das ist der effektivere Weg als jeder Kurs.

    Der Wald lichtet sich. Aber nur wenn du reingehst.


    Wie war euer Einstieg? Habt ihr auch vor dem Wald gestanden – oder hattet ihr von Anfang an einen klaren Pfad? Und: Welches Tool hat bei euch den größten Unterschied gemacht?

    #KIEinstieg #Lernen #RegulatoryDataScientist #Meldewesen #Python #BIRD #IReF #Bankenmeldewesen #MachineLearning

  • IReF (Integrated Reporting Framework) – Die Evolution des Bankenmeldewesens

    Die European Central Bank revolutioniert mit IReF ab 2029 das Meldewesen.

    Und das frei verfügbare BIRD (Banks‘ Integrated Reporting Dictionary) Modell bietet bereits heute eine solide Grundlage für die Vorbereitung auf IReF. Der Input Layer (IL) beispielsweise ermöglicht erste Tests von ETL-Prozessen und gibt Einblicke in kommende Anforderungen.

    Besonders spannend: Moderne Data Analytics Tools, insbesondere Python mit seinen Open-Source-Bibliotheken, ermöglichen schon jetzt eine erste detaillierte Gap-Analyse zwischen BIRD-Anforderungen und dem eigenen Datenhaushalt. Diese frühe Analyse der Datenqualität ist ein entscheidender Erfolgsfaktor.

    Der Wandel bedeutet aber auch: Meldewesenexperten entwickeln sich zu „Regulatory Data Scientists“. Dies erfordert eine klare Strategie zum Kompetenzaufbau. Cloud-Technologien wie AWS/Azure, kombiniert mit Docker und Jupyter Notebooks, schaffen ideale Analyse-Umgebungen für diesen Transformationsprozess.