Busflow Docs

Internal documentation portal

Skip to content

BSFZ-Antrag — Angaben zum Vorhaben ​

Zweck: Abbildung der tatsÀchlichen BSFZ-Formularfelder auf unsere vier Vorhaben. Bezugsdokumente: funding-work-packages.md (AP-Katalog), STRATEGY_public-funding.md (Vorhaben-Clustering), bsfz-ablehnungsrisiken.md (Argumentationsmuster).

NOTE

Konvention §3.3 „DurchgefĂŒhrte Arbeiten“: Das BSFZ-Feld "DurchgefĂŒhrte Arbeiten" beschreibt den geplanten Forschungsumfang, nicht nur bereits abgeschlossene TĂ€tigkeiten. EintrĂ€ge können sowohl retrospektive als auch prospektive Arbeiten umfassen.


Vorhaben 1 — Preisberechnung unter temporaler DatenunvollstĂ€ndigkeit ​

3.1 — Allgemeine Angaben ​

Titel des FuE-Vorhabens (max. 200 Zeichen) ​

[TODO — Entwurf:] Algorithmische Preisberechnung fĂŒr Touristik-Pakete, wenn steuerrelevante Kostendaten erst nach Leistungserbringung verfĂŒgbar sind

Start des Vorhabens ​

[TODO] — frĂŒhester relevanter Commit: 2026-03-21 (Projektstart), frĂŒhester AP1-relevanter Commit: 2026-04-07 (tax-engine.md)

3.3 — Inhaltliche/Fachliche Angaben ​

Ziel des Vorhabens / Herausforderung / WissenslĂŒcke (max. 1.500 Zeichen) ​

[TODO — Rohtext:]

Das Vorhaben entwickelt eine algorithmisch korrekte Pricing- und Steuerzerlegungs-Pipeline fĂŒr die Bus-Touristik-Domain.

Die zentrale Herausforderung: Das System muss Verkaufspreise berechnen, obwohl die fĂŒr die korrekte branchenspezifische Steuerberechnung erforderlichen Eingabedaten zum Zeitpunkt der Preisberechnung physisch nicht verfĂŒgbar sind. Die Steuerzerlegung hĂ€ngt von tatsĂ€chlichen Lieferantenrechnungen und finalen Passagierzahlen ab — beides kennt das System erst nach der Reise. Trotzdem muss es vor der Reise einen korrekten, verkaufsfĂ€higen Preis ausgeben.

ZusĂ€tzlich erzeugen Abfahrten mit gemischten Leistungsstrategien (Pauschal-Marge und BordverkĂ€ufe) zwei steuerlich getrennte Einnahmenströme, die eine 1:N-KardinalitĂ€t zwischen Abfahrt und Steuer-Ledger-EintrĂ€gen erfordern. LĂ€nderĂŒbergreifende Touren (EU/Nicht-EU-Anteile) benötigen einen ratio-basierten Margen-Split mit Negativmargen-Clamping.

Die Kalkulations-Engine muss als vorgelagerte Pipeline korrekte Eingabedaten liefern, obwohl Costing und Pricing unabhÀngige Entity-Lifecycles mit Immutable-Append-Versionierung folgen.

Abgrenzung Stand der Technik (max. 500 Zeichen) ​

[TODO — Rohtext:]

BranchenĂŒbliche Systeme (Kubus, Tourplan) verwenden monolithische Preisberechnung ohne Trennung von Costing und Pricing. Keine existierende Lösung bietet automatische Eigenleistung/Fremdleistung-Diskriminierung mit departure-level Steuer-Aggregation. Ratio-basierte Margen-Aufteilungen bei lĂ€nderĂŒbergreifenden Touren und Deferred Steuerzerlegung existieren in keiner bekannten Branchenlösung.

DurchgefĂŒhrte Arbeiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Entwurf und Verwerfung eines Per-Variante-Steuerberechnungsansatzes (geschĂ€tzte Steuer aus total_net_cost / break_even_pax) — mathematisch falsch, keine Grundlage im Steuerrecht (dokumentiert in ADR-012)
  • Entwurf und Verwerfung eines kombinierten Costing/Pricing-Entity mit JSONB-Override-Hack — verletzte Immutability-Garantie (dokumentiert in ADR-006)
  • Entwicklung einer Deferral-Architektur: Trennung der Pipeline in Vor-Reise-Phase (SchĂ€tzung) und Nach-Reise-Phase (Steuerzerlegung im FinancialLedger)
  • Ratio-basierter Algorithmus zur Aufteilung der Gewinnmarge in steuerpflichtigen und steuerfreien Anteil bei lĂ€nderĂŒbergreifenden Touren
  • Costing/Pricing-Trennung als unabhĂ€ngige Entity-Lifecycles mit Immutable-Append-Versionierung
  • Persistenz-Design fĂŒr vier buchhaltungspflichtige Invarianten mit GoBD-konformer UnverĂ€nderbarkeit
  • 1:N TaxLedgerEntry-KardinalitĂ€t fĂŒr Mixed-Strategy-Departures (ADR-015)

Wissenschaftliche/technische/methodische Unsicherheiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Die architektonische Deferral-Entscheidung (ADR-012) ist getroffen, aber die FinancialLedger-Pipeline ist noch nicht validiert — es ist offen, ob die Vor-/Nach-Reise-Trennung unter realen Buchungskaskaden (Stornierungen, Teilstornierungen, Nachbuchungen) korrekte Steuerwerte produziert
  • Der erste Lösungsansatz (Per-Variante-Steuer) war mathematisch falsch — das zeigt, dass der Lösungsweg nicht offensichtlich war
  • Negativmargen-Clamping im Drittlands-Split erfordert Validierung gegen reale Buchungsdaten
  • Die Kombination aus Immutable-Append-Versionierung und Deferred Steuerzerlegung ĂŒber unabhĂ€ngige Entity-Lifecycles hat keine Referenzimplementierung in der Branche
  • Korrekte Steuerberechnung bei gemischten Strategien mit zwei unabhĂ€ngigen Einnahmenströmen pro Abfahrt ist ungetestet

Anlagen ​

ADR-006, ADR-012, ADR-015, tax-engine.md, kalkulations-engine.md

Verwertungshorizont / MarkteinfĂŒhrung ​

[TODO]

Verschlagwortung (min. 3 Schlagworte, max. 800 Zeichen) ​

[TODO — Entwurf:] Deferred Computation, Pricing-Pipeline, Temporale DatenunvollstĂ€ndigkeit, Immutable Versionierung, Multi-Varianten-Kalkulation, Touristik-ERP, SaaS, Margenbesteuerung

3.3.1 — Tabellarischer Arbeitsplan ​

Nr.TitelZeitraumAngestelltes Personal (PM)DurchfĂŒhrung durch
AP1Deferred-Pricing-Pipeline mit Post-Departure-Kostenzerlegung[TODO][TODO]Eigenbetrieblich
AP6Two-Phase Kalkulations- & Preisgestaltungs-Engine[TODO][TODO]Eigenbetrieblich


Vorhaben 2 — Datenkonsistenz ĂŒber Vertrauensgrenzen ​

3.1 — Allgemeine Angaben ​

Titel des FuE-Vorhabens (max. 200 Zeichen) ​

[TODO — Entwurf:] Dezentrale Datensynchronisation mit Immutability-Garantien und mandantenĂŒbergreifender Compliance fĂŒr Edge-Computing-Systeme

Start des Vorhabens ​

[TODO]

3.3 — Inhaltliche/Fachliche Angaben ​

Ziel des Vorhabens / Herausforderung / WissenslĂŒcke (max. 1.500 Zeichen) ​

[TODO — Rohtext:]

Das Vorhaben erforscht, wie ein verteiltes System Datenkonsistenz und ImmutabilitĂ€t gewĂ€hrleistet, wenn Offline-FeldgerĂ€te, konkurrierende VerkaufskanĂ€le und kaskadierte Event-Pipelines widersprĂŒchliche Anforderungen erzeugen.

Herausforderung 1 — Offline-Sync vs. ImmutabilitĂ€t: Busse operieren stundenlang offline. Das System erfasst BordverkĂ€ufe und Schadensmeldungen lokal und synchronisiert spĂ€ter. GoBD-ImmutabilitĂ€t steht im Widerspruch zur Eventual Consistency — jeder Sync muss UnverĂ€nderbarkeit bereits persistierter Daten garantieren.

Herausforderung 2 — Concurrent Seat Holds: Gleichzeitige Sitzreservierung ĂŒber Web, Telefon und Driver App mit Offline-BordverkĂ€ufen. Bei Fahrzeugtausch existieren offline verkaufte Sitze nicht mehr — Konfliktlösung bei Reconnect ist offen.

Herausforderung 3 — Broadcast-Resilience: Kaskadierte Event-Pipelines mĂŒssen fehlerklassifiziert (transient vs. permanent, provider-spezifisch) und fehlertolerant zugestellt werden.

Herausforderung 4 — Cross-Tenant-Compliance: EU-561 Ruhezeiten gelten pro Fahrer, nicht pro Betreiber. Das Multi-Tenant-Modell isoliert Daten pro Mandant — Compliance-Aggregation ĂŒber Mandantengrenzen ist ungelöst.

Herausforderung 5 — CRDT-Collaborative Editing: Disponenten bearbeiten ReiseplĂ€ne gleichzeitig via CRDTs. Projektion opaker CRDT-ZustĂ€nde auf relationale Tabellen, FK-Validierung im konfliktfreien Merge-Modell und GoBD-Audit ĂŒber einen DAG gleichzeitiger Operationen sind ungelöst.

Abgrenzung Stand der Technik (max. 500 Zeichen) ​

[TODO — Rohtext:]

Kein existierendes System in der Bus-Touristik löst das Zusammenspiel von Offline-Sync mit DatenimmutabilitĂ€t, Echtzeit-Sitzverwaltung ĂŒber Online/Offline-KanĂ€le und Event-Driven Broadcast-Resilience. Existierende Lösungen behandeln diese Probleme isoliert. Das Cross-Tenant-Freelancer-Problem (mandantenĂŒbergreifende Fahrer-Compliance) ist branchenweit ungelöst.

DurchgefĂŒhrte Arbeiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Differenzielles Sync-Protokoll (RxDB + custom NestJS batch API) mit server-wins Conflict Resolution und Idempotency-Deduplizierung via sync_idempotency_log
  • Drei LösungsansĂ€tze fĂŒr mandantenĂŒbergreifende Fahrer-Compliance evaluiert: Ignorieren (rechtliches Risiko), Fahrer-Selbstdeklaration (fehlerbehaftet), Tachograph-Datenaustausch (IoT-KomplexitĂ€t, Datenschutz) — Auswahl bei Projektstart offen
  • DutyActivity-Abstraktion mit polymorpher Quellenunterscheidung (TACHOGRAPH_IMPORT, SELF_DECLARATION, TOUR_LEG)
  • Concurrent Seat-Hold-Synchronisation ĂŒber heterogene VerkaufskanĂ€le via Hasura GraphQL Subscriptions mit optimistic UI reconciliation
  • Event-Cascade-Orchestrierung ĂŒber 4 Bounded Contexts: provider-spezifische Error Classification (transient vs. permanent) fĂŒr fehlertolerante externe Zustellung
  • 40+ formal spezifizierte Domain Events mit Payload-Contracts und Cascade-Chains

Wissenschaftliche/technische/methodische Unsicherheiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Der architektonische Widerspruch zwischen GoBD-ImmutabilitĂ€t und Eventual Consistency hat keine Branchenreferenz — die gefundene Lösung (Idempotency-Deduplizierung + Append-Only-Audit-Trail) ist nicht gegen alle Edge-Cases validiert
  • Drei LösungsansĂ€tze fĂŒr das Cross-Tenant-Freelancer-Problem existieren, keiner ist branchenweit erprobt — jeder erzeugt andere Tradeoffs (Datenschutz vs. Compliance-VollstĂ€ndigkeit)
  • Concurrent Seat Holds ĂŒber Online- und Offline-KanĂ€le erfordern Konfliktlösung bei Fahrzeugtausch, wenn ein Fahrer offline Sitze verkauft hat, die durch einen Swap nicht mehr existieren
  • Provider-spezifische Error Classification (CPaaS-Anbieter liefern unterschiedliche Fehlersemantiken) fĂŒr kaskadierte Event-Pipelines ist nicht standardisiert
  • CRDT-Projektion: FK-Constraint-Validierung in einem konfliktfreien Merge-Modell (Lieferant gelöscht wĂ€hrend CRDT-Dokument bearbeitet wird), GoBD-Attribution bei Merge-Events (mehrere Nutzer → ein Diff), und Bridging von kontinuierlichem CRDT-Zustand zu diskreten GeschĂ€fts-Lifecycles (Entwurf→Veröffentlicht) haben keine Referenzimplementierung

Anlagen ​

ADR-004, ADR-017, ADR-032, offline-sync-protocol.md, eu-561-compliance-research.md, dispatch-availability-engine.md, notification-pipeline-protocol.md, realtime-strategy.md

Verwertungshorizont / MarkteinfĂŒhrung ​

[TODO]

Verschlagwortung (min. 3 Schlagworte, max. 800 Zeichen) ​

[TODO — Entwurf:] Offline-Synchronisation, GoBD-KonformitĂ€t, Eventual Consistency, DatenimmutabilitĂ€t, Cross-Tenant-Compliance, Concurrent Seat Management, Edge Computing, Event-Driven Architecture, Multi-Tenant SaaS, CRDT, Conflict-free Replicated Data Types, Collaborative Editing, Relationale Projektion

3.3.1 — Tabellarischer Arbeitsplan ​

Nr.TitelZeitraumAngestelltes Personal (PM)DurchfĂŒhrung durch
AP2Offline-First Sync Protocol mit Immutability-Garantien[TODO][TODO]Eigenbetrieblich
AP3MandantenĂŒbergreifende Compliance Engine[TODO][TODO]Eigenbetrieblich
AP4Event-Driven Multi-Tenant Architecture[TODO][TODO]Eigenbetrieblich
AP7aEvent-Driven Broadcast-Resilience[TODO][TODO]Eigenbetrieblich
AP8Concurrent Seat Hold Management[TODO][TODO]Eigenbetrieblich
AP18CRDT-Based Collaborative Trip Planning[TODO][TODO]Eigenbetrieblich


Vorhaben 3 — LLM-ZuverlĂ€ssigkeit fĂŒr domĂ€nenkritische Prozesse ​

3.1 — Allgemeine Angaben ​

Titel des FuE-Vorhabens (max. 200 Zeichen) ​

[TODO — Entwurf:] KI-gestĂŒtzte Verarbeitung und Generierung domĂ€nenkritischer Inhalte mit Halluzinationsschutz

Start des Vorhabens ​

[TODO] — frĂŒhester AP5-relevanter Commit: 2026-04-04 (docs-assistant RAG-Prototyp)

3.3 — Inhaltliche/Fachliche Angaben ​

Ziel des Vorhabens / Herausforderung / WissenslĂŒcke (max. 1.500 Zeichen) ​

[TODO — Rohtext:]

Das Vorhaben erforscht die zuverlĂ€ssige Orchestrierung nicht-deterministischer Large Language Models (LLMs) fĂŒr GeschĂ€ftsprozesse, bei denen fehlerhafte Ausgaben rechtliche oder finanzielle Konsequenzen haben.

Herausforderung 1 — Dokumentenverarbeitung: Unstrukturierte Reisedokumente heterogener LeistungstrĂ€ger (Hotels, FĂ€hren, AusflĂŒge) mĂŒssen ĂŒber LLM-basiertes Tool-Calling in eine strikt relationale ACID-Datenbank ĂŒberfĂŒhrt werden. Die Eingabedaten haben kein standardisiertes Format. Die ZuverlĂ€ssigkeit und Halluzinationsrate von LLMs in buchungskritischen Kontexten war bei Projektstart unbekannt. Fehler erzeugen falsche Preise, Passagierdaten oder Steuerwerte mit rechtlichen Konsequenzen.

Herausforderung 2 — Krisennachrichten-Generierung: LLMs generieren Passagiernachrichten in sicherheitskritischen Szenarien (VerspĂ€tungen, AusfĂ€lle). Halluzinierte oder fehlerhafte Anweisungen an Hunderte FahrgĂ€ste erzeugen Sicherheitsrisiken. Human-in-the-Loop-Absicherung muss unter Zeitdruck (Krisensituation) funktionieren.

Herausforderung 3 — LLM-Safety: Nicht-deterministische LLM-Ausgaben mĂŒssen gegen ein strikt typisiertes Datenbankschema validiert werden, bevor sie ACID-Transaktionen auslösen. Die Anti-Corruption-Layer-Architektur (Valibot-Validierung) fĂ€ngt strukturelle Fehler ab — semantische Halluzinationen (korrekt formatiert, inhaltlich falsch) erfordern zusĂ€tzliche domĂ€nenspezifische PlausibilitĂ€tsprĂŒfungen.

Herausforderung 4 — Agentic Governance: Einsatz von KI-Agenten als „virtuelle Belegschaft" fĂŒr ein Solo-Founder-gefĂŒhrtes SaaS-Unternehmen. Fehler in mehrstufigen Agenten-Pipelines (Self-Review → Supervisor → Founder) können kaskadieren.

Herausforderung 5 — Taxonomy-Aware Retrieval: Die Dokumentationsbasis folgt einer PARA-Taxonomie (Projects, Areas, Resources, Archive) mit maschinenlesbarem Frontmatter. Der RAG-Retrieval-Prozess nutzt dieses Signal nicht — autoritative Spezifikationen (resource) und archivierte EntwĂŒrfe (archive) erzeugen im Embedding-Raum Ă€hnliche Vektoren, obwohl sie fĂŒr LLM-Antworten und Agenten-Entscheidungen unterschiedliche AutoritĂ€t besitzen. Die Interaktion zwischen semantischer Ähnlichkeit und kategorialer AutoritĂ€t hat keine Referenzimplementierung.

Herausforderung 6 — Domain-State PARA Derivation: Die Plattform-EntitĂ€ten besitzen domĂ€neneigene Lifecycle-ZustĂ€nde (z.B. TourDeparture: DRAFT→PUBLISHED→COMPLETED, FinancialLedger: OPEN→CLOSED), die implizit eine PARA-Taxonomie auf Produkt-Datenebene erzeugen: bevorstehende Abfahrten sind Projects (handlungsrelevant), Reisevorlagen sind Resources (wiederverwendbar), vergangene Abfahrten sind Archive (Kontext). KI-Agenten benötigen diese abgeleitete Taxonomie, um zwischen aktuell handlungsrelevanten und historischen GeschĂ€ftsentitĂ€ten zu unterscheiden. Drei offene Probleme: duale Kategorie-Zugehörigkeit (ein Template ist gleichzeitig Resource und Container fĂŒr Projects), Übergangs-Timing (Archive bei COMPLETED, bei Ledger-Close oder bei GoBD-Fristablauf?), und Cross-Entity-PARA-Vererbung (ĂŒber Bounded-Context-Grenzen hinweg).

Abgrenzung Stand der Technik (max. 500 Zeichen) ​

[TODO — Rohtext:]

Existierende LLM-Integrationen (ChatGPT-Plugins, LangChain-Demos) operieren auf unstrukturierten Ausgaben ohne ACID-Garantien. Keine Branchenlösung verbindet LLM-Tool-Calling mit domÀnenkritischen Datenbankmutationen unter Halluzinationsschutz. Die Kombination aus struktureller Validierung (Anti-Corruption Layer) und sicherheitskritischer Inhaltsgenerierung (Krisennachrichten) hat kein Referenzsystem.

DurchgefĂŒhrte Arbeiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • RAG-Pipeline-Prototyp: Evolution von docs-assistant (Nuxt-Monolith) zu context-engine (Standalone-Server) — zwei verworfene ArchitekturansĂ€tze dokumentiert
  • Evaluierung von Embedding-QualitĂ€t (Gemini Embeddings) und LLM-Streaming-Architektur (Claude SSE Streaming + Qdrant Vector Search)
  • 3-Layer Defense-in-Depth Validierungsarchitektur: PostgreSQL (strukturelle IntegritĂ€t), Hasura/GraphQL codegen (Netzwerkgrenze), Valibot (LLM-Safety Runtime-Validierung)
  • Human-in-the-Loop-Mechanismus fĂŒr sicherheitskritische Krisennachrichten: LLM-Entwurf → Dispatcher-Review → Freigabe/Ablehnung unter Zeitdruck
  • Agentic-Governance-Spezifikation (383 Zeilen): Bounded-Context-scoped Agent Access Control via MCP, dreistufige Review-Pipeline, Blast-Radius-Klassifikation
  • MCP-Agent-Bridge-Protokoll fĂŒr domĂ€nenspezifische Tool-Bereitstellung
  • PARA-Taxonomie als maschinenlesbare Metadatenebene: 50+ Dokumente mit para_category-Frontmatter, Qdrant-Payload-Integration vorhanden — drei Retrieval-Strategien (harte Filter, Score-Multiplikatoren, Kontextfenster-Ordnung) identifiziert, keine evaluiert
  • PARA-Mapping auf Domain-EntitĂ€ten: Entity-Lifecycle-ZustĂ€nde ĂŒber vier Bounded Contexts analysiert (TourDeparture.status, Booking.status, TourTemplate.status, PriceMatrix.status, FinancialLedger.status, Incident.status) — implizite PARA-Zuordnungsregeln identifiziert, aber weder formalisiert noch in die KI-Pipeline integriert

Wissenschaftliche/technische/methodische Unsicherheiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Halluzinationsrate von LLMs bei buchungskritischen Mutationen (Preise, Passagierdaten, Steuerwerte) ist bei Projektstart unbekannt — falsche Werte erzeugen rechtliche und finanzielle Konsequenzen
  • Die Anti-Corruption-Layer-Architektur (Valibot-Validierung) fĂ€ngt strukturelle Fehler ab, aber semantische Halluzinationen (korrekt formatiert, inhaltlich falsch) erfordern zusĂ€tzliche domĂ€nenspezifische PlausibilitĂ€tsprĂŒfungen, deren ZuverlĂ€ssigkeit offen ist
  • LLM-Halluzinationsrisiko bei sicherheitskritischen Passagiernachrichten — der Human-in-the-Loop-Mechanismus muss unter Zeitdruck (Krisensituation) funktionieren, ohne dass der Dispatcher zum Flaschenhals wird
  • Kaskadierende Fehler in Multi-Agent-Pipelines: Wenn ein Agent in Stufe 1 einen subtilen Fehler macht, kann der Supervisor in Stufe 2 diesen nicht zuverlĂ€ssig erkennen — die Fehlererkennungsrate ĂŒber mehrere Pipeline-Stufen ist unbekannt
  • Taxonomy-Aware Retrieval: Drei offene Strategien (harte PARA-Filter, weiche Score-Multiplikatoren, Kontextfenster-Priorisierung) fĂŒr die Disambiguierung von DokumentenautoritĂ€t — falsche Wahl degradiert LLM-AntwortqualitĂ€t. ZusĂ€tzlich: Agenten benötigen PARA-Signale fĂŒr Tool-Routing (aktives Projekt vs. archivierte Entscheidung), aber die optimale Signalintegration ist offen
  • Domain-State PARA Derivation: Automatische Ableitung von PARA-Kategorien aus Entity-Lifecycle-ZustĂ€nden erzeugt drei ungelöste Probleme — (1) duale Zugehörigkeit (Template = Resource + Project-Container), (2) Übergangs-Timing (wann wird Departure zu Archive?), (3) Cross-Entity-Vererbung ĂŒber Bounded-Context-Grenzen (Booking = Archive, aber verknĂŒpfter PassengerProfile = Area). ZusĂ€tzlich: GoBD-Aufbewahrungspflichten verkomplizieren die Archive-Semantik — archivierte Daten haben weiterhin aktive rechtliche Relevanz

Anlagen ​

ai.md, mcp-agent-bridge.md, validation-strategy.md, docs-hub.md (§Context-Engine, §Knowledge Graph), agentic-led-company-spec.md, ADR-020, notification-pipeline-protocol.md, context-engine/src/indexer/walker.ts, context-engine/src/chat/rag.ts, PRODUCT_domain-model.md (§Entity-Lifecycle-Definitionen), gdpr-strategy.md, workflow-orchestration.md

Verwertungshorizont / MarkteinfĂŒhrung ​

[TODO]

Verschlagwortung (min. 3 Schlagworte, max. 800 Zeichen) ​

[TODO — Entwurf:] LLM-Orchestrierung, Halluzinationssicherheit, Tool-Calling, ACID-Datenbank, Anti-Corruption-Layer, Human-in-the-Loop, Krisenkommunikation, RAG-Pipeline, Taxonomy-Aware Retrieval, PARA-Metadaten, DokumentenautoritĂ€t, Domain-State PARA Derivation, Entity-Lifecycle-Taxonomie, Kontext-Priorisierung, Agentic Governance, MCP

3.3.1 — Tabellarischer Arbeitsplan ​

Nr.TitelZeitraumAngestelltes Personal (PM)DurchfĂŒhrung durch
AP5KI-gestĂŒtzte Verarbeitung und Generierung domĂ€nenkritischer Inhalte[TODO][TODO]Eigenbetrieblich
AP5+Taxonomy-Aware Retrieval [SCOPE-ERWEITERUNG][TODO][TODO]Eigenbetrieblich
AP5+Buchungsmutationen ĂŒber LLM [SCOPE-ERWEITERUNG][TODO][TODO]Eigenbetrieblich
AP9Agentic Company Governance[TODO][TODO]Eigenbetrieblich
AP27Domain-State PARA Derivation fĂŒr KI-Kontextpriorisierung[TODO][TODO]Eigenbetrieblich


Vorhaben 4 — Privacy-Aware Commerce Intelligence ​

3.1 — Allgemeine Angaben ​

Titel des FuE-Vorhabens (max. 200 Zeichen) ​

[TODO — Entwurf:] Datenschutzkonforme Kundendatenanalyse und Empfehlungssysteme in mandantenfĂ€higer Touristik-Software

Start des Vorhabens ​

[TODO] — frĂŒhester relevanter Commit: 2026-04-17 (ADR-021 Customer Intelligence Context)

3.3 — Inhaltliche/Fachliche Angaben ​

Ziel des Vorhabens / Herausforderung / WissenslĂŒcke (max. 1.500 Zeichen) ​

[TODO — Rohtext aus AP-Katalog:]

Das Vorhaben erforscht, wie ein mandantenfĂ€higes Touristik-System Kundenverhaltensdaten aggregiert und nutzt — wenn DSGVO-Datensparsamkeit, Multi-Tenant-Isolation und ein cookieloses Web die dafĂŒr nötigen DatenflĂŒsse architektonisch unterbinden.

Herausforderung 1 — Privacy vs. 360° Profil: Das System aggregiert Buchungsfrequenz, Lifetime Value und Churn-Risk aus Event-Streams vier unabhĂ€ngiger Systemkomponenten. Die DSGVO fordert Datensparsamkeit, wĂ€hrend Verhaltensanalyse maximale Datenanreicherung erfordert. Die bestehende Tombstone-Architektur löst Löschung operativer Daten — das Verhalten aggregierter Metriken nach Löschkaskaden bleibt offen.

Herausforderung 2 — Consent-Aware ML: Trainierte Empfehlungsmodelle können bei Consent-Widerruf den Beitrag eines Nutzers nicht isoliert „vergessen“. Die Multi-Tenant-Dimension verschĂ€rft das: Operator A hat Consent, Operator B nicht — das Modell sieht mandantenĂŒbergreifende Daten.

Herausforderung 3 — Dual-Paradigmen-Content: Dynamisch generierte Reise-Landingpages mĂŒssen fĂŒr klassische Crawler und LLM-Retrieval-Systeme gleichzeitig funktionieren — bei widersprĂŒchlichen Anforderungen an Content-Struktur.

Herausforderung 4 — Privacy-Preserving Analytics: Booking-Widgets laufen als iFrames auf Drittseiten. Funnel-Messung ohne Third-Party-Cookies unter sich quartalsweise Ă€ndernden Privacy-Sandbox-APIs erfordert eine API-agnostische Architektur.

Abgrenzung Stand der Technik (max. 500 Zeichen) ​

[TODO — Rohtext:]

Existierende CDPs (Segment, mParticle) bieten keine Multi-Tenant-Isolation fĂŒr Bus-Touristik-Metriken. Kein Branchensystem kombiniert DSGVO-konforme Löschkaskaden mit event-sourced Behavioral Analytics. Machine Unlearning bei Consent-Widerruf in Multi-Tenant-Recommendation-Systemen fehlt in der Literatur. GEO (Generative Engine Optimization) ist ein aktives Forschungsfeld ohne Touristik-Referenz.

DurchgefĂŒhrte Arbeiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • ADR-021: Architekturspezifikation des Customer Intelligence Bounded Context als event-sourced Analytics-Domain mit CustomerActivityLog, BehaviorAggregate, CustomerSegment, EngagementScore und RecommendationModel
  • GDPR-Strategy: Tombstone-Architektur mit per-Entity-Retention-Windows, Idempotency-Guards und Legal-Hold-Overrides als Basis fĂŒr die Privacy-Pipeline
  • Event-Emission-Vorbereitung: Alle vier operativen Contexts emittieren die fĂŒr Customer Intelligence benötigten Domain Events (BookingConfirmed, BoardingEventCreated, MessageDelivered, PassengerProfileUpdated)
  • Schema.org-Evaluation fĂŒr TouristTrip/BusTrip-Strukturierung der Commerce-Landingpages

Wissenschaftliche/technische/methodische Unsicherheiten (max. 1.000 Zeichen) ​

[TODO — Rohtext:]

  • Wie verhĂ€lt sich ein aggregiertes BehaviorAggregate nach einer GDPR-Löschkaskade? Ein gelöschter Passagier beeinflusst weiterhin Kohorten-Statistiken und trainierte Modelle — die analytische Nutzbarkeit nach Löschung bleibt offen
  • Machine Unlearning bei Multi-Tenant-Consent: Der Beitrag eines einzelnen Nutzers in einem trainierten Recommendation-Modell ist nicht isolierbar. Differentielles Privacy, k-AnonymitĂ€t oder föderiertes Lernen als mögliche LösungsansĂ€tze — keiner im Bus-Touristik-Kontext validiert
  • Dual-Paradigmen-Indizierung (Crawler vs. LLM-Retrieval) fĂŒr dynamisch generierte Reise-Landingpages hat keine Branchenreferenz
  • Privacy-Sandbox-APIs (Topics, Attribution Reporting) Ă€ndern sich quartalsweise — die Widget-Analytics-Architektur muss API-agnostisch bleiben, was die StabilitĂ€t der Messpipeline gefĂ€hrdet

Anlagen ​

ADR-021, gdpr-strategy.md, PRODUCT_differentiators-10-percent.md §1

Verwertungshorizont / MarkteinfĂŒhrung ​

[TODO]

Verschlagwortung (min. 3 Schlagworte, max. 800 Zeichen) ​

[TODO — Entwurf:] Customer Data Platform, DSGVO-KonformitĂ€t, Datensparsamkeit, Machine Unlearning, Consent Management, Recommendation Engine, Multi-Tenant Analytics, Generative Engine Optimization, Privacy Sandbox, Behavioral Analytics, Event Sourcing, Bus-Touristik

3.3.1 — Tabellarischer Arbeitsplan ​

Nr.TitelZeitraumAngestelltes Personal (PM)DurchfĂŒhrung durch
AP20Privacy-First 360° Customer Profile[TODO][TODO]Eigenbetrieblich
AP21AI-SEO / Generative Engine Optimization[TODO][TODO]Eigenbetrieblich
AP22Consent-Aware Recommendation Engine[TODO][TODO]Eigenbetrieblich
AP23Privacy-Preserving Conversion Analytics[TODO][TODO]Eigenbetrieblich

Internal documentation — Busflow