Was ist ein deterministisches System?
"Ein System, das bei gleichem Input immer den exakten Output liefert. Es gibt keine Varianz.
Beispiel 1: Eine SQL-Abfrage SELECT SUM(Sales) ergibt bei gleichem Datenbestand immer denselben Wert.
Beispiel 2: Ein Steuerberechnungs-Algorithmus, der starr nach Gesetzestext rechnet
Was bedeutet probabilistisch im KI-Kontext?
"Ergebnisse basieren auf Wahrscheinlichkeiten. Das System berechnet die Konfidenz für verschiedene Ausgaben.
Beispiel 1: Ein LLM berechnet für das nächste Wort: ""Haus"" (85%), ""Auto"" (10%), ""Boot"" (5%).
Beispiel 2: Eine Bilderkennung klassifiziert ein Foto zu 92% als ""Hund"" und zu 8% als ""Katze"".
"
Was definiert generative KI (GenAI)?
"Modelle, die neue Daten (Text, Bild, Code) erschaffen, statt bestehende Daten nur zu sortieren oder zu bewerten.
Beispiel 1: GitHub Copilot generiert basierend auf einem Kommentar eine komplette Python-Funktion.
Beispiel 2: Midjourney erstellt ein fotorealistisches Bild eines futuristischen Berlins im Jahr 2080.
Was ist eine starre Ontologie?
"Ein fest definiertes Modell von Kategorien und deren Beziehungen (Schema-first).
Beispiel 1: Ein SAP-ERP-System, in dem genau festgelegt ist, dass ein ""Kunde"" eine ""Adresse"" haben muss.
Beispiel 2: Ein Organigramm einer Firma, das nur Rollen wie ""Manager"" und ""Mitarbeiter"" zulässt.
Was versteht man unter einer emergenten Ontologie?
"Strukturen und Beziehungen zwischen Datenpunkten werden erst durch KI-Analyse sichtbar (Data-first).
Beispiel 1: Ein Vektorraum erkennt, dass ""Smartphone"" und ""Mobiltelefon"" semantisch nah beieinander liegen, ohne dass dies jemand explizit definiert hat.
Beispiel 2: Themen-Clustering in tausenden Kundenrezensionen zeigt plötzlich ein neues Problemfeld auf, das vorher nicht kategorisiert war.
Was ist Grounding in der KI?
"Die Verankerung von KI-Antworten in einer vertrauenswürdigen Datenquelle (Wahrheitsquelle).
Beispiel 1: Ein KI-Chatbot liest erst die interne Wissensdatenbank der Allianz Versicherung, bevor er eine Frage zu Policen beantwortet.
Beispiel 2: Ein Agent prüft die aktuellen Lagerbestände im ERP-System, um eine Lieferzeit korrekt zu bestätigen.
Wofür ist der Data Ingestion Layer zuständig?
"Der ""Eingangskanal"", der Daten aus Quellen (APIs, Logs, DBs) sammelt, bereinigt und für die Analyse bereitstellt.
Beispiel 1: Ein Azure Data Factory Pipeline, die nachts Verkaufsdaten aus 500 Filialen in ein Data Lakehaus lädt.
Beispiel 2: Ein Stream von IoT-Sensordaten einer Windkraftanlage, der in Echtzeit in eine Datenbank fließt.
Was sind Sidecar-Datenbanken?
"Hilfsdatenbanken, die spezialisierte Daten (z.B. Vektoren) parallel zur operativen Hauptdatenbank speichern.
Beispiel 1: Eine Pinecone Vektordatenbank, die Vektoreinbettungen von Produktbeschreibungen speichert, während die Preise in einer SQL-DB liegen.
Beispiel 2: Ein Redis-Cache, der häufig genutzte KI-Antworten zwischenspeichert, um Kosten und Zeit zu sparen.
Was ist Microsoft Fabric OneLake?
"Ein zentraler, virtueller Datenspeicher, der alle Daten eines Unternehmens in einem einzigen ""Data Lake"" ohne Duplikate vereint.
Beispiel 1: Ein Data Scientist greift auf dieselben Daten in OneLake mit Python zu, die ein Analyst zeitgleich in Power BI nutzt.
Beispiel 2: Verknüpfung von Daten aus AWS S3 direkt in die Microsoft-Umgebung, ohne sie physisch kopieren zu müssen (Shortcuts).
Was macht Graph Data Connect?
"Ein Tool zum sicheren Export von komplexen Beziehungsdaten aus Microsoft 365 (E-Mails, Termine) für Big-Data-Analysen.
Beispiel 1: Export von Metadaten aller Outlook-Termine eines Jahres, um die Meeting-Kultur und Effizienz einer Firma zu analysieren.
Beispiel 2: Identifikation von ""Silos"" im Unternehmen durch Analyse der Kommunikationsflüsse zwischen verschiedenen Standorten.
Was ist der Semantic Index (M365)?
"Eine logische Schicht, die die Bedeutung und den Kontext von Unternehmensdaten versteht, um Suchanfragen präziser zu machen.
Beispiel 1: Die Suche nach ""Marketingstrategie"" findet auch Dokumente, in denen nur von ""Kampagnenplanung"" die Rede ist.
Beispiel 2: Copilot erkennt, wer deine engsten Kollegen sind, und gewichtet deren Dokumente in der Antwort höher.
Was ist SCP (Salient Compressor Pretraining)?
Ein Self‑Supervised‑Pretraining‑Framework, das lange Texte stark komprimiert, indem es nur die wichtigsten Informationen extrahiert oder in Memory‑Tokens umwandelt.
Was ist Selection‑based SCP?
Ein Verfahren, bei dem ein Saliency‑Head pro Token einen Relevanz‑Score berechnet und nur die wichtigsten Tokens (Top‑k) behalten werden.Was ist Memory‑Token‑SCP (Continuous SCP)?Eine Methode, bei der ein Modell eine kleine Anzahl trainierbarer Memory Tokens nutzt, die die globale Semantik eines Dokuments in kompakter Form repräsentieren.
Was sind Memory Tokens?
Trainierbare Tokens, die die zentralen Inhalte eines Dokuments hochkomprimiert speichern und später für Retrieval oder Inference genutzt werden.
Was ist CLaRa?
Was ist ein Saliency‑Head?
Eine leichte Zusatzkomponente im Modell, die Token‑Relevanzscores berechnet, um die wichtigsten Textteile für die Kompression auszuwählen.
Was ist In‑Context‑Learning (ICL) im SCP‑Kontext?
Die Nutzung komprimierter Repräsentationen, damit Modelle effizienter mit Beispielkontexten arbeiten können – bei weniger Tokens und gleicher Informationsdichte.
Was ist RAG im SCP‑Kontext?
Ein System, das externe Dokumente zum Beantworten von Fragen nutzt. SCP verbessert RAG durch starke Kompression der Dokumente.
Was ist Prompt‑Compression?
Die Reduktion langer Eingabetexte auf eine kurze, informationsreiche Version, damit LLMs schneller und kostengünstiger arbeiten.
Was bedeutet Long‑Context‑Inference?
Die Fähigkeit eines Modells, sehr lange Eingaben effizient zu verarbeiten – unterstützt durch Kompression langer Kontexte.
Was ist RLM (Recursive Summarization)?
Ein Verfahren, bei dem große Inhalte in Teile zerlegt, einzeln zusammengefasst und danach zu einer Gesamtsynthese rekursiv verdichtet werden. Beispiel: 300-Seiten-Report → 20 Chunk-Summaries → Finaler Management-Report.
Was sind Azure Durable Functions?
Serverless-Orchestrierung mit zustandsbehaftetem Workflow (Orchestrator + Activities) für langlaufende und zuverlässige Prozesse. Beispiel: Fan-Out/Fan-In für parallele Chunk-Summarization.
Was bedeutet Fan-Out/Fan-In (Map-Reduce)?
Fan-Out verteilt Arbeit in parallele Teilaufgaben (Map), Fan-In aggregiert die Ergebnisse (Reduce). Beispiel: 20 Text-Chunks werden parallel zusammengefasst, danach zu einem Report zusammengeführt.
Was ist Azure AI Foundry / Prompt Flow?
Ein Tool zum Erstellen/Orchestrieren von KI-Flows (Router, Tools, Ausführung), das als Endpoint bereitgestellt wird. Beispiel: Intent-Router entscheidet zwischen Pfad A, B und C.
Was ist Azure Blob Storage (Data Lake Gen2)?
Ein skalierbarer Objektspeicher für Roh- und Ergebnisdaten. Beispiel: PDFs in uploads/, Reports in reports/.
Was ist Azure Event Grid?
Ein Eventing-Dienst, der auf Ereignisse reagiert (z. B. Blob erstellt). Beispiel: Neuer PDF-Upload startet automatisch die Ingestion-Function.
Was ist Azure AI Document Intelligence?
Ein Dienst zur Layout- und Texterkennung inkl. Tabellen/Bounding Boxes. Beispiel: Extrahiert Titel, Absätze und Tabellen aus einem Jahresbericht.
Was ist (modellneutrale) Vision-Analyse?
Extraktion strukturierter Informationen aus Bildern/Charts mittels visuellem LLM/Modell, ohne auf ein bestimmtes Modell fixiert zu sein. Beispiel: Balkendiagramm → JSON {metrics:[{label,value,unit}]}.
Was ist Azure AI Search (mit Semantic Ranker)?
Eine hybride Volltext- und Vektorsuche mit semantischer Relevanzbewertung. Beispiel: RAG für Faktenfragen (Pfad A), inkl. Quellverweisen.
Was ist eine Vektor-Datenbank?
Ein Speicher für Embeddings zur semantischen Suche. Beispiel: Text-Chunks + Bildbeschreibungen werden als Vektoren indexiert.
Was bedeutet Idempotenz?
Mehrfach ausgeführte Operation erzeugt denselben Endzustand, als wäre sie einmal ausgeführt. Beispiel: Chunk 17 wird nach Crash erneut gestartet → Worker liefert das bereits gespeicherte Ergebnis statt doppelt zu schreiben.
Was ist Drosselung (Throttling)?
Begrenzung paralleler Aufrufe/Rate zur Vermeidung von Rate-Limit-Fehlern und Kosten-Spikes. Beispiel: maxConcurrentActivityFunctions=10 und clientseitiges TPS-Limit.
Was ist Backpressure?
Systemweite Gegensteuerung bei Überlast (Arbeit verlangsamen/aufstauen). Beispiel: Orchestrator verarbeitet Chunks in Batches, wenn das Modell an der Kapazitätsgrenze ist.
Was ist ein JSON-Schema / Schema-Zwang?
Formale Strukturvorgabe für JSON-Antworten; Antworten müssen validiert werden. Beispiel: {key_points:[], risks:[], financials:[]}—Validator lehnt freie Prosa ab.
Was ist „response_format=json“?
Ein Parameter (falls unterstützt), der das Modell anweist, streng JSON zurückzugeben. Beispiel: Worker lehnt Ausgaben ab, die nicht parsebares JSON sind.
Was ist der Router / Intent Classification?
Komponente, die Nutzeranfragen in Pfade (A/B/C) einordnet. Beispiel: „Wie hoch war der Umsatz 2023?“ → Pfad B (SQL).
Was ist der Code Interpreter (Dynamic Sessions)?
Eine isolierte Laufzeit (Container Apps), in der der Agent Code (z. B. Python) sicher ausführt. Beispiel: KPI-Berechnung und Chart-Rendering.
Was ist Semantic Kernel?
Ein Framework zur Strukturierung von KI-Funktionen/Skills inkl. Planner/Memory. Beispiel: Agenten-Fähigkeiten in Functions kapseln.
Was ist asynchrone Orchestrierung?
Workflow, der langlaufende Tasks im Hintergrund steuert und Status hält. Beispiel: Pfad C startet Durable-Orchestration und benachrichtigt später bei Fertigstellung.
Was ist eine Dead-Letter Queue?
Ein Ablageort für Nachrichten/Jobs, die nach mehreren Versuchen nicht verarbeitet werden konnten. Beispiel: Nicht valide Chunk-Ergebnisse landen zur manuellen Prüfung im Dead-Letter.
Was ist Retry mit Exponential Backoff (und Jitter)?
Wiederholungsstrategie mit wachsender Wartezeit und zufälliger Streuung. Beispiel: Wartezeiten 2s, 4s, 8s (+ Zufall), um 429/5xx elegant abzufangen.
Was ist eine Adaptive Card Benachrichtigung?
Interaktive Nachricht (z. B. in Teams) mit Status/Links. Beispiel: „Zusammenfassung fertig – hier öffnen“.
Was ist Application Insights / Observability?
Monitoring/Telemetrie für Logs, Metriken, Traces und Dashboards. Beispiel: Metriken: chunks_total, fail_ratio, tokens_in/out, cost_estimate.
Was ist eine Correlation ID?
Eine eindeutige ID, die Logs/Traces über Services hinweg verknüpft. Beispiel: doc_id wird in allen Activities und Notifications mitgeführt.
Was bedeutet Data Residency / Regionstreue?
Daten bleiben in einer definierten Region. Beispiel: Alle Ressourcen in „Germany West Central“.
Was ist DSGVO/GDPR-Konformität?
Rechtskonforme Verarbeitung personenbezogener Daten (Transparenz, Zweckbindung, Minimierung). Beispiel: Keine PII in Logs; kurze Log-Retention.
Was ist Caching (Cosmos/Redis)?
Zwischenspeichern häufiger Antworten/Teilergebnisse zur Beschleunigung und Kostensenkung. Beispiel: Häufige KPIs aus SQL werden mit TTL gecacht.
Was sind Rate Limits / Quoten?
Grenzen für Anfragen/Token pro Zeitfenster je Ressource. Beispiel: TPS ≤ 20; Token/min ≤ X—Orchestrator batcht entsprechend.
Was ist Chunking (mit Overlap)?
Aufteilen großer Texte in Abschnitte mit geringer Überlappung für Kontext-Kohärenz. Beispiel: 2.5k Token pro Chunk, 8 % Overlap.
Was ist Final Synthesis?
Die Phase, in der alle Teilzusammenfassungen zu einem kohärenten Endbericht verschmolzen werden. Beispiel: Executive Summary + Risiken + Zahlenanhang.
Was ist Map-Reduce im RLM-Kontext?
„Map“ = Teilzusammenfassungen pro Chunk, „Reduce“ = Gesamtsynthese. Beispiel: Fan-Out/Fan-In in Durable Functions.
Was ist Azure SQL (im Setup)?
Relationale DB für strukturierte Kennzahlen. Beispiel: financial_metrics(year, metric, value, unit, source).
Was ist Managed Identity?
Dienstidentität für Azure-Ressourcen ohne Secrets. Beispiel: Function greift per RBAC auf Blob/Search/SQL zu, keine Keys im Code.
Was ist Azure API Management (APIM)?
Gateway für APIs mit Auth, Caching, Drosselung und Observability. Beispiel: Globales Rate-Limiting vor dem Modell-Endpunkt.
Was ist ein Cache-Layer für Antworten?
Schicht zum Speichern wiederkehrender Resultate, um Costs/Latenz zu reduzieren. Beispiel: „Umsatz 2023?“ wird kurzfristig gecacht.
Was ist ein Poison Message/Record?
Ein Datensatz, der wiederholt scheitert und manuelle Behandlung erfordert. Beispiel: Hart fehlerhafte Chunk-Ausgabe wandert nach N Retries in Dead-Letter.
Last changed7 days ago