Elasticsearch & Logstash

by Alexander R.

Was ist Elasticsearch?

Elasticsearch ist eine verteilte Such- und Analyse-Engine. Sie basiert auf Apache Lucene. Elasticsearch wird genutzt, um große Datenmengen nahezu in Echtzeit zu durchsuchen und zu analysieren.

Was ist Logstash?

Logstash ist ein Tool zur Datenverarbeitung. Es sammelt, transformiert und leitet Daten weiter. Häufig wird es genutzt, um Daten nach Elasticsearch zu senden.

Was ist der ELK Stack?

Der ELK Stack besteht aus Elasticsearch, Logstash und Kibana. Elasticsearch speichert und durchsucht Daten. Logstash verarbeitet Daten, Kibana visualisiert sie.

Wofür wird Elasticsearch typischerweise eingesetzt?

Für Volltextsuche, Log-Analyse und Monitoring. Es wird häufig in Observability- und Security-Systemen genutzt. Auch Produkt- und Dokumentensuche sind typische Anwendungsfälle.

Was ist ein Index in Elasticsearch?

Ein Index ist eine logische Sammlung von Dokumenten. Er ist vergleichbar mit einer Tabelle in relationalen Datenbanken. Jeder Index hat eigene Einstellungen und Mappings.

Was ist ein Dokument in Elasticsearch?

Ein Dokument ist eine JSON-Struktur. Es stellt eine einzelne Dateneinheit dar. Dokumente werden in Indizes gespeichert.

Was ist ein Mapping in Elasticsearch?

Ein Mapping definiert die Struktur eines Dokuments. Es legt Feldtypen und Analyseverhalten fest. Korrekte Mappings sind wichtig für Performance.

Was ist ein Shard?

Ein Shard ist eine physische Teilmenge eines Index. Shards ermöglichen horizontale Skalierung. Sie werden über Nodes verteilt.

Was ist ein Replica Shard?

Replica Shards sind Kopien von Primary Shards. Sie erhöhen Ausfallsicherheit und Leseperformance. Schreibzugriffe erfolgen nur auf Primary Shards.

Was ist ein Node in Elasticsearch?

Ein Node ist eine einzelne Elasticsearch-Instanz. Mehrere Nodes bilden ein Cluster. Jeder Node kann unterschiedliche Rollen haben.

Was ist ein Cluster?

Ein Cluster ist eine Gruppe von Nodes. Sie arbeiten gemeinsam an Datenverarbeitung und Suche. Cluster erhöhen Skalierbarkeit und Verfügbarkeit.

Was ist Full-Text Search?

Full-Text Search analysiert Textinhalte. Wörter werden tokenisiert und normalisiert. Elasticsearch ist dafür optimiert.

Was ist ein Analyzer?

Ein Analyzer zerlegt Text in Tokens. Er kann Lowercasing, Stemming oder Stopword-Filter enthalten. Analyzer beeinflussen Suchergebnisse stark.

Was ist der Unterschied zwischen Keyword und Text Field?

Keyword-Felder werden nicht analysiert. Sie eignen sich für exakte Vergleiche. Text-Felder werden für Volltextsuche genutzt.

Was ist eine Query in Elasticsearch?

Eine Query sucht Dokumente. Sie bewertet Relevanz. Elasticsearch unterstützt viele Query-Typen.

Was ist ein Filter in Elasticsearch?

Filter schränken Ergebnisse ein. Sie beeinflussen keine Relevanz. Filter sind performant und cachebar.

Was ist Relevanz-Scoring?

Relevanz beschreibt, wie gut ein Dokument passt. Elasticsearch berechnet Scores automatisch. BM25 ist der Standardalgorithmus.

Was ist Aggregation in Elasticsearch?

Aggregations fassen Daten zusammen. Sie werden für Statistiken genutzt. Beispiele sind Count, Avg oder Terms.

Was ist Ingest Pipeline?

Ingest Pipelines verarbeiten Daten beim Import. Sie können Felder transformieren oder anreichern. Sie ersetzen einfache Logstash-Funktionen.

Was ist Logstash Pipeline?

Eine Logstash Pipeline besteht aus Input, Filter und Output. Sie definiert den Datenfluss. Pipelines sind flexibel konfigurierbar.

Was sind typische Logstash Inputs?

Typische Inputs sind File, Beats oder Kafka. Sie bestimmen die Datenquelle. Logstash kann viele Systeme anbinden.

Was sind typische Logstash Filter?

Filter verarbeiten Daten. Beispiele sind grok, mutate oder date. Sie bereinigen und strukturieren Logs.

Was ist grok?

Grok ist ein Filter für Textanalyse. Er extrahiert Felder aus Logs. Er wird häufig für Logformate genutzt.

Was ist Beats im ELK Stack?

Beats sind leichte Datensammler. Beispiele sind Filebeat oder Metricbeat. Sie senden Daten an Logstash oder Elasticsearch.

Wie skaliert man Elasticsearch?

Durch Hinzufügen von Nodes. Shards werden verteilt. Replikation sorgt für Ausfallsicherheit.

Was sind typische Performance-Probleme?

Falsche Mappings sind häufige Ursachen. Zu viele Shards belasten das Cluster. Auch komplexe Queries können Probleme verursachen.

Wie sichert man Elasticsearch ab?

Über Authentifizierung und TLS. Rollenbasierte Zugriffe werden definiert. Sicherheit ist besonders bei Logs wichtig.

Wann ist Elasticsearch ungeeignet?

Für klassische Transaktionssysteme. Es ersetzt keine relationale Datenbank. Konsistenz steht nicht im Vordergrund.

Wann ist Logstash ungeeignet?

Bei sehr einfachen Pipelines. Ingest Pipelines oder Beats sind leichter. Logstash kann ressourcenintensiv sein.

Join Course

Preview

Author

Alexander R.

Information

Last changed
6 months ago

Report course