11 Begriffe, Wording

In der Welt von MongoDB und NoSQL gibt es viele spezifische Begriffe, die für das Verständnis der Technologie und ihrer Konzepte wichtig sind. Hier sind einige der grundlegenden und häufig verwendeten Begriffe:

11.1 Datenorganisation

11.1.1 Dokument

Ein einzelner Datensatz oder eine Einheit in MongoDB. Es ist ein JSON-ähnliches Objekt, das Daten in Schlüssel-Wert-Paaren enthält.

11.1.2 Collection

Entspricht in etwa einer Tabelle in relationalen Datenbanken. Eine Kollektion enthält viele Dokumente. Im Gegensatz zu Tabellen haben Collections jedoch kein festes Schema.

11.1.3 Datenbank (Database)

Ein Satz von Collections. Eine MongoDB-Instanz kann mehrere Datenbanken haben.

11.2 Datenstruktur

11.2.1 BSON

Steht für “Binary JSON”. Es ist das binäre Format, in dem MongoDB Dokumente speichert. BSON unterstützt mehr Datentypen als JSON.

11.2.2 Feld (Field)

Ein einzelnes Schlüssel-Wert-Paar in einem Dokument.

11.2.3 Embedded Document

Ein Dokument, das als Wert innerhalb eines anderen Dokuments gespeichert ist.

11.3 Datenmanipulation

11.3.1 Query

Eine Anfrage, um spezifische Daten aus der Datenbank abzurufen.

11.3.2 Projection

Die Auswahl bestimmter Felder aus Dokumenten bei einer Abfrage.

11.3.3 Index

Eine Datenstruktur, die die Suchgeschwindigkeit in einer Datenbank verbessert.

11.4 Datenreplikation und Verteilung

11.4.1 Replica Set

Ein Replika-Set in MongoDB ist eine Gruppe von MongoDB-Servern, die zusammenarbeiten, um Datenverfügbarkeit und Ausfallsicherheit zu gewährleisten. In einem Replika-Set gibt es immer einen primären Knoten und einen oder mehrere sekundäre Knoten. Der primäre Knoten ist für die Verarbeitung von Lese- und Schreiboperationen zuständig, während die sekundären Knoten eine Kopie der Daten des primären Knotens halten.

Alle Schreiboperationen werden zuerst auf dem primären Knoten ausgeführt. Diese Änderungen werden dann an die sekundären Knoten weitergegeben, in der Regel über ein sogenanntes “Operations Log” oder Oplog. Das Oplog ist ein spezielles Kapazitätsprotokoll, das alle Änderungen am Datensatz aufzeichnet. Die sekundären Knoten replizieren diese Änderungen, indem sie das Oplog des primären Knotens abfragen und die darin festgehaltenen Operationen anwenden.

Die Vorteile eines Replika-Sets sind vielfältig. Es bietet hohe Verfügbarkeit durch automatische Failover-Funktionen. Wenn der primäre Knoten ausfällt, kann einer der sekundären Knoten automatisch zum neuen primären Knoten gewählt werden. Zudem ermöglicht ein Replika-Set die Lastverteilung von Leseanfragen auf mehrere Knoten, was die Leistung verbessern kann.

Ein Replika-Set unterstützt auch verschiedene Formen der Datenkonsistenz und Isolation, da es Konfigurationsmöglichkeiten für Lese- und Schreibkonzern bietet. Es dient als Grundlage für viele weitere Funktionen in MongoDB, wie zum Beispiel Sharding für horizontale Skalierbarkeit. ### Sharding

Ein Ansatz, um Daten horizontal über mehrere Maschinen zu verteilen. Es ermöglicht die Skalierung von MongoDB, um sehr große Datenmengen und hohe Betriebsbelastungen zu bewältigen.

11.4.2 Shard Key

Ein spezifisches Feld oder eine Kombination von Feldern, die verwendet werden, um Daten in Shards zu verteilen.

11.5 Sicherheit und Verwaltung

11.5.1 Authentifizierung

Ein Verfahren, mit dem überprüft wird, ob ein Benutzer oder ein System Zugriff auf MongoDB hat.

11.5.2 Autorisierung

Bestimmt, welche Aktionen ein authentifizierter Benutzer oder ein System in MongoDB ausführen kann.

11.5.3 Rolle (Role)

Ein Satz von Berechtigungen, die einem Benutzer oder einer Gruppe von Benutzern zugewiesen werden können.