Next:
Impressum
Big Data
1
Impressum
2
Einführung in Big Data
2.1
Überblick des Schulungsprogramms
2.2
BigData Ökosystem
2.3
Tag 1: Grundlagen der Daten und Datenhaltung
2.3.1
Der Datenbegriff
2.3.2
Einführung in die Datenhaltung
2.3.3
Relationale Datenbanken
2.3.4
NoSQL-Datenbanken
2.3.5
Vertiefung in Schlüssel-Wert- und Dokumentenbasierte Datenbanken
3
Relationale Datenhaltung
3.1
Kernkonzepte der relationalen Datenhaltung
3.2
Vorteile der relationalen Datenhaltung
3.3
Herausforderungen
3.4
Beispiel
3.4.1
Details
3.5
Gruppenaufgabe: Diskussion und Erweiterung des ER-Diagramms
3.5.1
Zielsetzung
3.5.2
Vorgaben
3.5.3
Aufgabenstellung
3.5.4
Ergebnispräsentation
4
Grundlagen in SQL
4.1
Normalisierung
4.1.1
Beispiel
4.2
Denormalisierung
4.2.1
Beispiel
4.3
Zusammenfassung
4.4
Kardinalitäten
4.5
Entitäten
4.6
Weitere essentielle Begriffe
5
SQL-Kommandos
5.1
CRUD-Operationen
5.1.1
CREATE TABLE
5.1.2
INSERT
5.1.3
SELECT
5.1.4
UPDATE
5.1.5
DELETE
5.1.6
Zusammenfassung
5.2
SQL Joins: Die wichtigsten Typen
5.2.1
INNER JOIN
5.2.2
LEFT JOIN
5.2.3
RIGHT JOIN
5.2.4
FULL JOIN
5.2.5
Zusammenfassung
6
Aufgaben
6.1
Aufgabe 1: Erstellen der Mitarbeiter-Tabelle
6.2
Aufgabe 2: Einfügen von Daten in die Mitarbeiter-Tabelle
6.3
Aufgabe 3: Erstellen der Projekte-Tabelle
6.4
Aufgabe 4: Einfügen von Daten in die Projekte-Tabelle
6.5
Aufgabe 5: Erstellen der MitarbeiterProjekte-Zuordnungstabelle
6.6
Aufgabe 6: Einfügen von Daten in die MitarbeiterProjekte-Tabelle
6.7
Aufgabe 7: Abfrage aller Mitarbeiter
6.8
Aufgabe 8: Aktualisieren eines Datensatzes
6.9
Aufgabe 9: Löschen eines Projekts
6.10
Aufgabe 10: Erstellen einer Abfrage mit JOIN
7
Musterlösungen
7.1
SQL
7.1.1
Aufgabe 1: Erstellen der Mitarbeiter-Tabelle
7.1.2
Aufgabe 2: Einfügen von Daten in die Mitarbeiter-Tabelle
7.1.3
Aufgabe 3: Erstellen der Projekte-Tabelle
7.1.4
Aufgabe 4: Einfügen von Daten in die Projekte-Tabelle
7.1.5
Aufgabe 5: Erstellen der MitarbeiterProjekte-Zuordnungstabelle
7.1.6
Aufgabe 6: Einfügen von Daten in die MitarbeiterProjekte-Tabelle
7.1.7
Aufgabe 7: Abfrage aller Mitarbeiter
7.1.8
Aufgabe 8: Aktualisieren eines Datensatzes
7.1.9
Aufgabe 9: Löschen eines Projekts
7.1.10
Aufgabe 10: Erstellen einer Abfrage mit JOIN
7.2
MongoDB
7.2.1
Aufgabe 1 & 2: Erstellen der Mitarbeiter-Sammlung und Einfügen von Daten
7.2.2
Aufgabe 3 & 4: Erstellen der Projekte-Sammlung und Einfügen von Daten
7.2.3
Aufgabe 5 & 6: Erstellen der MitarbeiterProjekte-Zuordnung und Einfügen von Daten
7.2.4
Aufgabe 7: Abfrage aller Mitarbeiter
7.2.5
Aufgabe 8: Aktualisieren eines Datensatzes
7.2.6
Aufgabe 9: Löschen eines Projekts
7.2.7
Aufgabe 10: Erstellen einer Abfrage mit “JOIN”
8
MongoDB
8.1
Was ist MongoDB?
8.1.1
Dokumentenorientierte Speicherung
8.1.2
Skalierbarkeit
8.1.3
Flexibilität
8.1.4
Native Replikation
8.1.5
Sharding
8.1.6
Intuitive Abfragesprache
9
NoSQL im Überblick
9.1
Definition
9.2
Haupttypen von NoSQL-Datenbanken
9.2.1
Dokumentenorientierte Datenbanken
9.2.2
Spaltenorientierte Datenbanken
9.2.3
Key-Value-Datenbanken
9.2.4
Graphdatenbanken
9.3
Vorteile von NoSQL-Datenbanken
9.3.1
Skalierbarkeit
9.3.2
Flexibilität
9.3.3
Performance
9.4
Herausforderungen
9.4.1
Standardisierung
9.4.2
Reife
9.4.3
Komplexität
10
Geschichte, Verbreitung
10.1
Ursprünge von NoSQL und MongoDB
10.2
Wichtige Meilensteine
10.3
Verbreitung
11
Begriffe, Wording
11.1
Datenorganisation
11.1.1
Dokument
11.1.2
Collection
11.1.3
Datenbank (Database)
11.2
Datenstruktur
11.2.1
BSON
11.2.2
Feld (Field)
11.2.3
Embedded Document
11.3
Datenmanipulation
11.3.1
Query
11.3.2
Projection
11.3.3
Index
11.4
Datenreplikation und Verteilung
11.4.1
Replica Set
11.4.2
Shard Key
11.5
Sicherheit und Verwaltung
11.5.1
Authentifizierung
11.5.2
Autorisierung
11.5.3
Rolle (Role)
12
CRUD
12.1
Create: Einfügen von Daten
12.1.1
Einfaches Einfügen
12.1.2
Mehrere Dokumente einfügen
12.1.3
Automatische
_id
-Generierung
12.1.4
Optionen beim Einfügen
12.1.5
Verarbeitung von Duplikaten
12.1.6
TL;DR
12.2
Update: Ändern von Daten
12.2.1
Grundlegende Aktualisierung
12.2.2
Aktualisieren mehrerer Dokumente
12.2.3
Ersetzen von Dokumenten
12.2.4
Update-Operatoren
12.2.5
Upsert
12.2.6
TL;DR
12.3
Delete: Löschen von Daten
12.3.1
Grundlegendes Löschen
12.3.2
Löschen mehrerer Dokumente
12.3.3
Sicherheitsüberlegungen
12.3.4
TL;DR
12.4
Read: Abfragen von Daten
12.4.1
Grundlegende Abfragen
12.4.2
Auswahl bestimmter Felder
12.4.3
Abfrageoperatoren
12.4.4
Sortieren, Limitieren und Überspringen
12.4.5
Count und Distinct
12.4.6
Cursor-Methoden
12.4.7
TL;DR
13
Kernkonzepte von Big Data
13.1
Aufgaben und Ziele von Big Data
13.2
Methoden und Werkzeuge
13.2.1
Datenverarbeitung und -analyse
13.2.2
Datenlagerung
13.2.3
Datenanalyse
13.2.4
Visualisierung
13.2.5
Streaming-Daten
14
Hadoop
14.1
Überblick und Einführung
14.1.1
Geschichte und Entstehung von Hadoop
14.1.2
Grundprinzipien von Hadoop
14.2
Hadoop Distributed File System (HDFS)
14.2.1
Architektur von HDFS
14.2.2
Funktionsweise
14.3
Gruppenaufgabe: Erkundung des HDFS durch den Comic
14.3.1
Aufgabenstellung
14.3.2
Teilaufgaben
14.3.3
Präsentation und Diskussion
14.3.4
Ziel der Aufgabe
14.4
MapReduce
14.4.1
Konzept und Arbeitsweise
14.4.2
Einfaches MapReduce-Beispiel
14.4.3
Übungsaufgabe: MapReduce-Prozess verstehen und anwenden
14.5
YARN (Yet Another Resource Negotiator)
14.5.1
Zweck und Komponenten
14.5.2
Funktionsweise
14.6
Hadoop-Ökosystem und Tools
14.6.1
Hive
14.6.2
Pig
14.6.3
HBase
14.6.4
Spark
14.6.5
Zusammenfassung