Einführung in Datenbanken

In den vorherigen Kapiteln haben wir uns mit Datenerfassung, -verarbeitung und -speicherung beschäftigt. Wir haben gesehen, wie Daten von Sensoren erfasst, in binärer Form verarbeitet und auf verschiedenen Speichermedien wie RAM, SSD oder HDD gesichert werden.

Doch was passiert, wenn wir große Datenmengen strukturiert organisieren, effizient durchsuchen und gleichzeitig von mehreren Anwendungen nutzen möchten?

Hier stoßen einfache Dateisysteme schnell an ihre Grenzen.

Die Lösung: Datenbanken - spezialisierte Systeme zur strukturierten Verwaltung von Daten.

Warum Datenbanken?

Stellen wir uns vor, ein Produktionsbetrieb verwaltet seine Maschinendaten und Wartungsprotokolle in einer einfachen Excel-Tabelle oder einer CSV-Datei:

Maschinen-ID,Name,Standort,Anschaffungsjahr,Letzte_Wartung
M001,CNC-Fräse Alpha,Halle A,2019,2024-08-15
M002,Drehbank Beta,Halle A,2021,2024-09-03
M003,Schweißroboter Gamma,Halle B,2020,2024-07-22

Das funktioniert am Anfang gut, aber sobald die Daten wachsen oder mehrere Personen gleichzeitig darauf zugreifen möchten, treten Probleme auf:

Keine Zugriffskontrolle - Jeder kann alle Daten sehen und ändern (auch sensible Kostendaten)
Datenverlust bei gleichzeitigem Schreiben - Wenn Wartungstechniker und Schichtleiter gleichzeitig Daten aktualisieren, können Informationen verloren gehen
Inkonsistente Daten - Es gibt keine Regeln, die verhindern, dass ungültige Daten eingegeben werden (z.B. Anschaffungsjahr = 2050)
Schwierige Abfragen - Komplexe Fragen wie "Welche Maschinen in Halle A benötigen in den nächsten 30 Tagen eine Wartung?" sind umständlich
Keine Beziehungen - Verbindungen zwischen Datensätzen (z.B. Maschinen ↔ Wartungsprotokolle ↔ Ersatzteile) lassen sich kaum abbilden

Datenbanken lösen genau diese Probleme!

Snapchat gotta start learning SQL
byu/Pranjaljhathegr8 incomputerscience

Was ist eine Datenbank?

Bevor wir tiefer einsteigen, klären wir zunächst die grundlegenden Begriffe:

Datenbank

Eine Datenbank ist eine organisierte Sammlung von strukturierten Daten, die elektronisch auf einem Computersystem gespeichert sind. Sie enthält die eigentlichen Informationen - die Inhalte.

Beispiele aus dem industriellen Umfeld:

Maschinendaten und Wartungsprotokolle in einer Produktionshalle
Lagerbestandsdaten und Materialfluss in einem Logistikzentrum
Produktionsdaten und Qualitätskennzahlen (OEE, Ausschuss, Durchlaufzeiten)
Lieferanten- und Bestelldaten im Einkauf

Man kann sich eine Datenbank wie eine digitale Ablage vorstellen: Die Daten sind in einer bestimmten Struktur organisiert (z. B. in Tabellen, Dokumenten oder Graphen), damit sie effizient gespeichert, gefunden und verarbeitet werden können.

Wichtig: Eine Datenbank ist nicht dasselbe wie eine einfache Datei (z. B. Excel, CSV). Sie ist speziell für die Verwaltung großer, komplexer Datenmengen konzipiert und bietet Funktionen wie:

Strukturierte Organisation - Daten sind logisch geordnet (z. B. in Tabellen mit Spalten und Zeilen)
Beziehungen - Verknüpfungen zwischen verschiedenen Datensätzen (z. B. Maschinen ↔ Wartungsprotokolle ↔ Ersatzteile)
Persistenz - Daten bleiben dauerhaft erhalten, auch nach dem Neustart des Systems

Datenbank vs. Datenbankmanagementsystem

Die Begriffe Datenbank und Datenbankmanagementsystem werden oft synonym verwendet, haben aber eine wichtige Unterscheidung:

Datenbankmanagementsystem (DBMS)

Ein Datenbankmanagementsystem (DBMS) ist die Software, die Datenbanken erstellt, verwaltet und den Zugriff darauf ermöglicht. Es ist die "Verwaltungszentrale", die zwischen den Anwendungen und den Daten vermittelt.

flowchart TB
    A[Benutzer / Anwendungen]:::peach --> B[DBMS<br/>PostgreSQL, MySQL, MongoDB]:::teal
    B --> C[Datenbank 1<br/>produktions_db]:::peach
    B --> D[Datenbank 2<br/>lager_db]:::peach
    B --> E[Datenbank 3<br/>qualitaet_db]:::peach

    classDef peach fill:#FFB482aa,stroke:#333,stroke-width:1px;
    classDef teal fill:#009485aa,stroke:#333,stroke-width:2px;

Unterschied auf einen Blick:

	Datenbank	DBMS
Was ist es?	Die Daten selbst	Die Software zur Verwaltung
Beispiel	`produktions_db`, `lager_db`	PostgreSQL, MySQL, MongoDB
Analogie	Die Teile im Lager	Das Lagerverwaltungssystem (ERP, Bestandsführung, Nachverfolgung)
Funktion	Speichert die Informationen	Ermöglicht Zugriff, Sicherheit, Abfragen

Was macht ein DBMS?

Ein DBMS bietet eine Vielzahl von Funktionen, die weit über einfache Dateispeicherung hinausgehen:

Datenverwaltung - Strukturiertes Speichern in Tabellen, Dokumenten oder Graphen
Zugriffskontrolle - Wer darf welche Daten sehen oder ändern?
Konsistenzsicherung - Nur gültige Daten werden gespeichert (z. B. keine negativen Semester)
Mehrbenutzerzugriff - Mehrere Benutzer können gleichzeitig arbeiten, ohne sich gegenseitig zu stören
Transaktionsverwaltung - Änderungen werden atomar durchgeführt (alles oder nichts)
Abfragesprache - SQL ermöglicht flexible und mächtige Datenabfragen
Datensicherheit - Backups, Wiederherstellung bei Fehlern
Performance-Optimierung - Indizes und Caching für schnelle Abfragen

Das DBMS ist die Vermittlungsschicht zwischen Anwendungen und den eigentlichen Daten. Es sorgt dafür, dass alle Zugriffe koordiniert, sicher und effizient ablaufen.

Produktionsdatenbank

Die Datenbank (z.B. produktions_db) enthält alle Maschinendaten, Wartungsprotokolle, Produktionsaufträge etc.
Das DBMS (z.B. PostgreSQL) verwaltet diese Datenbank:
- Stellt sicher, dass keine ungültigen Maschinen-IDs oder unmögliche Wartungsdaten eingegeben werden
- Erlaubt der Instandhaltung, Wartungsprotokolle zu aktualisieren
- Ermöglicht dem Schichtleiter, Produktionsdaten abzurufen (aber keine Wartungskosten einzusehen!)
- Sorgt dafür, dass bei gleichzeitigen Zugriffen von MES, ERP und Wartungs-Apps keine Daten verloren gehen

PostgreSQL - Unser Werkzeug

In diesem Kurs verwenden wir PostgreSQL, eines der leistungsfähigsten und beliebtesten relationalen Datenbankmanagementsysteme (RDBMS) (was dies bedeutet, erfahren wir in einem späteren Kapitel).

Vorteile von PostgreSQL

Open Source & kostenlos - Kann von jedem frei verwendet werden
Plattformunabhängig - Läuft auf Windows, macOS und Linux
Hohe Datenintegrität - Strenge Einhaltung von SQL-Standards
Leistungsstark - Auch für große Datenmengen geeignet
Weit verbreitet - Wird in der Industrie häufig eingesetzt

PostgreSQL speichert Daten in Tabellen - ähnlich wie Excel, aber mit viel mehr Funktionen und Sicherheit.

Installation & Setup

Bevor wir mit Datenbanken arbeiten können, müssen wir PostgreSQL und ein Client-Tool installieren.

Installation, Setup & erster Test

Nachfolgend werden wir sehen, wie wir alle notwendigen Tools zum Umgang mit PostgreSQL aufsetzen und auch testen können. Folge der Anleitung und versuche alle Schritte erfolgreich durchzuführen.

Schritt 1: PostgreSQL installieren

Windows macOS

Lade den Installer von postgresql.org/download/windows herunter (beim Erstellen der Unterlagen Version 18)
Führe die Installation aus (alle Standardeinstellungen sind OK)
Wichtig: Notiere dir das Passwort für den Benutzer postgres!
Port: 5432 (Standard)

Installationsschritte:

ACHTUNG: Passwort merken

Schritt 1 von 2

💡 Tipp: Nutze Pfeiltasten ← → zum Navigieren

Installation kontrollieren:

Suche in der Windows Suchleiste nach psql. Es öffnet sich ein Shell Fenster.
Hier müssen wir mehrere Informationen eingeben. Dabei können alle Standardeinstellungen übernommen werden (einfach Enter klicken). Lediglich bei Password müssen wir unser in der Installation gewähltes Passwort eingeben.
Anschließend geben wir folgenden Befehl ein
```
SELECT version();
```
Als Ergebnis sollte die installierte Version wie nachfolgend angeführt werden.

Lade den Installer von postgresql.org/download/macosx herunter (beim Erstellen der Unterlagen Version 18)
Führe die Installation aus (alle Standardeinstellungen sind OK)
Wichtig: Notiere dir das Passwort für den Benutzer postgres!
Port: 5432 (Standard)

Installationsschritte:

ACHTUNG: Passwort merken

Schritt 1 von 2

💡 Tipp: Nutze Pfeiltasten ← → zum Navigieren

Installation kontrollieren:

Öffne den Terminal (Cmd+Space, dann "Terminal" eingeben)

Füge PostgreSQL zum PATH hinzu (damit du psql direkt aufrufen kannst):

echo 'export PATH="/Library/PostgreSQL/18/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc

Prüfe die Installation mit:
```
psql --version
```
Es sollte die installierte Version angezeigt werden (z.B. psql (PostgreSQL) 18.x)
Verbinde dich mit der Datenbank:
```
psql -U postgres
```
Gib dein bei der Installation gewähltes Passwort ein und teste mit folgendem SQL-Befehl:
```
SELECT version();
```
Als Ergebnis sollte die installierte Version wie nachfolgend angeführt werden.

Wichtig: Shell-Neustart

Falls psql --version nicht funktioniert, schließe das Terminal-Fenster komplett und öffne ein neues. Alternativ kannst du auch source ~/.zshrc nochmals ausführen.

Schritt 2: Client-Tool installieren

Um mit PostgreSQL zu arbeiten, können wir neben der Komandozeile (CLI) auch ein Client-Tool verwenden. Der Vorteil besteht darin, dass das Client-Tool eine grafische Oberfläche (GUI) besitzt und wir uns gewisse Dinge auch grafisch darstellen lassen können. Wir verwenden pgAdmin 4 - das offizielle, kostenlose PostgreSQL-Verwaltungstool.

CLI vs GUI

Wir werden in weiterer Folge vermehrt die Komandozeile verwenden. Dabei ist es uns möglich, die benötigten Befehle kennenzulernen und diese auch besser zu verstehen. Spätestens wenn man in Zukunft eine Software rund um die Datenbank bauen möchte (sei es mit Python oder Javascript) werden diese Befehle benötigt. Das Client-Tool verwenden wir zur Kontrolle und zum besseren Verständnis.

pgAdmin 4 installieren

Windows macOS

Gehe zu pgadmin.org/download
Wähle dein Betriebssystem (Windows)
Lade den Installer herunter (beim Erstellen der Unterlagen Version 9.9)
Führe die Installation aus (alle Standardeinstellungen sind OK)

💡 Tipp: Nutze Pfeiltasten ← → zum Navigieren

Gehe zu pgadmin.org/download
Wähle dein Betriebssystem (macOS)
Lade den Installer herunter (beim Erstellen der Unterlagen Version 9.9)
Führe die Installation aus (alle Standardeinstellungen sind OK)

💡 Tipp: Nutze Pfeiltasten ← → zum Navigieren

Schritt 3: Erste Verbindung herstellen

Jetzt verbinden wir pgAdmin mit unserer PostgreSQL-Datenbank.

pgAdmin 4 öffnen
In der linken Sidebar: Bei "Servers" auf den Pfeil klicken, um bereits verfügbare Server aufzulisten.
Da wir bei der Installation von PostgreSQL bereits eine lokalen Server erzeugt haben, sollte hier nun bereits 'PostgreSQL 18' stehen.
Nach Eingabe des Passworts (welches wir bei der Installation gewählt haben) sind wir erfolgreich mit dem Server verbunden.

💡 Tipp: Nutze Pfeiltasten ← → zum Navigieren

Verbindungsprobleme?

Wenn die Verbindung fehlschlägt, prüfe:

Läuft PostgreSQL?
- Windows: Task-Manager → Dienste → "postgresql-x64-18"
- macOS: Terminal öffnen und eingeben: pg_isready
Ist das PostgreSQL-Passwort korrekt
Ist der Port (meistens 5432) frei und nicht von einer Firewall blockiert?

Deine erste Datenbank

Jetzt erstellen wir unsere erste eigene Datenbank!

Quelle: blazesql

In pgAdmin klicken wir auf der linken Seite auf 'PSQL Tool Workspace' und wählen unseren bereits existierenden Server aus. Anschließend klicken wir auf 'Connect & Open PSQL' (es kann sein, dass wir nochmals das Passwort eingeben müssen)

Nun sind wir wieder in unserer Komandozeilen Darstellung und können einen ersten SQL-Befehl kennenlernen:

CREATE DATABASE produktions_db;

Was ist SQL?

SQL (Structured Query Language) ist die Sprache, mit der wir mit Datenbanken kommunizieren. Alle Befehle - vom Erstellen einer Tabelle bis zur Abfrage von Daten - werden in SQL geschrieben.

Wenn man sich den Befehl ansieht, erkennt man, dass eine neue Datenbank erzeugt werden soll und diese den namen produktions_db haben soll. Wenn wir diesen Befehl in die Komandozeile eingeben, wird die neue Datenbank erstellt.

Wenn wir wieder in die vorige Darstellung von pgAdmin wechseln (Default Workspace) sollen wir nun unter PostgreSQL 18 > Databases unsere neue Datenbank sehen.

Refresh

Wenn die neu erzeugte Datenbank nicht angezeigt wird, kann es daran liegen, dass die Darstellung noch nicht aktualisiert wurde. Durch Rechtsklick auf PostgreSQL 18 kann man Refresh auswählen (oder Taste F5)

🎉 Gratulation: Du hast nun deine erste Datenbank erstellt.

Zusammenfassung 📌

Datenbanken lösen die Probleme einfacher Dateispeicherung: strukturierte Datenhaltung, Zugriffskontrolle, Konsistenz, gleichzeitige Zugriffe
Ein DBMS (Datenbankmanagementsystem) verwaltet und koordiniert alle Zugriffe auf die Daten
PostgreSQL ist ein mächtiges, kostenloses und weit verbreitetes relationales DBMS
pgAdmin 4 ist das offizielle PostgreSQL-Verwaltungstool mit grafischer Oberfläche und Query-Editor
SQL ist die Sprache, mit der wir Datenbanken abfragen und manipulieren
Du hast PostgreSQL und pgAdmin installiert, eine Verbindung hergestellt und deine erste Datenbank erstellt

Im nächsten Kapitel lernen wir das relationale Modell kennen - wie Daten in Tabellen organisiert werden und welche Datentypen PostgreSQL bietet. Wir werden unsere erste Tabelle erstellen und Daten einfügen!