SQL lernen in 100 Abfragen für Data Scientists
(gvwilson.github.io)SQL for the Weary
- Zielgruppe: Rachel mit einem Masterabschluss in Zellbiologie arbeitet an der Zellanalyse in einem Forschungskrankenhaus und möchte Data Scientist werden.
- Erforderliche Vorkenntnisse: Grundlegende Unix-Befehle und die Fähigkeit, tabellarische Daten zu analysieren.
- Lernergebnisse: Den Unterschied zwischen einer Datenbank und einem Datenbankadministrator erklären, SQL schreiben, Tabellen definieren und Daten bearbeiten, Arten von Joins erklären, Window Functions für die Arbeit mit benachbarten Zeilen verwenden, Transaktionen und Trigger verstehen, JSON-Daten mit SQL bearbeiten und über Python mit Datenbanken interagieren.
Einrichtung
- Neueste Version herunterladen: Eine Datei mit SQLite-Datenbankbeispielen, SQL-Abfragen, Python-Skripten usw. in ein temporäres Verzeichnis entpacken.
Hintergrundkonzepte
- Datenbank: Eine Sammlung von Daten, die gespeichert und abgerufen werden können.
- Datenbankmanagementsystem (DBMS): Ein Programm, das eine bestimmte Art von Datenbank verwaltet.
- SQLite: Speichert eine Datenbank in einer einzelnen Datei; PostgreSQL verteilt Informationen für höhere Leistung auf mehrere Dateien.
- Relationales Datenbankmanagementsystem (RDBMS): Speichert Daten in Tabellen und fragt sie mit SQL ab.
- NoSQL-Datenbanken: Es gibt auch Datenbanken wie MongoDB, die keine Tabellen verwenden.
Verbindung zur Datenbank
- Datenbankverbindung: Kein eigentlicher Query, aber ein notwendiger Schritt, bevor andere Arbeiten ausgeführt werden.
Verwaltungsbefehle
- SQLite-Verwaltungsbefehle: Kein Teil des Standard-SQL; spezielle PostgreSQL-Befehle beginnen mit
\. - Ausgabeformat: Mit
.headers onund.mode markdownwerden Ergebnisse besser lesbar ausgegeben.
Tabellenmanipulation
- Tabelle erstellen: Mit dem Befehl
create tableTabellen und Spalten definieren. - Daten einfügen: Mit dem Befehl
insert intoDaten zu einer Tabelle hinzufügen. - Zeilen aktualisieren: Mit dem Befehl
updateDaten in Zeilen ändern, die bestimmte Bedingungen erfüllen. - Zeilen löschen: Mit dem Befehl
delete fromZeilen entfernen, die bestimmte Bedingungen erfüllen.
Joins
- Joins: Der Vorgang, Informationen aus zwei Tabellen zu kombinieren.
- Inner Join: Mit
inner joinnur die übereinstimmenden Zeilen zweier Tabellen kombinieren. - Left Join: Mit
left joinalle Zeilen der linken Tabelle beibehalten und fehlende Werte der rechten Tabelle mitnullauffüllen.
Aggregatfunktionen
- Aggregation: Der Vorgang, mehrere Werte zu einem zusammenzufassen.
- Gängige Aggregatfunktionen: Daten mit
sum,max,min,avgusw. aggregieren. - Gruppierung: Mit
group byZeilen nach eindeutigen Kombinationen bestimmter Spalten gruppieren und für jede Gruppe Aggregationen ausführen.
Meinung von GN⁺
- Dieser Beitrag ist Material, das beim grundlegenden Verständnis von Datenbanken und SQL hilft, und ist nützlich für Einsteiger in die Softwareentwicklung oder für Menschen mit Interesse an Data Science.
- Durch die Erklärung verschiedener SQL-Funktionen anhand praxisnaher Beispiele vermittelt er praktisches Wissen zur Verwaltung und Bearbeitung von Datenbanken.
- Insbesondere Datenbank-Joins, Aggregatfunktionen und Tabellenmanipulation sind für datenanalytische Aufgaben sehr wichtig, und dieser Beitrag hilft dabei, diese Konzepte klar zu verstehen.
1 Kommentare
Hacker-News-Kommentare