Universität · Informatik · 6. Semester – Abschluss und Bachelorarbeit
Datenvorverarbeitung: Bereinigung, Transformation und Feature Engineering
4 Abschnitte1 Karteikarten-Decks1 Quizze
Datenqualität als Grundlage erfolgreicher Analysen Die Qualität der Daten bestimmt maßgeblich die Qualität der analytischen Ergebnisse – gemäß dem Prinzip "Garbage In, Garbage Out". Datenqualität wird anhand mehrerer Dimensionen bewertet: Vollständigkeit (fehlen Werte?), Korrektheit (sind die Wert…
Inhaltsübersicht
- Datenqualität: Fehlende Werte, Ausreißer und Duplikate
- Bereinigungsstrategien: Imputation, Winsorisierung und Deduplication
- Datentransformation: Normalisierung, Standardisierung und Encoding
- Feature Engineering und Umgang mit unbalancierten Datensätzen

📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.
Jetzt kostenlos lernen →Verwandte Themen
- Einführung in Data Science: Datenlebenszyklus, Prozessmodelle und Werkzeuge
- Big Data Grundlagen: Hadoop-Ökosystem, MapReduce und verteilte Dateisysteme
- Apache Spark: Verteilte Datenverarbeitung, DataFrames und Machine Learning Pipelines
- Stream Processing und Echtzeit-Datenverarbeitung: Kafka, Flink und Event-Driven Architecture
- Datenvisualisierung und Dashboards: Prinzipien, Werkzeuge und Storytelling mit Daten
Interaktiv lernen mit Karteikarten & Quizzen
Melde dich an und lerne Data Science und Big-Data-Technologien mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.
Kostenlos testen