Universität · Informatik · 6. Semester – Abschluss und Bachelorarbeit

Datenvorverarbeitung: Bereinigung, Transformation und Feature Engineering

4 Abschnitte1 Karteikarten-Decks1 Quizze

Datenqualität als Grundlage erfolgreicher Analysen Die Qualität der Daten bestimmt maßgeblich die Qualität der analytischen Ergebnisse – gemäß dem Prinzip "Garbage In, Garbage Out". Datenqualität wird anhand mehrerer Dimensionen bewertet: Vollständigkeit (fehlen Werte?), Korrektheit (sind die Wert

Inhaltsübersicht

  • Datenqualität: Fehlende Werte, Ausreißer und Duplikate
  • Bereinigungsstrategien: Imputation, Winsorisierung und Deduplication
  • Datentransformation: Normalisierung, Standardisierung und Encoding
  • Feature Engineering und Umgang mit unbalancierten Datensätzen
antarktis, base, wissenschaftler, berge, eis, gletscher, eisberg, wissenschaftliche grundlage, erkundung, liebling, natur, landschaft, untersuchung, berg, kampagne antarktis
Pixabay – Pixabay License

📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.

Jetzt kostenlos lernen →

Verwandte Themen

Interaktiv lernen mit Karteikarten & Quizzen

Melde dich an und lerne Data Science und Big-Data-Technologien mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.

Kostenlos testen