Presentation i Google Slides
Dokument i Google Docs
Hemläxa kopplad till lektionen
Prov kopplad till lektionen

Lektionsplanering

Årskurs: Gymnasiet

Ämne eller kurs: Artificiell Intelligens 2

Tema: Datasets och datarengöring

Koppling till styrdokument

Centralt innehåll

Kursens centrala innehåll omfattar att arbeta med och förbereda datasets för maskininlärning. Detta inkluderar datarengöring, hantering av saknade värden och normalisering av data för att säkerställa att modellen får högkvalitativ input.

Kunskapskrav

Eleven ska kunna analysera och förbereda data för maskininlärning och beskriva olika steg i datarengöring och normalisering.

Lärarledda instruktioner

Introduktion till datasets (10 min)

  • Förklara vad ett dataset är och dess betydelse för maskininlärning
  • Ge exempel på olika typer av datasets
  • Diskutera hur kvaliteten på data påverkar modellen

Datarengöring (15 min)

  • Definiera datarengöring och dess syfte
  • Diskutera vanliga problem: saknade värden, felaktiga data och anomalier
  • Ge exempel på metoder för datarengöring

Normalisering av data (15 min)

  • Introducera konceptet normalisering och dess fördelar
  • Förklara olika metoder för normalisering som min-max och z-score normalisering
  • Demonstra normalisering med ett exempel

Praktisk övning: Datarengöring (10 min)

  • Dela ut ett dataset med medvetet felaktiga eller saknade värden
  • Låt eleverna arbeta individuellt eller i par för att identifiera och korrigera dessa problem
  • Diskutera resultaten och lösningarna gemensamt

Aktivitet

Eleverna ska arbeta med ett förberett dataset i grupper där de ska identifiera och åtgärda problem med datakvalitet. Varje grupp får en dataset som innehåller olika typer av problem såsom saknade värden och avvikelser. Efter att ha arbetat igenom datasetet, ska varje grupp presentera de åtgärder de tagit för att rena datan och skälen för dessa åtgärder. Diskussionen ska också fokusera på hur dessa problem kan påverka resultaten av en maskininlärningsmodell.

Exit-ticket

  • Vad innebär datarengöring? Processen att förbereda och korrigera data för analys.
  • Varför är normalisering viktigt? För att säkerställa att data står i rätt förhållande till varandra och inte snedvrider resultaten.
  • Nämn ett exempel på ett problem som uppstår i datasets. Saknade värden.
  • Vad är en vanlig metod för att hantera saknade värden? Att fylla i med medelvärde eller median.
  • Hur kan dålig datakvalitet påverka en maskininlärningsmodell? Det kan leda till felaktiga förutsägelser och bristande resultat.

Hemuppgift

Eleverna ska tilldela sig ett dataset (kan antingen ges av läraren eller väljas av eleverna) och genomföra en komplett datarengöring. De ska dokumentera de steg de tar för att identifiera och lösa problem, inklusive hur de ska hantera saknade värden och hur de normaliserar data. Skriv “Hemuppgift” så tar jag fram en hemuppgift åt dig.

Citat

“Garbage in, garbage out.” – George Fuechsel (1980)