Dataanalys med Python: Grundläggande Verktyg och Tekniker
Redogörelse
- Årskurs: Gymnasiet
- Ämne: Digital teknik – Dataanalys med Python: grunder och verktyg
- Tema: Introduktion till datahantering och analys med Python
Ordkollen
Här listas tio ämnesord på läxans tema som är bra att känna till betydelsen av.
- Pandas: Ett populärt Python-bibliotek för datahantering och analys.
- DataFrame: En tvådimensionell tabellstruktur i Pandas för att lagra data.
- Series: En endimensionell array i Pandas som kan innehålla data av olika typer.
- Importera: Att hämta data från externa källor till ditt Python-program.
- Exportera: Att spara data från ditt Python-program till externa filer.
- Filtrering: Processen att välja specifika data baserat på vissa kriterier.
- Aggregation: Sammanställning av data, t.ex. beräkning av medelvärden eller summor.
- Visualisering: Skapandet av grafer och diagram för att presentera data visuellt.
- Jupyter Notebook: En webbaserad applikation för att skapa och dela dokument som innehåller kod, visualiseringar och text.
- API: Ett gränssnitt som tillåter olika mjukvarukomponenter att kommunicera med varandra.
Instuderingsfrågor
- Vad är Pandas och varför används det inom dataanalys?
- Beskriv vad en DataFrame är och ge ett exempel på hur den kan användas.
- Hur skiljer sig en Series från en DataFrame i Pandas?
- Förklara processen för att importera en CSV-fil till en Pandas DataFrame.
- Vad innebär det att filtrera data i en DataFrame? Ge ett exempel.
- Hur kan du exportera en DataFrame till en Excel-fil?
- Vad är aggregation och vilka typer av aggregationsfunktioner finns tillgängliga i Pandas?
- Beskriv hur du kan visualisera data med hjälp av Matplotlib i Python.
- Vad är en Jupyter Notebook och vilka fördelar erbjuder den för dataanalys?
- Förklara vad ett API är och ge ett exempel på hur du kan använda ett API i en dataanalysprojekt.
Övning
Nedan listas uppgifter och fyra svarsalternativ. Du ska ringa in det alternativ som är korrekt. Observera att av de fyra alternativen är endast ett korrekt.
Uppgift | A | B | C | D |
---|---|---|---|---|
1. Vad används Pandas främst för i Python? | Bildbearbetning | Datahantering och analys | Webbdesign | Spelutveckling |
2. Hur skapar du en DataFrame från en lista i Pandas? | pd.create_dataframe() |
pd.DataFrame() |
pd.make_df() |
pd.new_dataframe() |
3. Vilken metod använder du för att läsa en CSV-fil? | pd.read_csv() |
pd.load_csv() |
pd.import_csv() |
pd.get_csv() |
4. Hur kan du visa de första fem raderna i en DataFrame? | df.tail() |
df.head() |
df.first() |
df.show() |
5. Vilken funktion används för att beräkna medelvärdet i en kolumn? | df.average() |
df.mean() |
df.mid() |
df.sum() |
6. Hur filtrerar du rader där värdet i kolumnen ‘Ålder’ är över 30? | df.filter(df.Age > 30) |
df[df['Ålder'] > 30] |
df.select(Age > 30) |
df.choose(Age > 30) |
7. Vilket bibliotek används ofta tillsammans med Pandas för visualisering? | Matplotlib | TensorFlow | Django | Flask |
8. Hur exporterar du en DataFrame till en Excel-fil? | df.to_excel('file.xlsx') |
df.save_excel('file.xlsx') |
df.write_excel('file') |
df.export('file.xlsx') |
9. Vad gör funktionen df.describe() i Pandas? |
Ger en beskrivning av DataFrame | Beräknar statistik för numeriska kolumner | Visar DataFrame som text | Rensar DataFrame från nullvärden |
10. Vilken Jupyter-kommandorad används för att installera paket? | %install |
%pip install |
%pkg install |
%get install |
Skrivuppgifter
Här presenteras tre olika skrivuppgifter som är utformade på tre olika svårighetsnivåer: enkel, medel och svår.
Skrivuppgift 1: Introduktion till Pandas
Beskriv vad Pandas-biblioteket är och ge exempel på två vanliga användningsområden inom dataanalys. Förklara varför Pandas är ett värdefullt verktyg för dataanalytiker.
Svarslängd: ca. 250 ord (En halv sida)
Skrivuppgift 2: Dataimport och -export
Förklara stegen för att importera en CSV-fil till en Pandas DataFrame och sedan exportera en modifierad DataFrame till en Excel-fil. Inkludera kodexempel och beskriv vad varje steg gör.
Svarslängd: ca. 400 ord (En sida)
Skrivuppgift 3: Dataanalys och Visualisering
Välj ett dataset du är intresserad av och beskriv hur du skulle använda Python och Pandas för att analysera detta dataset. Inkludera vilka analyser du skulle utföra, vilka kolumner du skulle fokusera på, och hur du skulle visualisera resultaten. Diskutera även eventuella utmaningar du kan stöta på och hur du skulle hantera dem.
Svarslängd: ca. 500 ord (Ett och en halv sida)