Hemläxa
Årskurs: Gymnasiet
Ämne eller kurs: Artificiell Intelligens 2
Tema: Naturlig språkbehandling (NLP)
Ordkollen
Här listas fem ämnesord på läxans tema som är bra att känna till betydelsen av.
- Tokenisering: Processen att dela upp text i enskilda enheter, som ord eller fraser.
- Sentimentanalys: Analys av text för att avgöra känslomässiga tonlägen, såsom positiva eller negativa känslor.
- Stopwords: Vanliga ord som ofta inte tillför meningsfull information, till exempel “och”, “eller”, “är”.
- Stemming: En teknik som reducerar ord till sin stamform för att förenkla textanalys.
- Lemmatization: En process som gör det möjligt att omvandla ett ord till dess basform (lemma) med hänsyn till dess betydelse.
Instuderingsfrågor
- Vad är naturlig språkbehandling (NLP) och varför är det viktigt?
- Nämn tre tillämpningar av NLP i dagens samhälle.
- Vilka steg ingår i textbearbetning inom NLP?
- Hur kan sentimentanalys användas i affärsvärlden?
- Beskriv skillnaden mellan stemming och lemmatization.
- Vilka verktyg och bibliotek kan användas för NLP?
- Vad innebär det att ta bort stopwords i textanalys?
- Ge exempel på hur den praktiska övningen i klassrummet kan genomföras.
- Vilka insikter kan man vänta sig från en sentimentanalys av produktrecensioner?
- Hur kan analysresultaten påverka företagets marknadsföring?
Skrivuppgift
Uppgift 1: Sammanfattning av NLP
Skriv en sammanfattning om vad naturlig språkbehandling (NLP) är och dess betydelse inom artificiell intelligens. Diskutera kortfattat två tillämpningar av NLP.
Svarslängd: ca. 200 ord (En halv sida)
Uppgift 2: Praktisk tillämpning av sentimentanalys
Välj en textkälla med minst 50 texter (exempelvis recensioner på en produkt). Genomför en analys baserat på de metoder ni lärt er och dokumentera era resultat samt slutsatser. Presentera det i en kort rapport.
Svarslängd: ca. 400 ord (En sida)
Uppgift 3: Jämförelse av verktyg
Jämför minst två olika verktyg eller bibliotek som används för NLP, som NLTK och spaCy. Diskutera deras styrkor och svagheter samt vilken typ av projekt de lämpade sig bäst för.
Svarslängd: ca. 300 ord (En halv till en sida)