Skip to content

Latest commit

 

History

History
52 lines (40 loc) · 4.54 KB

File metadata and controls

52 lines (40 loc) · 4.54 KB

CC BY-NC-SA 4.0

Links til undervisningen

Kod dig selv

https://knitty.com/ISSUEspring04/FEATgeekcode.html

Evaluering

Hjælp os med at blive bedre og skarpere - https://www.survey-xact.dk/LinkCollector?key=ECMA55GAU51N

Strik og Kod

Dette repositorie indeholder materialet fra workshoppen Strik og Kod fra AU Library, Det Kgl. Bibliotek.

Workshoppen handler om at trække paralellerne mellem strikning og kodning. "Kodning" forståes i denne sammenhæng som kodebaseret databehandling og lægger sig derfor inden for feltet data science. Som følge af workshoppens afsæt på Arts vil det nærmere blive et text mining eksempel. I text mining er man interesseret i at udtrække informationer af store mængder tekst - hvilket netop interesserer de fleste humanister.

Ingen kageopskrift uden et billede af kagen som noget af det første. Det samme gør sig gældende her. Det endelige resultat af S_K.Rmd(S_K_arbejdsbog.Rmd bruges live til workshops) er visualiseringen herunder, der viser hvilke ord, der bruges før forskellige ord om strikning. I grafen kan vi se at der går en pil fra "bomulds" og peger mod "strikkegarn", hvilket betyder, at det har optrådt som "bomulds garn". Jo mere markant pilen er jo flere forekomster har der været. Således kan vi altså se at et meget hyppigt forekommende ordpar er "di strikt", hvilken tydeligvis er en fejllæsning af ordet "distrikt". Dette handler om at vores data er maskingenkendt, hvilket ikke altid går lige godt.

Er du interesseret? Så download S_K.Rmd og kør den chunk for chunk i din desktop R-studio. Alternativt kan du oprette dig hos Rstudio Cloud og oprette et nyt projekt med linket til dette github repositorie.

Nyttige links/læsninger under og efter workshoppen

Under:

Efter:

Til inspiration

Kom igang med din egen tekstmining

References

Csardi, Gabor, and Tamas Nepusz. 2006. “The Igraph Software Package for Complex Network Research.” InterJournal Complex Systems: 1695. https://igraph.org.
Fellows, Ian. 2018. Wordcloud: Word Clouds. https://cran.r-project.org/web/packages/wordcloud/index.html. Silge, Julia, and David Robinson. 2016. “Tidytext: Text Mining and Analysis Using Tidy Data Principles in r.” JOSS 1 (3). https://doi.org/10.21105/joss.00037.
Pedersen T (2022). ggraph: An Implementation of Grammar of Graphics for Graphs and Networks. https://ggraph.data-imaginist.com, https://github.com/thomasp85/ggraph.
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.