Introduktion till Programmering i R för bibliometriker

Programmering för bibliometriker och forskare

Välkommen till kursen introduktionskursen till R-programmering för bibliometriker och forskare. Denna kurs fokuserar på att ge bibliometriker och forskare inom området verktyg och kunskaper som krävs för att använda R-programmering i sitt arbete. Vi kommer att utforska R:s potential och hur det kan användas för både komplexa analyser och för att snabbt utföra vanliga uppgifter som exempelvis Excel inte klarar lika effektivt.

Kursen ges av Bibliotekshögskolan, Högskolan i Borås, tillsammans med kollegor vid Det Kgl. bibliotek (dk) och Sikt (no), med stöd av den nationella infrastrukturen Huminfra. Kursen springer ur ett skandinaviskt initiativ att utveckla användningen av programmering som resurs inom bibliometri. Den utgör startskottet på ett tänkt nätverk för “Avancerad bibliometri” i hela det nordiska området som innefattar såväl fokus på kod, API:er och maskininlärning (AI) som exempelvis naturligt språkmodellering, språklig analys och länkade data. Mer information kommer göras tillgängligt på denna Teams-yta: [länk kommer], samt möjlighet att anmäla sig till ett nyhetsbrev. Vi vill också sprida ett “Save-the-date” om att vi planerar att genomföra en konferens i april 2024, så Stay tuned! 

När? Var? Hur?

Plats: Bibliotekshögskolan, Högskolan i Borås,
Tid: 13 mars registrering kl 10.00 – 14 mars 15:00
Språk: Skandinaviska (främst)

Kursinnehåll

Fokus för kursen är att lära sig att behandla bibliometriska data av relevans i de nordiska länderna; hur de laddas ner, städas och hanteras med hjälp av olika programmeringsbibliotek, samt hur man kan sammanlänka olika datakällor. Vidare tittar vi på olika analysmetoder av bibliometriska data, samt hur man kan visualisera dessa resultat. En mer detaljerad beskrivning av upplägget (som kan komma att ändras i vissa detaljer) framgår av följande punktlista:

  • Vi kommer huvudsakligen arbeta med citeringsdata ur Web of Science och introduceras till användningen av R-libraries. Vi kommer att utforska hur man läser in data i R med hjälp av funktioner som read_csv eller fromJSON, beroende på exportformatet.

  • Fokusera på datahantering med hjälp av tidyverse-paketet [https://www.tidyverse.org/] för att förbereda data för analys. Här diskuterar vi också  utmaningar som kan uppstå om publikationsdata inte kan exporteras som CSV-filer och hur vi kan dela upp och definiera script för att konvertera JSON-formatet till tabulär data. 

  • Introduktion till hur R kan användas för att sammanfoga dataset från olika källor, vilket ger oss möjligheten att utföra nya analyser. Vi kommer att lära oss grunderna i dplyr-paketet och dess join_functions. Vi kommer också att arbeta med intressanta dataset, såsom data från Web of Science, Scopus eller öppna källor som CrossRef och OpenAlex. Det kan även inkludera data som innehåller information om öppen tillgång.

  • Utforskande av olika analysmetoder med hjälp av dplyr-funktioner som group_by, summarize, filter, count, distinct och mutate. Vi kommer även att titta på möjligheten att skapa visualiseringar med hjälp av ggplot2-paketet. 

  • Slutligen kommer vi titta på lite mer avancerade tekniker som exempelvis pivot_longer-funktionen från tidyr-paketet. Denna funktion är användbar för att omstrukturera och omforma data och är särskilt intressant för många bibliometriker.

Genom praktiska övningar och projekt kommer du att få möjlighet att tillämpa dina nyförvärvade kunskaper och utveckla dina egna bibliometriska analyser i R. Du kommer att ha stöd från erfarna lärare och få feedback på ditt arbete för att säkerställa en progressiv inlärningsprocess.

Förkunskaper: allmän datorvana, erfarenhet av att arbeta med bibliometriska data i exempelvis kalkylprogram som Excel och SPSS. Tidigare programmeringsvana eller erfarenhet att jobba med programkod är ej nödvändigt men kan vara fördelaktigt.

Praktiskt

Kursen genomförs på plats i Borås, vid institutionen för biblioteks- och informationsvetenskap, Allégatan 1, 503 32 Borås. Språk: företrädesvis skandinavisk.

Kursen startar onsdag den 13 mars kl 10:00 och pågår till torsdag 14 mars kl 15:00.

Kursen är kostnadsfri och öppen för deltagare, men vi tillämpar en No-show fee på 2 000 SEK för den som anmäler sig och inte deltar. Resa, boende och mat bekostas av deltagarna själva, men vi bjuder på fika och ser till att samordna lunch och kvällsaktiviteter med rimligt prissatta alternativ.

Antalet deltagare är satt till 18 personer och vi eftersträvar jämn fördelning mellan främst de skandinaviska länderna, varför vi förbehåller oss rätten att balansera deltagandefördelningen bland de som ansöker före 23/2. Därefter tillämpas ”first come, first served”. Deltagande bekräftas under första veckan i mars (senast 1/3). Vi planerar att genomföra uppföljande aktiviteter och förhoppningsvis fler utbildningar, beroende på intresse och uppslutning.

Välkommen till en spännande kurs där vi kommer att utforska möjligheterna med R-programmering för bibliometriker. Genom att behärska dessa färdigheter kommer du att kunna hantera och analysera bibliometriska data på ett mer effektivt sätt och göra insiktsfulla slutsatser för dina forskningsprojekt inom informationsvetenskapen!

För nätverket och kursutvecklingsgruppen,

Gustaf Nelhans, gustaf.nelhans@hb.se och Ivar Ternsell Torgersen ivar.torgersen@sikt.no (samordnare),

Søren Willer Hansen, David Gunnarsson Lorentzen.

Huminfra