Huvudmeny

Strategiskt forskningsprogram i Data Science

Beskrivning

Det engelska begreppet Data Science (vilket inte skall förväxlas med datavetenskap som heter Computer Science på engelska) innebär studier av generaliserbar utvinning av kunskap från data, där nyckelordet i definitionen är Science – vetenskap.

Data Science innehåller varierande element och bygger på tekniker och teorier från många områden, inklusive signalbehandling, matematik, sannolikhetsmodeller, maskininlärning, statistisk inlärning, programmering, datakonstruktion, mönsterigenkänning och -inlärning, visualisering, osäkerhetsmodellering, datalagring och högprestandaberäkningar med målet att utvinna mening från data och skapa dataprodukter.

Data Science är inte begränsat till problem relaterat till storskalig dataanalys, sk Big Data, även om det faktum att mängden data konstant ökar gör Big Data till en viktig aspekt av Data Science. 

Detta nya forskningsområde måste samtidigt adressera olika känslighetsaspekter, vilka inkluderar: 

  • Sociala aspekter: som problemen med NSAs avlyssning har visat, så är datasekretess en socialt känslig fråga. Varje medborgare har rätt att både få behålla sina uppgifter privata och samtidigt förstå konsekvenserna av storskalig dataanalys.
  • Strategiska aspekter: storskalig dataanalys har flera likheter med t ex oljeindustrin. Konkurrenskraften för företag kommer i allt större utsträckning att vara beroende av en grundlig förståelse av relevanta metoder och deras konsekvenser för verksamheten.

Ovanstående kompletteras med olika typer av dataanalys, inklusive prediktiv analys: marknadspenetration och strategier för hållbart företagande är beroende av att rätta beslut fattas vid rätt tidpunkt. Med ökande mängder av marknads- och konkurrentbeteendedata för beslutsfattare att analysera så blir förutsägelser sårbara utan rätt sorts kunnande.

Mål 

  • Utföra tvärvetenskaplig forskning i korsningen mellan högprestandaberäkningar (HPC), informationsvisualisering och maskininlärning;
  • Kombinera utveckling av lösningar för företag med teoriutveckling för akademin;
  • Generera resultat som återkopplar till samhället genom att kunna användas för utveckling av kursplaner och naturvetenskaplig utbildning.

Huvudsakliga tillämpningsområden av de ovan beskrivna forskningsområdena inkluderar, men är inte begränsade till biologi, läkemedelsutveckling, digitalt bevarande, kulturstudier, automatisering, affärslogistik, etc.

Nyckelord

High performance computing, data analytics, information visualization, machine learning.

Läs mer om projektet Data Science (webbsida på engelska).

Kontakt

Sándor DarányiForskningsledare: Sándor Darányi, professor i Biblioteks- och informationsvetenskap.






Område