Interview Marta Teperek, directeur 4TU.ResearchData

Marta Teperek (TU Delft) is sinds juli 2020 de nieuwe directeur van 4TU.ResearchData. Zij volgt Alastair Dunning op. De 4TU.Federatie had een gesprek met Teperek over haar ambities met dit gezamenlijke 4TU initiatief.
4TU Delft
4TU Eindhoven
4TU Twente
4TU Wageningen
  • Delen

"Er is meer dan de publicatie van dat ene artikel"

Marta Teperek gelooft dat er kapitaal zit in het delen van de data achter het onderzoek.

Marta Teperek (TU Delft) is sinds juli 2020 de nieuwe directeur van 4TU.ResearchData. Zij volgt Alastair Dunning op. De 4TU.Federatie had een gesprek met Teperek over haar ambities met dit gezamenlijke 4TU initiatief.

Voor wie jullie nog niet kennen, waarom is 4TU.ResearchData er?
Er was in het jaar van oprichting, in 2010, nog geen oplossing voor onderzoekers om hun data te delen. Er liepen toen veel projecten met waardevolle datasets. Zo wilde een groep onderzoekers een enorme hoeveelheid realtime weerobservaties bewaren. Dit zijn unieke data omdat het observaties zijn die niet zomaar opnieuw kunnen worden gedaan. Het is belangrijk om deze gegevens beschikbaar te maken voor toekomstig onderzoek, bijvoorbeeld naar klimaatverandering. Voor de technische universiteiten was het zinvol om dit samen te doen. Het bespaarde kosten om de infrastructuur te delen, maar het bood ook de mogelijkheid kennis uit te wisselen. Dit is hoe 4TU.ResearchData is ontstaan.

Wat doen jullie?
Onze voornaamste taak is het delen van kennis, expertises en ervaringen op het terrein van datamanagement. En daar een efficiënte, goed werkende oplossing voor bieden in de vorm van een centraal datapunt; de data repository die inmiddels duizenden datasets bevat! Je kunt denken aan datasets op het gebied van luchtvaart; data die de ‘flow’ op luchthavens in kaart brengen of data die iets zeggen over de materialen van nieuwe vliegtuigen. Welke materialen zijn het best bestand tegen spanning en welke zijn economisch het meest interessant?

"Het zou heel stom zijn om niet samen te werken!"
Marta Teperek

Wat is de winst om dit in 4TU-verband te doen?
We delen best practices en ervaringen en helpen elkaar. Het is beter voort te bouwen op eerdere kennis dan steeds het wiel uit te vinden. En daarnaast, het type onderzoek en methodologieën van onderzoekers en van partnerorganisaties zijn zo gelijk aan elkaar. Het zou stom zijn om niet samen te werken! Deze coronatijd waarin kennis digitaal gedeeld wordt, kan dat nog verder versnellen.

Is er vanuit de data gezien ook nog een voordeel om met vier TU’s samen op te trekken?
Ja zeker! De gegevens worden nu vaak nog op verschillende plaatsen opgeslagen. Door het aanbieden van een centraal datapunt, ondersteund door een excellente infrastructuur, kunnen bestaande data, die voor één doel zijn gecreëerd, worden hergebruikt voor volledig nieuw onderzoek, wat leidt tot nieuwe onderzoeksresultaten.

Wie zijn jullie doelgroepen?
4TU.ResearchData is er in de eerste plaats voor de onderzoekers van de technische universiteiten. Zij kunnen in de repository de data uploaden, delen en hergebruiken. Maar ook onderzoekers buiten 4TU.ResearchData en uit het buitenland weten de repository te vinden.

Daarnaast worden de data voor onderwijsdoeleinden gebruikt. Data professioneals kunnen met de datasets laten zien hoe je data kunt delen en hoe je ze vindbaar kunt maken. In de repository worden de datasets automatisch voorzien van een Digital Object Identifier (DOI) waarmee de zichtbaarheid, vindbaarheid en citeerbaarheid wordt bevorderd.

Waar ligt uw focus als directeur van 4TU.ResearchData?
Het archiveren van data en het aanbieden van een excellent werkende technische infrastructuur is de ene kant van ons werk. De andere kant waarmee ik aan de slag wil, is het opbouwen van een netwerk waarin de kennis over datamanagement gedeeld wordt. Iedere instelling heeft een aantal datastewards die de onderzoekers trainen op datamanagement. Vaak staan die er alleen voor. Door best practices te delen en hen opleiding te bieden, verspreidt de kennis zich beter. ‘Train the trainer’ is ons motto. Door de trainer van de laatste kennis te voorzien, bijvoorbeeld hoe je de data FAIR -Findable – Accessible – Interoperable en Reusable- kunt maken, breng je het niveau van datamanagement omhoog. Zo stellen we per 1 oktober een Community Manager aan om hier nog meer energie in te steken.

"Als je onderzoekers beloont voor het goed opslaan van hun data, dan zullen ze daartoe eerder toe geneigd zijn. Ook daar ligt voor ons een rol in het aanmoedigen en faciliteren van de discussie hierover."

De meeste onderzoekers hebben het doel zo veel mogelijk artikelen in gerenommeerde tijdschriften te publiceren. Maar onderzoek is veel meer! Achter het onderzoek schuilen heel veel dossiers, observaties en data op computers. Na vier jaar onderzoek schrijven onderzoekers meestal een samenvatting in een tijdschriftpublicatie en dat is de heilige graal. Maar dat toont niet de adem van al het onderzoek dat je deed, hoe hard je werkte, hoe rijk jouw datasets zijn … Ik geloof in het kapitaal van de data achter het onderzoek. Er is veel meer dan de publicatie van dat ene artikel’.

Door het systeem anders in te richten en de onderzoeker niet alleen te beoordelen op het aantal publicaties, maar ook op de rijkheid van zijn de datasets, beloon je goed datamanagement. En worden datasets toegankelijk voor toekomstige onderzoekers.

Het gaat gelukkig de goede kant op. Organisaties als NWO of de VSNU kijken hoe het academische beloningssysteem anders georganiseerd kan worden en ook de European Open Science Cloud (EOSC) stimuleert dit. Om de EOSC werkelijkheid te maken voor alle onderzoekers in Europa, is het cruciaal dat zij op een FAIR manier met hun data omgaan. Hier zal veel inspanning en tijd voor nodig zijn waarvoor onderzoekers op een redelijke manier voor zouden moeten worden beloond.

En hoe serieus spelen privacy en competitie een rol bij het wel of niet data delen?
Dat is zeker iets dat speelt. Onderzoekers werken misschien met privacy- of commercieel gevoelige gegevens. Daar helpt het om onderzoekers te voorzien van instrumenten, training en ondersteuning om hun data 'zo open mogelijk, zo gesloten mogelijk' te maken. Ik ben blij te kunnen zeggen dat onze repository sinds augustus een functionaliteit heeft waarbij de toegang tot een dataset kan worden beperkt. 

"Een actueel resultaat is de Combat COVID equipment app, die
onderzoekers en studenten van de TU Delft bouwden in samenwerking met andere partijen."

Zijn er mooie resultaten te noemen die toe te schrijven zijn aan het jullie data management diensten?
Ja te veel om op te noemen. Leuk om een voorbeeld uit te lichten waar een urgente vraag lag. Onderzoekers en studenten van de TU Delft bouwden in samenwerking met andere partijen de Combat COVID equipment app. Deze app is gebouwd in de context van het tekort aan materialen zoals ventilatoren, aan het begin van de uitbraak van de pandemie. Het ging om het opbouwen van een database met informatie over verschillende hardware die kan helpen de COVID-19 pandemie aan te pakken. Het is cruciaal deze informatie op de juist wijze te documenteren. De EOSC zag de meerwaarde en heeft het team met een bedrag van 40.000 euro beloond om verder te helpen met de hardware documentatie. Dit gebaar benadrukt het belang dat er internationaal wordt gegeven aan de discipline van datamanagement.

Ik zag andere voorbeelden op jullie site. Heel inspirerend om te lezen welk profijt verschillende type onderzoekers van jullie repository hebben.
Ja mensen die ze willen nalezen kunnen naar de speciale pagina met al deze voorbeelden.

Wat is uw eigen vakgebied en wat is de toepassing daarvan?  
Mijn PhD onderzoek zat in de hoek van de epigenetics, waarbij ik zeldzame kikkersoorten bestudeerde. Om nieuwe tools voor bestuderen te ontwikkelen, werkten we samen met onderzoekers uit de hele wereld. We deelden genomic data voordat ze werden gepubliceerd om de hele groep een voorsprong te geven in het onderzoek naar deze kikkers. Als PhD student zag ik al de kracht van data, en dat dit veel belangrijker was dan alleen dat eindartikel met samenvatting, als afsluiting van de PhD periode.

Hielp de cultuur van de onderzoeksgroep daar ook bij?
Ja, dat droeg zeker bij. Het was in mijn onderzoeksveld gebruikelijk om de data te delen zodat anderen verder konden bouwen en ontdekken. Delen was zo erg de sleutel, dat inspireerde mij enorm. Daarbij waren in mijn vakgebied de grote machines de drijver voor het ontwikkelen van standaarden voor data delen.  Deze machines konden helpen de genetische codes te ontrafelen voor een heel diersoort. Wat deden we met deze enorme datasets? Formaten maken om ze te delen was de eerste stap. Verschillende partijen werkten samen op deze uitdaging. Repositories, infrastructuur aanbieders, onderzoekers, uitgevers van tijdschriften. Allemaal werkten ze samen om dit voor de community te realiseren.

Dat gevoel van interuniversitair samenwerken startte dus al heel vroeg in uw onderzoekscarrière
Ja, als je mij vraagt waar het plezier van deze onderzoeksperiode hem in zat, dan was het meer dan de inhoud van het onderzoek, dat gevoel van samen data opbouwen en delen. Het belang en ook het plezier dat ik daar heb meegemaakt, neem ik mee en helpt mij enorm in mijn functie als directeur van 4TU.ResearchData.

BIOGRAFIE

Marta Teperek is sinds juni 2020 directeur van 4TU.ResearchData en hoofd van de Research Data Services bij TU Delft Library. Tussen 2017 and 2020 was zij werkzaam als Data Stewardship Coördinator bij de TU Delft.

Marta bouwde een team van data stewards op, die bij elke faculteit van de TU Delft zijn aangesteld om disciplinaire ondersteuning te bieden op het gebied van datamanagement. Voordat ze bij de TU Delft kwam, leidde ze de oprichting en het beheer van data-ondersteunende diensten aan de Universiteit van Cambridge (2015-2017). Tijdens haar verblijf in Cambridge heeft ze ook het programma Data Champions en de Open Research Pilot geïnitieerd en begeleid. Marta Teperek is onderzoeker door opleiding en voltooide haar PhD in moleculaire biologie en genomics aan de Universiteit van Cambridge in 2014.

Twitter:@martateperek
ORCiD: https://orcid.org/0000-0001-8520-5598

Interview Marta Teperek, directeur 4TU.ResearchData

"Er is meer dan de publicatie van dat ene artikel"

Marta Teperek gelooft dat er kapitaal zit in het delen van de data achter het onderzoek.

Marta Teperek (TU Delft) is sinds juli 2020 de nieuwe directeur van 4TU.ResearchData. Zij volgt Alastair Dunning op. De 4TU.Federatie had een gesprek met Teperek over haar ambities met dit gezamenlijke 4TU initiatief.

Voor wie jullie nog niet kennen, waarom is 4TU.ResearchData er?
Er was in het jaar van oprichting, in 2010, nog geen oplossing voor onderzoekers om hun data te delen. Er liepen toen veel projecten met waardevolle datasets. Zo wilde een groep onderzoekers een enorme hoeveelheid realtime weerobservaties bewaren. Dit zijn unieke data omdat het observaties zijn die niet zomaar opnieuw kunnen worden gedaan. Het is belangrijk om deze gegevens beschikbaar te maken voor toekomstig onderzoek, bijvoorbeeld naar klimaatverandering. Voor de technische universiteiten was het zinvol om dit samen te doen. Het bespaarde kosten om de infrastructuur te delen, maar het bood ook de mogelijkheid kennis uit te wisselen. Dit is hoe 4TU.ResearchData is ontstaan.

Wat doen jullie?
Onze voornaamste taak is het delen van kennis, expertises en ervaringen op het terrein van datamanagement. En daar een efficiënte, goed werkende oplossing voor bieden in de vorm van een centraal datapunt; de data repository die inmiddels duizenden datasets bevat! Je kunt denken aan datasets op het gebied van luchtvaart; data die de ‘flow’ op luchthavens in kaart brengen of data die iets zeggen over de materialen van nieuwe vliegtuigen. Welke materialen zijn het best bestand tegen spanning en welke zijn economisch het meest interessant?

"Het zou heel stom zijn om niet samen te werken!"
Marta Teperek

Wat is de winst om dit in 4TU-verband te doen?
We delen best practices en ervaringen en helpen elkaar. Het is beter voort te bouwen op eerdere kennis dan steeds het wiel uit te vinden. En daarnaast, het type onderzoek en methodologieën van onderzoekers en van partnerorganisaties zijn zo gelijk aan elkaar. Het zou stom zijn om niet samen te werken! Deze coronatijd waarin kennis digitaal gedeeld wordt, kan dat nog verder versnellen.

Is er vanuit de data gezien ook nog een voordeel om met vier TU’s samen op te trekken?
Ja zeker! De gegevens worden nu vaak nog op verschillende plaatsen opgeslagen. Door het aanbieden van een centraal datapunt, ondersteund door een excellente infrastructuur, kunnen bestaande data, die voor één doel zijn gecreëerd, worden hergebruikt voor volledig nieuw onderzoek, wat leidt tot nieuwe onderzoeksresultaten.

Wie zijn jullie doelgroepen?
4TU.ResearchData is er in de eerste plaats voor de onderzoekers van de technische universiteiten. Zij kunnen in de repository de data uploaden, delen en hergebruiken. Maar ook onderzoekers buiten 4TU.ResearchData en uit het buitenland weten de repository te vinden.

Daarnaast worden de data voor onderwijsdoeleinden gebruikt. Data professioneals kunnen met de datasets laten zien hoe je data kunt delen en hoe je ze vindbaar kunt maken. In de repository worden de datasets automatisch voorzien van een Digital Object Identifier (DOI) waarmee de zichtbaarheid, vindbaarheid en citeerbaarheid wordt bevorderd.

Waar ligt uw focus als directeur van 4TU.ResearchData?
Het archiveren van data en het aanbieden van een excellent werkende technische infrastructuur is de ene kant van ons werk. De andere kant waarmee ik aan de slag wil, is het opbouwen van een netwerk waarin de kennis over datamanagement gedeeld wordt. Iedere instelling heeft een aantal datastewards die de onderzoekers trainen op datamanagement. Vaak staan die er alleen voor. Door best practices te delen en hen opleiding te bieden, verspreidt de kennis zich beter. ‘Train the trainer’ is ons motto. Door de trainer van de laatste kennis te voorzien, bijvoorbeeld hoe je de data FAIR -Findable – Accessible – Interoperable en Reusable- kunt maken, breng je het niveau van datamanagement omhoog. Zo stellen we per 1 oktober een Community Manager aan om hier nog meer energie in te steken.

"Als je onderzoekers beloont voor het goed opslaan van hun data, dan zullen ze daartoe eerder toe geneigd zijn. Ook daar ligt voor ons een rol in het aanmoedigen en faciliteren van de discussie hierover."

De meeste onderzoekers hebben het doel zo veel mogelijk artikelen in gerenommeerde tijdschriften te publiceren. Maar onderzoek is veel meer! Achter het onderzoek schuilen heel veel dossiers, observaties en data op computers. Na vier jaar onderzoek schrijven onderzoekers meestal een samenvatting in een tijdschriftpublicatie en dat is de heilige graal. Maar dat toont niet de adem van al het onderzoek dat je deed, hoe hard je werkte, hoe rijk jouw datasets zijn … Ik geloof in het kapitaal van de data achter het onderzoek. Er is veel meer dan de publicatie van dat ene artikel’.

Door het systeem anders in te richten en de onderzoeker niet alleen te beoordelen op het aantal publicaties, maar ook op de rijkheid van zijn de datasets, beloon je goed datamanagement. En worden datasets toegankelijk voor toekomstige onderzoekers.

Het gaat gelukkig de goede kant op. Organisaties als NWO of de VSNU kijken hoe het academische beloningssysteem anders georganiseerd kan worden en ook de European Open Science Cloud (EOSC) stimuleert dit. Om de EOSC werkelijkheid te maken voor alle onderzoekers in Europa, is het cruciaal dat zij op een FAIR manier met hun data omgaan. Hier zal veel inspanning en tijd voor nodig zijn waarvoor onderzoekers op een redelijke manier voor zouden moeten worden beloond.

En hoe serieus spelen privacy en competitie een rol bij het wel of niet data delen?
Dat is zeker iets dat speelt. Onderzoekers werken misschien met privacy- of commercieel gevoelige gegevens. Daar helpt het om onderzoekers te voorzien van instrumenten, training en ondersteuning om hun data 'zo open mogelijk, zo gesloten mogelijk' te maken. Ik ben blij te kunnen zeggen dat onze repository sinds augustus een functionaliteit heeft waarbij de toegang tot een dataset kan worden beperkt. 

"Een actueel resultaat is de Combat COVID equipment app, die
onderzoekers en studenten van de TU Delft bouwden in samenwerking met andere partijen."

Zijn er mooie resultaten te noemen die toe te schrijven zijn aan het jullie data management diensten?
Ja te veel om op te noemen. Leuk om een voorbeeld uit te lichten waar een urgente vraag lag. Onderzoekers en studenten van de TU Delft bouwden in samenwerking met andere partijen de Combat COVID equipment app. Deze app is gebouwd in de context van het tekort aan materialen zoals ventilatoren, aan het begin van de uitbraak van de pandemie. Het ging om het opbouwen van een database met informatie over verschillende hardware die kan helpen de COVID-19 pandemie aan te pakken. Het is cruciaal deze informatie op de juist wijze te documenteren. De EOSC zag de meerwaarde en heeft het team met een bedrag van 40.000 euro beloond om verder te helpen met de hardware documentatie. Dit gebaar benadrukt het belang dat er internationaal wordt gegeven aan de discipline van datamanagement.

Ik zag andere voorbeelden op jullie site. Heel inspirerend om te lezen welk profijt verschillende type onderzoekers van jullie repository hebben.
Ja mensen die ze willen nalezen kunnen naar de speciale pagina met al deze voorbeelden.

Wat is uw eigen vakgebied en wat is de toepassing daarvan?  
Mijn PhD onderzoek zat in de hoek van de epigenetics, waarbij ik zeldzame kikkersoorten bestudeerde. Om nieuwe tools voor bestuderen te ontwikkelen, werkten we samen met onderzoekers uit de hele wereld. We deelden genomic data voordat ze werden gepubliceerd om de hele groep een voorsprong te geven in het onderzoek naar deze kikkers. Als PhD student zag ik al de kracht van data, en dat dit veel belangrijker was dan alleen dat eindartikel met samenvatting, als afsluiting van de PhD periode.

Hielp de cultuur van de onderzoeksgroep daar ook bij?
Ja, dat droeg zeker bij. Het was in mijn onderzoeksveld gebruikelijk om de data te delen zodat anderen verder konden bouwen en ontdekken. Delen was zo erg de sleutel, dat inspireerde mij enorm. Daarbij waren in mijn vakgebied de grote machines de drijver voor het ontwikkelen van standaarden voor data delen.  Deze machines konden helpen de genetische codes te ontrafelen voor een heel diersoort. Wat deden we met deze enorme datasets? Formaten maken om ze te delen was de eerste stap. Verschillende partijen werkten samen op deze uitdaging. Repositories, infrastructuur aanbieders, onderzoekers, uitgevers van tijdschriften. Allemaal werkten ze samen om dit voor de community te realiseren.

Dat gevoel van interuniversitair samenwerken startte dus al heel vroeg in uw onderzoekscarrière
Ja, als je mij vraagt waar het plezier van deze onderzoeksperiode hem in zat, dan was het meer dan de inhoud van het onderzoek, dat gevoel van samen data opbouwen en delen. Het belang en ook het plezier dat ik daar heb meegemaakt, neem ik mee en helpt mij enorm in mijn functie als directeur van 4TU.ResearchData.

BIOGRAFIE

Marta Teperek is sinds juni 2020 directeur van 4TU.ResearchData en hoofd van de Research Data Services bij TU Delft Library. Tussen 2017 and 2020 was zij werkzaam als Data Stewardship Coördinator bij de TU Delft.

Marta bouwde een team van data stewards op, die bij elke faculteit van de TU Delft zijn aangesteld om disciplinaire ondersteuning te bieden op het gebied van datamanagement. Voordat ze bij de TU Delft kwam, leidde ze de oprichting en het beheer van data-ondersteunende diensten aan de Universiteit van Cambridge (2015-2017). Tijdens haar verblijf in Cambridge heeft ze ook het programma Data Champions en de Open Research Pilot geïnitieerd en begeleid. Marta Teperek is onderzoeker door opleiding en voltooide haar PhD in moleculaire biologie en genomics aan de Universiteit van Cambridge in 2014.

Twitter:@martateperek
ORCiD: https://orcid.org/0000-0001-8520-5598