Newsletter
Aktualności

Relacja z międzynarodowej konferencji “Open Research Data: Implications for Science and Society”

Otwarte udostępnianie danych badawczych to kolejny ważny krok w stronę otwartości w nauce. Standardy, strategie i narzędzia udostępniania danych badawczych w sposób umożliwiający ich dalsze wykorzystanie były tematem międzynarodowej konferencji “Open Research Data: Implications for Science and Society”, zorganizowanej przez Platformę Otwartej Nauki.  

W trakcie wydarzenia, które odbyło się w Warszawie w dniach 28-29 maja 2015 r., zaproszeni eksperci, reprezentujący różne instytucje naukowe, mówili zarówno o korzyściach, jakie przynosi dzielenie się danymi, jak i o wyzwaniach, jakie się z tym wiążą. Prezentowali także rozwiązania umożliwiające efektywne udostępnianie danych badawczych. Otwierający konferencję prof. Włodzisław Duch, sekretarz stanu w MNiSW, mówił: “Musimy myśleć, jak promować otwartą naukę, jak znajdować poparcie dla otwierania danych, jak promować to w różnych obszarach nauki, szczególnie, że w każdym z nich są specyficzne wyzwania”. Zaznaczył też, że dane w różnych dziedzinach nauki są bardzo zróżnicowane, trudno więc z punktu widzenia Ministerstwa proponować szczegółowe rozwiązania w tym zakresie. “Raczej musimy zachęcać naukowców i podkreślać, że publiczne środki powinny prowadzić do rezultatów, z których będzie mogło korzystać społeczeństwo” - skonkludował minister.

Komisja Europejska, która od wielu lat wspiera otwarty dostęp do publikacji i przeznacza środki zarówno na budowę infrastruktury, jak i edukację dotyczącą otwartości w nauce, zobowiązała naukowców korzystających z europejskich funduszy na badania do otwartego udostępniania publikacji naukowych. Obecnie KE realizuje również Pilotaż Otwartych Danych Badawczych, obejmujący wybrane obszary programu Horyzont 2020. “Komisja Europejska chce dążyć do optymalnego wykorzystania wyników badań finansowanych ze środków publicznych.  W tym celu chcemy zapewnić otwarty dostęp zarówno do recenzowanych publikacji naukowych, jak i do danych badawczych” - mówił w wystąpieniu otwierającym konferencję Jean-Claude Burgelman, szef Science Policy Foresight and Data Unit w Komisji Europejskiej.

Dlaczego warto dzielić się danymi?

Otwarte dane badawcze to takie zbiory danych, które powstały jako rezultat  pracy naukowej i zostały udostępnione do bezpłatnego, powtórnego użycia, bez barier prawnych i technicznych. Otwarte dane można wykorzystać do celów innych niż te, dla których były gromadzone w trakcie konkretnego projektu badawczego. Umożliwia to dalsze odkrycia naukowe, w tym rozwój badań opartych na eksploracji danych. Instytucje finansujące badania oczekują także, że otwartość danych zwiększy efektywność wykorzystania budżetu grantowego - korzystanie z istniejących już wyników oraz informacja o zrealizowanych projektach pozwolą uniknąć dublowania badań, dzięki czemu naukowcy zaoszczędzą czas i pieniądze.
Do badaczy właśnie skierował swoje wystąpienie Kevin Ashley, dyrektor brytyjskiego Digital Curation Center, instytucji powołanej w celu szerzenia dobrych praktyk w zakresie archiwizacji i udostępniania danych. Podkreślał, że dostępne w sposób otwarty dane zwiekszają liczbę cytowań - zarówno samych danych, jak i powiązanych z nimi publikacji.

Co jest potrzebne, aby usprawnić wymianę danych?

Kolejny z mówców, Mark Parsons z Research Data Alliance, mówił o tym, jakie warunki muszą być spełnione, aby usprawnić dzielenie się danymi badawczymi. Infrastruktura dla otwartych danych jest bardzo ważna, ale - jak podkreślał -  nie można jej sprowadzać do samej tylko technologii: sprzętu i oprogramowania. RDA - powstała przed zaledwie dwoma laty organizacja zrzeszajaca już około 3000 członków z całego świata, wśród których są zarówno instytucje, jak i indywidualni naukowcy - stawia sobie za cel zwiększanie innowacyjności poprzez wymianę danych naukowych. Zdaniem Parsonsa infrastruktura to relacje, interakcje i połączenia pomiędzy ludźmi, technologiami i instytucjami. Aby umożliwić swobodny przepływ danych, trzeba zapewnić odpowiednie warunki: określić  polityki udostępniania danych w instytucjach naukowych, opracować specyfikacje i standardy, które zapewnią interoperacyjność danych i ułatwią ich powtórne użycie, a także wypracować zasady cytowania zbiorów danych.

Pierwszą sesję, poświęconą strategiom, politykom i wybranym praktykom udostępniania danych, otworzyło wystąpienie Giulii Ajmone-Marsan z OECD, która przedstawiła kluczowe wnioski ze swojej pracy nad niepublikowanym jeszcze raportem "Making Open Science Happen", poświęconym strategiom otwartości w nauce. Raport pokazuje, że szczeblach krajowych nadal dominują inicjatywy oddolne. O ile jednak niektóre kraje wprowadzają już strategie otwartego dostępu do publikacji naukowych, to w dziedzinie danych jest znacznie więcej do zrobienia. W kolejnych wystąpieniach tej sesji prezentowane były przykłady inicjatyw, polityk i praktyk realizowanych przez poszczególne instytucje naukowe, takie jak Uniwersytet w Cambridge, Leibniz Information Centre for Economics w Hamburgu/Kilonii, Politechnikę Gdańską, dostawców usług dla nauki: wydawnictwo Elsevier i firmę Thomson Reuters, a także przez polską Bibliotekę Narodową, która przedstawiła bibliotekę cyfrową Polona.

Druga sesja konferencji dotyczyła narzędzi i metodologii służących otwieraniu danych, które prezentowali uczestnicy z wielu krajów europejskich, w tym także z Polski. Sesję otworzył wykład Daniela Hooka z Figshare - popularnego również w Polsce serwisu umożliwającego naukowcom deponowanie wszelkich materiałów naukowych, w tym także danych. Wśród zaprezentowanych rozwiązań znalazło się narzędzie do udostępniania danych z obszaru nauk o życiu stosowane na Politechnice Federalnej (ETH) w Zurichu oraz metodologia służąca formalnemu opisowi procesów badawczych powstająca na  Uniwersytecie Sapienza w Rzymie. Przedstawiciel Politechniki w Madrycie zwracał uwagę, że nie wystarczy samo udostępnianie danych - ważna jest również archiwizacja procedur badawczych. Spośród polskich narzędzi zaprezentowano BASE, bazę danych biogeograficznych i oceanograficznych współtworzoną przez Instytut Oceanologii PAN, powstającą w ICM bazę danych pochodzących z symulacji kosmologicznych COCOS, oraz RepOD - repozytorium danych badawczych przeznaczone dla polskich naukowców, tworzone przez Platformę Otwartej Nauki ICM.  Standaryzacja danych opisujących cechy fenotypu roślin była tematem wystąpienia przedstawiciela Instytutu Genetyki Roślin PAN. Przegląd polskich narzędzi i metodologii zakończyła prezentacja rozwiązania opracowanego w Wyższej Szkole Informatyki i Zarządzania z siedzibą w Rzeszowie, które umożliwia automatyczny monitoring, analizę i wizualizację otwartych danych.

Nowe możliwości i nowe wyzwania

“Cyfrowy i sieciowy świat zmienia reguły gry” mówił rozpoczynając ostatnią część konferencji Mark Thorley, reprezentujący CODATA i Natural Environment Research Council UK. Według Thorleya w świecie, gdzie każdy może wszystko umieścić w sieci, powszechne stało się oczekiwanie, że informacja powinna być dostępna natychmiast i za darmo, a otwartość staje się nową normą. Efektywne udostępnianie danych - zarówno naukowcom, jak i firmom i innym zainteresowanym użytkownikom - wymaga rozwiązań prawnych, które będą zrozumiałe i łatwe w zastosowaniu, a jednocześnie umożliwią wykorzystanie danych w różnych jurysdykcjach. Dlatego wśród omawianych wyzwań związanych z otwieraniem danych znalazły się bariery prawne, omówione w wystąpieniu przedstawiciela Platformy Otwartej Nauki, oraz kwestie prawne związane z komercjalizacją, które przedstawiła badaczka z Uniwersytetu w Białymstoku.

Decyzji o upublicznieniu danych badawczych często towarzyszy pytanie, kto, gdzie i w jaki sposób wypowiada się na ich temat w sieci. Rozwiązanie, które ułatwia prowadzenie tego typu monitoringu, przedstawiła brytyjska firma Altmetric.

Przyszłość otwartych danych

W czasach, kiedy w rozwoju nauki coraz większe znaczenie ma eksploracja danych, przed instytucjami badawczymi stają nowe wyzwania związane z tworzeniem polityk ich udostępniania, budowaniem infrastruktury oraz zmianą dotychczasowych praktyk związanych z publikowaniem. Tematy te przewijały się we wszystkich sesjach konferencyjnych, mówił o nich w swoim wystąpieniu również Tim Smith z CERN. Jego zdaniem podstawą współpracy w nauce jest dostęp do narzędzi i materiałów, które mogą być powtórnie wykorzystane przez innych naukowców. Jako przykład rozwiązania, które wspiera dzielenie się danymi, zaprezentował ZENODO - stworzone przez CERN i rekomendowane przez Komisję Europejską repozytorium, w którym można deponować między innymi dane badawcze, aby były widoczne i dostępne dla wszystkich.

Jak stwierdził Mark Thorley, w bliskiej przyszłosci zarządzanie danymi musi stać się częścią praktyki badawczej. Aby jednak móc wykorzystać potencjał otwierania danych dla biznesu i rozwoju innowacji, nie wystarczy samo udostępnienie danych, nawet jeśli będą miały wysoką jakość i zostaną udostępnione w sposób umożliwiajacy ich powtórne użycie. Konieczne będzie podjęcie działań ukierunkowanych na potrzeby biznesu, jak na przykład tworzenie hubów z danymi. Wybiegając w przyszłość, do roku 2030, Martin Hamilton, futurysta z Jisc - niekomercyjnej organizacji, która zajmuje się upowszechnianiem cyfrowych technologii w brytyjskiej nauce i edukacji - przedstawiał potencjalne scenariusze zmian w nauce i biznesie, związane z rozwojem otwartych danych. Prezentował nowe modele współpracy nauki z biznesem, alternatywne sposoby finansowania projektów naukowych, oraz pokazywał, jakie inicjatywy społeczne mogą działać w oparciu o wykorzystanie danych i wspólną pracę nad nimi.

Konferencja zorganizowana została przez Platformę Otwartej Nauki. Objęły ją patronatami: Research Data Alliance - organizacja powołana przez Komisję Europejską, US National Science Foundation, National Institute of Standards and Technology, oraz Australian Government’s Department of Innovation; OpenAIRE - projekt zainicjowany przez KE i mający na celu stworzenie infrastruktury dla otwartej nauki i promowanie otwartych standardów w Europie; CODATA, międzynarodowa, interdyscplinarna rada naukowa, której celem jest poprawa jakości i dostępności danych dla nauki i techniki; OECD oraz polskie Ministerstwo Nauki i Szkolnictwa Wyższego.

Patronatu medialnego udzieliły konferencji serwis informacyjny “PAP Nauka w Polsce” oraz “Forum Akademickie”.