Z danymi badawczymi - czyli takimi danymi, które zostały wytworzone, zebrane lub opisane na potrzeby prowadzonych badań naukowych - mają do czynienia prawie wszyscy aktywni naukowcy. Zbiory danych zaczynają powstawać zwykle już na początku projektu badawczego i następnie poddawane są różnym analizom i interpretacjom. Wyniki analiz są potem publikowane w postaci prac naukowych - artykułów i książek - a co dzieje się z danymi? Jak są opisywane i dokumentowane, gdzie są przechowywane, komu i w jaki sposób są udostępniane, czy i jak długo będą przechowywane po zakończeniu badań? Wszystkie te pytania wchodzą w zakres zarządzania danymi badawczymi (ang. research data management, RDM).
O tym, jak istotne jest świadome, przemyślane zarządzanie danymi wie każdy naukowiec, który kiedykolwiek próbował skorzystać ze zbioru danych, które powstały kilka lat wcześniej. Jest to trudne nawet wtedy, gdy mamy do czynienia z własnymi danymi, a jeżeli dodatkowo są to dane zebrane i opisane przez innych badaczy, może się okazać, że skorzystanie z nich jest niemożliwe, bo nie jesteśmy w stanie ich zrozumieć. Właściwe zarządzanie danymi badawczymi jest więc niezbędne, aby wytwarzane dane naukowe można było wykorzystać ponownie w przyszłości.
W warsztatach z zarządzania danymi badawczymi, które odbyły się 22 czerwca 2015 w siedzibie ICM UW w Warszawie, udział wzięło 30 osób z różnych części Polski, z różnych dziedzin nauki i na różnych etapach kariery naukowej. Warsztaty prowadził Kevin Ashley, dyrektor Digital Curation Centre (DCC) - brytyjskiego centrum kompetencji w zarządzaniu informacją cyfrową, które prowadzi działania edukacyjne w dziedzinie zarządzania danymi badawczymi dla całej brytyjskiej społeczności akademickiej. Podkreślał on wielokrotnie, że właściwe zarządzanie danymi jest korzystne przede wszystkim dla samych autorów danych, gdyż bardzo ułatwia bieżące korzystanie z nich. Jednocześnie ułatwia również późniejsze publiczne udostępnienie danych w postaci pozwalającej na ich cytowanie, dzięki czemu dane mogą zostać ponownie wykorzystane, a ich autorzy zyskują cytowania naukowe.
W czasie warsztatów można było dowiedzieć się, jakie pytania należy sobie postawić w związku z wytwarzaniem i procesowaniem danych naukowych. Pierwsza część poświęcona była przygotowywaniu planów zarządzania danymi (ang. data management plan, DMP). Prowadzący zwracał uwagę, że z większością pytań zawartych w typowym planie można sobie łatwo poradzić pod warunkiem, że zostaną rozważone na początku projektu badawczego, a nie na jego późniejszych etapach - wtedy uporządkowanie danych może się okazać bardzo czasochłonne. Omawiane były także kwestie selekcjonowania danych: co brać pod uwagę przy decydowaniu, które dane powinny być długotrwale archiwizowane oraz które mogą być udostępnione w sposób otwarty. W jakich sytuacjach przechowywać dane surowe, w jakich dane procesowane, a w jakich jedne i drugie? Jaka dodatkowa dokumentacja powinna towarzyszyć zbiorom danych, a z czego można zrezygnować? Jeżeli z jakichś względów część danych nie będzie przechowywana albo nie będzie udostępniana, należy udokumentować tę decyzję i jej uzasadnienie.
Zainteresowanie uczestników wzbudziły kwestie prawne związane z danymi badawczymi. Kto ma prawo decydować o przechowywaniu lub zniszczeniu danych, albo o zasadach, na jakich zostaną udostępnione? W jakich sytuacjach dane naukowe muszą zostać udostępnione publicznie, a w jakich muszą pozostać zamknięte? Jakie prawa mają osoby, które były badane w ramach projektu naukowego (np. medycznego lub socjologicznego)? Na co zwracać uwagę przy licencjonowaniu danych badawczych?
Wiele materiałów edukacyjnych dotyczących wszystkich kwestii omawianych w trakcie warsztatów można znaleźć na stronach DCC. Wszystkich zainteresowanych uczestnictwem w naszych warsztatach z zarządzania danymi badawczymi informujemy, że jesienią planowane są dalsze edycje i zachęcamy, by śledzili informacje na ten temat na naszej stronie.