Цифрові інструменти пропонують дедалі більше можливостей для спільної науки, яка вирішує глобальні виклики, але надто часто цінні дані, необхідні для інформування про цю роботу, залишаються недоступними для дослідників.
Дані можуть бути поховані в колекції, яку неможливо знайти, закодовані унікальною термінологією або таким чином, що їх неможливо легко змусити працювати з іншими даними, або непридатними для використання, оскільки вчені не можуть перевірити деталі самих даних, наприклад їх походження чи умови користування.
«Ця проблема така ж стара, як і сама наука», — пояснює Саймон Ходсон, виконавчий директор Комітет з питань даних (CODATA) Міжнародної наукової ради (ISC), яка працює над покращенням доступності та зручності використання даних.
Ці проблеми з даними можуть обмежити можливості дослідження та втрачати час і гроші. Відповідно до дослідження опублікованому Європейською комісією у 2018 році, очищення неякісних даних, щоб зробити їх придатними для використання, є, безумовно, найбільш трудомістким завданням для середньостатистичного проекту аналізу даних і може становити 80% від загального обсягу зусиль.
Вкладка Всесвітня ярмарок проект, спільний між CODATA та Міжнародною науковою радою (ISC), взявся за цю проблему. Проект мав на меті «змусити дані працювати», заохочуючи прийняття ЯРМАРОК (Findable, Accessible, Interoperable, Reusable) принципи даних, що сприяють кращому управлінню даними та дослідженням за допомогою машинного аналізу.
Після завершення проекту CODATA прагне продовжити та розширити ініціативу WorldFAIR+, який включатиме нових партнерів та міжнародні тематичні дослідження, які втілять на практиці уроки, отримані протягом дворічного проекту WorldFAIR.
Нова фаза буде структурована як «федерація» проектів, забезпечуючи рамки для співпраці, де науковці зможуть ділитися технічним досвідом і розвивати роботу один одного. CODATA запрошує потенційних партнерів запропонувати тематичні дослідження та взяти участь.
Початкова робота CODATA, яка стала основою для WorldFAIR, почалася в 2017 році за підтримки ISC і фінансування від Китайська асоціація науки і техніки. Ця формувальна робота включала семінари, які призвели до розробки трьох тематичних досліджень, кожне з яких було зосереджено на використанні даних у певній галузі: інфекційні захворювання, міське планування та зменшення ризику стихійних лих. На початкових етапах проекту CODATA також розробила ключове партнерство з Data Documentation Initiative (IDD).
Спираючись на ці зусилля, CODATA забезпечено фінансування від Європейської комісії для WorldFAIR. Проект підтримав 11 тематичних досліджень, які вивчають використання даних у багатьох галузях, включаючи культурну спадщину, наноматеріали та науку про океан. Тематичні дослідження охоплювали 13 країн, включаючи Бразилію, Кенію, Нову Зеландію та США
Уроки, отримані в рамках проекту, лягли в основу 11 рекомендації щодо політики покращити використання та доступність даних для науки та призвело до розвитку Система міждоменного взаємодії (CDIF), який має на меті зробити дані з різних наукових галузей більш сумісними.
У той же час CODATA опублікувала новий Термінологія управління даними досліджень, який містить чіткі визначення термінів, що використовуються в галузі; ці терміни тепер опубліковано як машинозчитуваний "ЧЕСНА лексика», і невдовзі він буде доступний онлайн у зручнішому для читання форматі.
Кожне з 11 прикладів також породило свої власні звіти та вказівки для використання даних з метою надання рекомендацій, які стосуються різних галузей науки.
Один із розглянутих прикладів сільськогосподарське біорізноманіття, зосереджуючись на запиленні – галузі, де модель для опису та категоризації даних все ще визначається. Спираючись на дані та внески колег з усього світу, дослідники з півдюжини країн – Бразилії, Кенії, Аргентини, США, Великобританії та Нідерландів – розробили повне керівництво та набір інструментів для даних про взаємодію рослин і запилювачів.
Це надзвичайно специфічна тема, але актуальна майже скрізь, для вчених у будь-якій кількості різних галузей, які тепер можуть скористатися уніфікованим, стандартним способом підходу до даних, що полегшує роботу на основі роботи колег і прискорює їх власні дослідження.
«Перехід від різноманітних підходів і відокремлених ініціатив до широкодоступних ЧЕСНИХ даних про взаємодію рослин і запилення для вчених і осіб, які приймають рішення, дозволить розробити інтегративні дослідження, які покращать наше розуміння біології, поведінки, екології, фенології та еволюції видів», пишуть дослідники, які працювали над кейсом.
В іншому конкретному дослідженні дослідники розглянули зниження ризику лих. «Оскільки зміна клімату та збільшення чисельності населення, ймовірно, посилять серйозність і частоту стихійних лих, потреба в надійних даних, щоб інформувати наші відповіді, стає все більш критичною», – пишуть вони.
Вчені та національні та міжнародні агенції, які працюють над ризиком лиха, дивляться в минуле, щоб оцінити вплив можливих майбутніх подій і зрозуміти, як пом’якшити наслідки та відновити їх після цього. Вони також опираються на дані, які постійно надходять від датчиків на землі та супутників, які надходять із державних і приватних джерел.
Але в дослідженні дослідникам було важко отримати інформацію, необхідну для точного оцінювання, оскільки більшість відповідних даних не відповідає принципам FAIR data. Часто відсутня важлива інформація, як-от кількість постраждалих під час катастрофи чи швидкість розгортання події. В інших випадках національні органи влади використовують власні методи для розрахунку ключових даних, не демонструючи свою роботу, що ускладнює порівняння для інших.
Грунтуючись на своїх обширних дослідженнях, група тематичних досліджень надала низку рекомендацій щодо практик, які мають спростити прийняття політичних рішень на основі фактичних даних у цій дедалі актуальнішій сфері – «фундаментальний крок до створення безпечніших, більш стійких спільнот і націй». вони пишуть.
Дослідники Міжнародного союзу теоретичної та прикладної хімії (IUPAC) взяв приклад із вивчення того, як дані та термінологію, пов’язану з хімічними речовинами, можна зробити зручнішими як для людей, так і для машин.
IUPAC має більш ніж столітній досвід скликання хіміків для визначення та стандартизації того, як науковці в цій галузі працюють і говорять про хімікати. Але оскільки цифрові інструменти – і дедалі більше штучний інтелект і пов’язані з ним технології – пропонують нові способи роботи, тематичне дослідження IUPAC розглядало, як ці стандарти можна зробити ефективнішими та полегшити іншим вченим повторне використання хімічних даних.
Одним із результатів дослідження був «кулінарну книгу», відкритий ресурс інструкцій, який допоможе науковцям, зокрема студентам, викладачам і працюючим професіоналам, зрозуміти, як працювати з хімічними даними та як зробити власні дані більш доступними для інших.
У проекті також описано новий амбітний відкритий цифровий протокол, який міг би об’єднати разом багато різних глобальних хімічних баз даних, дозволяючи вченим знаходити та отримувати доступ до даних за допомогою одного запиту, а також перевіряти, чи їхні власні дані машинозчитувані.
Ходсон пояснює, що зібрання вчених, щоб обговорити дані, які вони створюють, і спробувати зрозуміти, як інші працюють із їхніми власними даними, відкрило очі.
І, встановлюючи чіткі стандарти та визначення, вчені не тільки допомагають поточним дослідженням, але й полегшують наступним поколінням розвивати свою роботу – можливо, у спосіб, про який оригінальні автори, можливо, ніколи не думали, додає він.
«У WorldFAIR ми виявили, наскільки захоплюючим і корисним було просто вести ці бесіди, зібрати всі тематичні дослідження в кімнату, щоб вони говорили про свої дані, що вони роблять, як це працює і як вони це описують. – і в деяких випадках виявлення зв’язків, про які ми не обов’язково уявляли заздалегідь», – каже він.
Зображення на Тейлор Вік on Unsplash.
відмова
Інформація, думки та рекомендації, представлені в наших гостьових блогах, належать окремим авторам і не обов’язково відображають цінності та переконання Міжнародної наукової ради.