Доказательства свидетельствуют о наличии серьезных недостатков в применении машинного обучения в научных исследованиях. Эта проблема былаdentво многих научных работах, охватывающих различные области, однако группа из 19 исследователей из разных дисциплин опубликовала руководство по ответственному использованию машинного обучения в науке под руководством Арвинда Нараянана и Саяша Капура, оба из которых являются специалистами по информатике в Принстонском университете.
Рекомендации по применению ИИ в научных исследованиях
В своем отчете авторы заявляют, что их работа направлена на выявление проблемы достоверности, которая может охватить всю исследовательскую экосистему. Нараянан утверждает, что не существует универсальных стандартов для защиты целостности методов исследования, а машинное обучение в настоящее время применяется во всех научных областях, поэтому это может стать более серьезной проблемой, чем кризис воспроизводимости, наблюдавшийся в социальной психологии десять лет назад. Он называет нынешний кризис кризисом воспроизводимости. Как сказал Нараянан,
«Когда мы переходим от традиционных статистических методов к методам машинного обучения, появляется гораздо больше способов навредить себе»
Источник: AzoAI .
Однако авторы из области исследований в сфере здравоохранения, информатики, социальных наук и математики matic сообщают некоторые позитивные новости. Они утверждают, что набор передовых методов может помочь решить существующую проблему. Аспирант-информатик dent , который фактически организовал исследовательскую работу по созданию контрольного списка для научной деятельности и работает с Нараянаном, сказал, что проблема носит системный matic , и решение для нее также должно быть matic .
Возможно, темпы публикаций замедлятся, но точность информации повысится
Цель нового, основанного на консенсусе, контрольного списка – обеспечить достоверность исследований, использующих машинное обучение. Развитие науки основано на воспроизводимости результатов и на том факте, что утверждения должны бытьdentподтверждены. Без этого невозможно проводить новые научные исследования на надежной основе, опираясь на предыдущие работы, и вся система теряет доверие.
Новый контрольный список требует от исследователей предоставления подробной информации об использовании моделей машинного обучения, поскольку они обязаны предоставить наборы данных, использованные для обучения модели, ее код, аппаратные возможности, план пилотного проекта и цели исследования, а также любые ограничения, касающиеся результатов исследования, поскольку акцент делается на прозрачность.
Хотя существует вероятность того, что ужесточение требований этих новых стандартов может замедлить публикацию новых научных работ, исследователи, участвующие в инициативе, все же считают, что принятие этих правил будет способствовать увеличению темпов открытий и инноваций в целом.
Одна из авторов исследования, Эмили Кантрелл, аспирантка dent университета, сказала, что темпы научных исследований важны, но, обеспечивая качество публикуемых статей , можно рассчитывать на то, что будущие исследования будут опираться на эти данные. Капур также отмечает, что ошибки негативно сказываются на коллективном воздействии и приводят к потере времени, что, в свою очередь, влечет за собой финансовые затраты, поскольку препятствует финансированию и инвестициям в научные исследования.

