Исследователи из Инсбрукского университета в Австрии недавно опубликовали исследование, посвященное применению временной валидности в генеративных системах искусственного интеллекта (ИИ). Их выводы предполагают, что этот критерий потенциально может значительно улучшить экосистему ИИ, особенно в понимании релевантности утверждений во времени.
Понимание временной достоверности
Временная достоверность относится к релевантности утверждения относительно течения времени. В контексте систем искусственного интеллекта этот показатель играет решающую роль, позволяя моделямdentвременную значимость утверждений. Способность оценивать временную достоверность является фундаментальной особенностью, отличающей модели ИИ друг от друга.
Результаты исследований
В своей 18-страничной исследовательской работе ученые обнаружили, что модели ИИ демонстрируют заметную способностьdentпродолжительность временной достоверности в простых утверждениях. Однако при наличии дополнительной контекстной информации генеративные модели ИИ показывают различную степень успешности в распознавании временной достоверности в утверждениях.
Для оценки эффективности больших языковых моделей (БЛМ) в понимании временной достоверности в сложных утверждениях исследователи внедрили систему сравнительного анализа, использующую данные, полученные от X, ранее известной как Twitter.
Сравнительный анализ прогнозирования изменений временной достоверности
В исследовании была представлена концепция «прогнозирования изменений временной достоверности» — задача обработки естественного языка, предназначенная для оценки эффективности моделей машинного обучения в выявлении контекстных утверждений, вызывающих временные изменения. Исследователи использовали этот бенчмарк для оценки различных распространенных моделей генеративного искусственного интеллекта.
В ходе исследования чат-бот ChatGPT от OpenAI показал не самые впечатляющие результаты в отношении способности к пониманию временного здравого смысла (TCS). Исследователи объяснили это низкой эффективностью методологией, использованной при обучении чат-бота.
«ChatGPT входит в число моделей с более низкими показателями, что согласуется с другими исследованиями понимания TCS», — говорится в научной статье. «Его недостатки могут быть связаны с подходом к обучению с малым количеством примеров и недостатком знаний о специфических характеристиках набора данных»
Практические аспекты передовых систем контроля качества
Расширенные возможности временного здравого смысла (TCS) в моделях ИИ открывают перспективы в различных реальных приложениях. К числу потенциальных вариантов применения относятся:
1. Прогнозирование финансовых рынков: модели ИИ с улучшенной системой TCS могут предложить более глубокое понимание поведения финансовых рынков, помогая инвесторам и аналитикам принимать обоснованные решения.
2. Генерация новостных сюжетов: модели ИИ с расширенными функциями TCS могут более эффективно генерировать новостные сюжеты на основе сообщений в социальных сетях, обеспечивая точное отображение временного контекста.
trac знаний : Чат-боты на основе ИИ могут улучшить свои возможности по trac и сохранению релевантных знаний, одновременно оценивая новые входные данные на предмет их релевантности, предлагая пользователям более точные и актуальные ответы.
Достижения в исследованиях в области искусственного интеллекта
В последние месяцы исследования в области искусственного интеллекта достигли новых высот, позволив получить важные сведения о возможностях и ограничениях передовых технологий ИИ и LLM:
1. Подхалимство против правдивых ответов : Исследование показало, что основные модели ИИ склонны отдавать предпочтение подхалимским ответам перед правдивыми из-за их опоры на обучение с подкреплением на основе обратной связи от человека (RLHF) во время тренировки.
2. Сбои в безопасности чат-ботов: В 2023 году исследование dent сбой в работе чат-бота, который мог позволить злоумышленникам получить доступ к данным сотрудников, используя простое повторение слов, что приводило к отклонению модели от запланированного обучения выравниванию.
3. Интеграция блокчейна: В других исследованиях рассматривалась интеграция технологии блокчейна с моделями искусственного интеллекта для повышения доверия пользователей, конфиденциальности и безопасности, что открывает новые возможности для защиты конфиденциальных данных.
Исследование, проведенное в Университете Инсбрука, проливает свет на значимость временной достоверности в системах искусственного интеллекта и ее потенциал для улучшения возможностей ИИ. Хотя ChatGPT, возможно, и не достигла этого аспекта, полученные результаты открывают путь для дальнейшего развития исследований в области ИИ. Учет временного понимания здравого смысла становится ключевым фактором для создания более точных и контекстно-ориентированных приложений ИИ по мере его развития.

