Украина создаёт собственную большую языковую модель (LLM) с использованием технологий Google. Эта большая языковая модель будет обучена правильному пониманию украинского контекста, диалектов и языков меньшинств.
Обучение сначала будет проводиться на инфраструктуре Google, а затем переносится на локальные серверы. Власти ожидают кибератак после запуска и готовят меры защиты от таких угроз, как мгновенное внедрение.
Украина запустила национальный проект искусственного интеллекта
Украина разрабатывает крупную языковую модель, используя фреймворк Gemma с открытым исходным кодом от Google. Страна стремится создать полностьюdent систему искусственного интеллекта для военного и гражданского использования.
Министерство цифровых технологий Украины и мобильный оператор «Киевстар» объявили о проекте в понедельник. Для первоначального обучения будет использоваться вычислительная инфраструктура Google, после чего полностью перейдет на локальную инфраструктуру, что гарантирует Украине полный контроль над тем, к каким системам искусственного интеллекта ежедневно будут получать доступ 23 миллиона ее граждан.
После тщательной оценки компания Google была выбрана для участия в проекте. По данным источников, знакомых с решением, опубликованным агентством Reuters,
Китайские языковые модели, включая DeepSeek и Qwen, также были отклонены для участия в проекте.
Украинские военные уже используют инструменты ИИ для воздушной и спутниковой разведки, операций с использованием беспилотников и анализа поля боя.
Заместитель министра цифровой трансформации Украины Александр Борняков пояснил, что отказ от использования таких систем, как ChatGPT от OpenAI, был намеренным, поскольку вооруженные силы Украины планируют интегрировать ИИ в системы управления полем боя для координации войск и мониторинга противника.
Решение проблемы языкового разрыва
Проект отчасти обусловлен коммуникационными пробелами, влияющими на существующие системы искусственного интеллекта. Борняков заметил, что существующие системы искусственного интеллекта с трудом обрабатывают диалект жителей его родного города Болград в Одесской области, где используется смесь украинского, русского и болгарского языков.
Миша Нестор, директор по продуктам «Киевстар», курирующий проект, отметил такие проблемы, как неточности перевода в юридических документах и ошибки, генерируемые искусственным интеллектом. Четыре консультативных комитета будут отвечать за технические, юридические, культурные, исторические и лингвистические аспекты новой модели, обеспечивая поддержку украинского и языков меньшинств, таких как крымскотатарский, а также русского.
Данные собираются из более чем 90 государственных учреждений, включая судебные реестры, образовательные издательства, региональные архивы и записи действий России во время продолжающейся войны. Этот комплексный набор данных позволит ИИ понимать украинский контекст и терминологию гораздо лучше, чем универсальные глобальные модели.
Эксперты Минцифры утверждают, что Gemma — одна из самых эффективных открытых моделей по размеру и качеству, обеспечивающая стабильный баланс между производительностью и потреблением ресурсов. Многоязычная поддержка модели уже включает украинский язык, а расширенный токенизатор поддерживает до 128 000 токенов с мультимодальной обработкой как текста, так и изображений.
Обучение будет проходить на защищенных графических процессорах за пределами Украины, предоставленных Google, прежде чем готовые модели будут развернуты в местных центрах обработки данных. Это решение страны в ответ на сохраняющуюся угрозу российских ударов по украинской инфраструктуре.
Борняков заявил, что официальные лица ожидают атаки на систему сразу после её запуска. Команда разрабатывает средства защиты от различных киберугроз, включая атаки с мгновенным внедрением вредоносных инструкций, которые внедряются в задачи, задаваемые ИИ.
«Киевстар» установил более 3500 резервных генераторов для стабилизации работы в условиях продолжающихся российских ударов по энергетической инфраструктуре Украины. По состоянию на сентябрь телекоммуникационная компания обслуживает более 22,5 млн абонентов мобильной связи и более 1,2 млн абонентов фиксированной связи.

