Инновационная система искусственного интеллекта демонстрирует многообещающие результаты в области проверки программного обеспечения без ошибок

- Baldur, система искусственного интеллекта, разработанная совместно с Google, автоматизирует математические доказательства, что позволяет сократить количество программных ошибок и повысить точность.
- Благодаря тонкой настройке больших языковых моделей, Бальдур и Тор достигают 65,7% успеха в генерации доказательств.
- Этот прорыв обещает упростить проверку программного обеспечения и повысить его надежность, что станет значительным шагом вперед в разработке программного обеспечения без ошибок.
Традиционно проверка программного кода представляла собой трудоемкий процесс, включающий ручной анализ кода или его запуск для выявленияdent. Хотя эти методы и ценны, они подвержены человеческим ошибкам и непрактичны для сложных систем.
Представляем Baldur — тщательно разработанное решение, использующее возможности больших языковых моделей (LLM) дляmaticгенерацииmaticдоказательств. Благодаря тонкой настройке LLM на основе обширногоmaticконтента и языка Isabelle/HOL, используемого для доказательств, Baldur делает огромный шаг к автоматизации некогда сложной задачи. Результат? Система, работающая в тандеме с системами доказательства теорем для проверки корректности кода, значительно снижает погрешность.
В основе успеха Baldur лежит партнерство с Thor, инструментом, отвечающим заmaticгенерацию доказательств. Thor может похвастаться 57% успешностью, но в сочетании с Baldur они достигают замечательной точности в 65,7%. Этот динамичный дуэт, вдохновленный скандинавской мифологией, демонстрирует потенциал верификации программного обеспечения с помощью искусственного интеллекта.
Проблемы в магистратуре по праву
Одна из главных проблем, возникающих при работе с LLM-системами, такими как ChatGPT, — это их периодическая некорректность. Вместо того чтобы сигнализировать о проблемах, они могут «молчаливо давать сбои», выдавая ошибочные результаты, которые кажутся правильными. Решение этой проблемы имеет решающее значение для обеспечения надежности доказательств, генерируемых ИИ.
Разработка Baldur была непростой задачей, потребовавшей нескольких месяцев и совместной работы с Google. Эмили Фёрст, ведущий автор проекта, использовала Minerva, язык программирования с лингвистическим кодом, обученный на обширном корпусе текстов на естественном языке. Впоследствии Minerva была доработана на значительном наборе данных объемом 118 ГБ, содержащем математическиеmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmaticmatic.
Подход Baldur к исправлению ошибок гениален. Когда системаdentтеорем обнаруживает ошибку в сгенерированном доказательстве, она передает эту информацию обратно в Baldur, позволяя системе учиться на своих ошибках. Этот итеративный процесс повышает точность и надежность доказательств, делая его высокоэффективным инструментом для проверки кода.
Перспективное будущее для программного обеспечения без ошибок
Хотя есть куда стремиться, Baldur представляет собой многообещающее направление для формальной верификации программного обеспечения. Инженеры по-прежнему отвечают за разработку программного обеспечения, но теперь у них есть мощный союзник в лице Baldur, способный автоматизировать созданиеmaticдоказательств.
Юрий Брун, профессор Колледжа информатики и компьютерных наук им. Мэннинга в Массачусетском университете в Амхерсте, отметил: «Наша работа сосредоточена на попытке автоматизировать написание этих доказательств. Baldur использует большие языковые модели, чтобы, получивmaticтеорему,maticсгенерировать доказательство этой теоремы, которое затем может проверить средство доказательства теорем»
Успех проекта Baldur во многом обязан самоотверженной команде, которая неустанно работала над ним. Наряду с Эмили Фёрст, значительный вклад внесли Маркус Рабе, работавший в то время в Google, и Талия Рингер, доцент Университета Иллинойса в Урбана-Шампейн. Проект получил поддержку Агентства перспективных оборонных исследований (DARPA) и Национального научного фонда (NSF).
Инновационные решения, такие как Baldur, вселяют надежду в технологическую индустрию, которая сталкивается с постоянно растущей сложностью программных систем. Поскольку возможности ИИ продолжают развиваться и совершенствоваться, потенциал Baldur в повышении корректности программного обеспечения остается многообещающим.
Вы всё ещё позволяете банку оставлять себе лучшие результаты? Посмотрите наше бесплатное видео о том, как стать собственным банком.
Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtrondentdentdentdentdentdentdentdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.
КУРС
- Какие криптовалюты могут принести вам деньги?
- Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
- Малоизвестные инвестиционные стратегии, используемые профессионалами
- Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)















