ПОСЛЕДНИЕ НОВОСТИ

жить Bitcoin взлетел до 67 000 долларов на фоне мирного соглашения между Трампом и Ираном, которое привело к резкому росту рынков

15 июня 2026 г. — Прямая трансляция.
Bitcoin Родни признал себя виновным в мошеннической схеме с криптовалютой на сумму 1,8 миллиарда долларов

36 минут назад Новости
Компания Trace Finance завершила раунд финансирования серии А на сумму 32 миллиона долларов для масштабирования инфраструктуры стейблкоинов в Латинской Америке и Азиатско-Тихоокеанском регионе

47 минут назад Новости
Документы на частном рынке получают проверку в блокчейне, поскольку Inveniam и Docugami нацелены на устранение пробела в доверии к данным, создаваемого искусственным интеллектом

50 минут назад Мнения отрасли

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Скрытые издержки обучения моделей ИИ

Бренда Канана

2 минуты чтения, 24 августа 2024 г.

Разработка моделей искусственного интеллекта — дорогостоящий процесс, требующий сотен миллионов долларов из-за вычислительных мощностей и больших объемов данных.
Высокие затраты на данные приводят к централизации разработки ИИ, что вызывает этические проблемы.
dent группы работают с открытыми наборами данных, а новые стратегии, такие как генеративные данные, все еще находятся на стадии тестирования.

Создание и поддержка современных моделей искусственного интеллекта требуют значительных инвестиций, которые могут превышать сотни миллионов долларов. По оценкам, в ближайшем будущем эти затраты могут достичь миллиарда долларов.

Эти затраты в основном связаны с вычислительной мощностью, где используются такие компоненты, как графические процессоры Nvidia, стоимость каждого из которых может составлять около 30 000 долларов, а для обеспечения высокой эффективности может потребоваться еще несколько тысяч таких процессоров. Исследователи отмечают, что качество и количество обучающих данных, используемых при разработке таких моделей, имеют очень важное значение.

Лидеры отрасли раскрывают колоссальные затраты на разработку ИИ

По словам Джеймса Беткера из OpenAI, производительность модели зависит от обучающих данных, а не от дизайна или архитектуры модели. Он утверждает , что модели, обученные на больших наборах данных, достигнут одинаковых результатов. Следовательно, данные являются ключом к развитию технологий искусственного интеллекта.

Дарио Амодей, генеральный директор компании Anthropic AI, занимающейся разработкой искусственного интеллекта, поделился своими соображениями о финансовых аспектах этих проблем в подкасте In Good Company. Он заявил, что обучение существующих моделей, таких как ChatGPT-4, оценивается примерно в 100 миллионов долларов, а обучение будущих моделей может потребовать от 10 до 100 миллиардов долларов в ближайшие несколько лет.

Генеративные модели искусственного интеллекта, в том числе и те, что создаются крупными компаниями, по своей сути являются статистическими моделями. Поэтому они используют множество примеров для прогнозирования наиболее вероятных результатов. Кайл Ло из Института искусственного интеллекта им. Аллена (AI2) говорит, что повышение производительности в основном объясняется данными, особенно когда среда обучения является стабильной.

Централизация данных вызывает этические проблемы и вопросы доступности

Высокая стоимость получения качественных данных делает разработку ИИ прерогативой нескольких крупных компаний в развитых странах. Такая концентрация ресурсов также вызывает опасения относительно доступности технологий ИИ и возможности их неправомерного использования.

Только компания OpenAI потратила сотни миллионов долларов на лицензирование данных, а Meta рассматривала возможность приобретения издателей для доступа к данным. Ожидается, что рынок данных для обучения ИИ будет расширяться, и брокеры данных, вероятно, выиграют от этой возможности.

Проблемы возникают из-за сомнительных методов сбора данных. Согласно отчетам, многие компании собирали большие объемы контента без разрешения его владельцев, а некоторые компании используют данные с различных платформ и не выплачивают пользователям вознаграждение. Как мы сообщали ранее, OpenAI использовала свою модель транскрипции аудио Whisper для расшифровки более миллиона часов видео на YouTube с целью доработки GPT-4.

Организации работают над созданием общедоступных наборов данных для обучения искусственного интеллекта

Поскольку гонка за сбором данных сопряжена с определенными трудностями, необходимы усилияdent сторон для обеспечения открытого доступа к обучающим наборам данных. Некоторые организации, такие как EleutherAI и Hugging Face, создают большие наборы данных, доступные для общественности для разработки ИИ.

Недавно Wall Street Journal выделил две потенциальные стратегии решения проблем сбора данных: генеративное создание данных и обучение на основе учебных программ. Синтетические данные создаются с помощью самих моделей ИИ, в то время как обучение на основе учебных программ стремится предоставить моделям высококачественные данные в структурированном виде, чтобы они могли устанавливать связи даже при меньшем объеме данных. Однако оба метода все еще находятся на стадии разработки, и их эффективность еще не проверена.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.

Nvidia OpenAI

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Бренда Канана

Бренда обладает более чем 4-летним опытом работы в области криптовалют, искусственного интеллекта и новых технологий. Она работала в Zycrypto, Blockchain Reporter, The Coin Republic, а теперь работает в Cryptopolitan . Ее образование в области социологии, полученное в Техническом университете Момбасы, позволяет ей быть в курсе событий, волнующих читателей.

ОГЛАВЛЕНИЕ

1. Лидеры отрасли раскрывают колоссальные затраты на разработку ИИ

2. Централизация данных вызывает этические проблемы и вопросы доступности

3. Организации работают над созданием общедоступных наборов данных для обучения искусственного интеллекта

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)

Скрытые издержки обучения моделей ИИ

Лидеры отрасли раскрывают колоссальные затраты на разработку ИИ

Централизация данных вызывает этические проблемы и вопросы доступности

Организации работают над созданием общедоступных наборов данных для обучения искусственного интеллекта

5 оригинальных применений ChatGPT и что с ними делать

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

Одно четкое и лаконичное задание.Каждый день.

Одно четкое и лаконичное задание.
Каждый день.