ПОСЛЕДНИЕ НОВОСТИ

Устройство для уничтожения комаров с помощью лазерного прицела с искусственным интеллектом, отстреливающего комаров в полете, привлекло 2,7 миллиона долларов инвестиций

1 час назад Технологии
Tether и Ledn предложат обеспеченные золотом кредиты с использованием токенизированных XAUT

3 часа назад Новости
В криптотрейдерском сообществе Twitter набросились на Артура Хейса после новых сообщений о проблемах с ликвидностью при выходе из бизнеса

3 часа назад Новости
Генеральный директор Coinbase предлагает китайские модели искусственного интеллекта для расчета открытого веса в качестве решения проблемы растущих счетов

3 часа назад Новости

ПОДОБРАНО ДЛЯ ВАС

Еженедельно

ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Небольшие языковые модели (SLM) считаются следующим прорывом в области искусственного интеллекта

Автор:

Энаси Мапакаме

3 минуты чтения, 25 ноября 2024 г.

Небольшие языковые модели (SLM) считаются следующим прорывом в области искусственного интеллекта

Хотя программы LLM имеют решающее значение для бизнеса в решении множества различных задач, эксперты считают, что перспективы программ SLM весьма многообещающие.
Помимо прочих преимуществ, однослойные жидкокристаллические материалы более энергоэффективны по сравнению с жидкокристаллическими материалами, что делает их идеальным выбором
Но крупные технологические компании вкладывают огромные средства в программы магистратуры в области права.

В то время как компании вкладывают огромные средства в большие языковые модели (LLM), некоторые эксперты в области искусственного интеллекта считают, что следующим прорывом станут малые языковые модели (SLM).

Это происходит на фоне продолжающегося роста активности в отрасли в преддверии праздничного сезона, когда технологические компании вкладывают больше средств в разработку своих технологий.

Будущее за небольшими языковыми моделями

Такие компании, как xAI, возглавляемая мультимиллиардером Илоном Маском, смогли привлечь дополнительные 5 миллиардов долларов от Andreessen Horowitz, Qatar Investment Authority, Sequoia и Valor Equity Partners, а Amazon инвестировала еще 4 миллиарда долларов в Anthropic, конкурента OpenAI.

В то время как эти крупные технологические компании и другие вкладывают миллиарды долларов в разработку масштабных моделей обработки данных для решения множества различных задач, реальность искусственного интеллекта такова, что универсального решения не существует, поскольку для бизнеса необходимы модели, специфичные для конкретных задач.

Как заявил генеральный директор AWS Мэтт Гарман в пресс-релизе о расширении партнерства и инвестиций, уже наблюдается огромный отклик со стороны клиентов AWS, разрабатывающих генеративный искусственный интеллект на базе Anthropic.

Для большинства компаний LLM-технологии по-прежнему остаются предпочтительным выбором для определенных проектов, но для других этот выбор может быть дорогостоящим с точки зрения затрат, энергии и вычислительных ресурсов.

Стивен Макмиллан,dent и генеральный директор Teradata, предложивший альтернативный путь для некоторых предприятий, также придерживается иного мнения. Он уверен, что будущее за системами управления жизненным циклом продукции (SLM).

«Заглядывая в будущее, мы считаем, что малые и средние языковые модели, а также контролируемые среды, такие как предметно-ориентированные LLM-модели, обеспечат гораздо лучшие решения»

~ Макмиллан

Системы управления языковыми функциями (SLM) выдают индивидуальные результаты для конкретных типов данных, поскольку языковые модели специально обучены для этого. Поскольку данные, генерируемые SLM, хранятся внутри системы, языковые модели, следовательно, обучаются на потенциально конфиденциальных данных.

Поскольку LLM-модели потребляют много энергии, версии на малых языках обучаются таким образом, чтобы масштабировать как вычислительные ресурсы, так и энергопотребление в соответствии с реальными потребностями проекта. Благодаря таким корректировкам, SLM-модели оказываются более эффективными и экономичными, чем существующие большие модели.

Для пользователей, желающих использовать ИИ для получения конкретных знаний, существует вариант специализированных программ , поскольку они не предоставляют широких знаний. ИИ обучается глубокому пониманию только одной категории информации и более точному реагированию, например, на вопрос «кадр-менеджер по маркетингу» или «финансовый директор» в данной области.

Почему системы управления жизненным циклом материалов являются предпочтительным вариантом

Согласно данным Ассоциации специалистов по анализу данных (ADaSci), для полной разработки системы управления питанием (SLM) с 7 миллиардами параметров для миллиона пользователей потребуется всего 55,1 МВт·ч (мегаватт-часов).

ADaSci выяснила, что обучение GPT-3 с использованием 175 миллиардов параметров потребило примерно 1287 МВт·ч электроэнергии, и эта цифра не включает электроэнергию, потребляемую при официальном вводе системы в эксплуатацию. Таким образом, SLM потребляет примерно 5% энергии, потребляемой при обучении LLM.

Крупные модели обычно запускаются на облачных компьютерах, поскольку они используют больше вычислительной мощности, чем когда-либо будет доступно на отдельном устройстве. Это приводит к сложностям для компаний, поскольку они теряют контроль над своей информацией при ее перемещении в облако и замедляют отклик при передаче данных через интернет.

В будущем внедрение ИИ в бизнесе не будет универсальным решением, поскольку в центре внимания будет эффективность и выбор наилучшего и наименее затратного инструмента для выполнения задач, что означает выбор модели, подходящей для каждого проекта.

Это будет сделано для всех моделей, будь то универсальная модель LLM или более мелкие и специализированные модели LLM, в зависимости от того, какая модель обеспечит лучшие результаты, потребует меньше ресурсов и уменьшит необходимость миграции данных в облако.

На следующем этапе ИИ будет играть жизненно важную роль в принятии бизнес-решений, поскольку общественность высоко доверяет ответам, генерируемым ИИ.

«Когда речь заходит об обучении моделей искусственного интеллекта, они должны строиться на основе качественных данных»

~ Макмиллан

«В этом и заключается наша главная задача: предоставлять надежный набор данных, а затем обеспечивать возможности и аналитику, чтобы клиенты и их заказчики могли доверять результатам», — добавил Макмиллан.

В условиях высокого спроса на эффективность и точность в мире, небольшие и специализированные магистерские программы предлагают еще один вариант получения результатов, на которые могут полагаться компании и широкая общественность.

Самые умные криптоаналитики уже читают нашу рассылку. Хотите присоединиться? Вступайте в их ряды.

a16z OpenAI xAI

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Энаси Мапакаме

Энаси Мапакаме — журналистка с более чем 10-летним опытом работы в сфере деловых и финансовых новостей. Она освещает рынки капитала и новые технологии — метавселенную, искусственный интеллект и криптовалюты. Энаси имеет степень бакалавра наук в области медиа и социальных исследований с отличием.

ОГЛАВЛЕНИЕ

1. Будущее за небольшими языковыми моделями

2. Почему системы управления жизненным циклом материалов являются предпочтительным вариантом

Поделитесь этой статьей

ЕЩЕ… НОВОСТИ

ПОКАЗАТЬ ВСЕ

5 оригинальных применений ChatGPT и что с ними делать

3 года назад Tech Джон Палмер

решения на основе искусственного интеллекта

По данным Reuters, 93% руководителей предприятий отдают предпочтение решениям на основе искусственного интеллекта для управления устойчивым развитием бренда

3 года назад Tech Джон Палмер

Французская экосистема искусственного интеллекта

Вот как Макрон поддерживает динамичную и продуктивную экосистему искусственного интеллекта во Франции

3 года назад Tech Glory Kaburu

По оценкам Bloomberg, к 2032 году объем рынка генеративного искусственного интеллекта достигнет 1,3 триллиона долларов

3 года назад Tech Аамир Шейх

Что такое Base? Сеть Ethereum Layer-2, запущенная Coinbase

21 октября 2025 г. Изучение криптовалют: руководства для начинающих
Dogecoin против Bitcoin: ключевые технические различия

20 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое TVL (Total Value Locked) в криптовалюте?

14 октября 2025 г. Изучение криптовалют: руководства для начинающих
Как читать криптодокумент?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Ripple против XRP против XRP Ledger: в чем разница?

13 октября 2025 г. Изучение криптовалют: руководства для начинающих
Что такое мультиподписной кошелек в криптовалюте?

10 октября 2025 г. Изучение криптовалют: руководства для начинающих

ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ

Какие криптовалюты могут принести вам деньги?
Как повысить безопасность своего кошелька (и какие из них действительно стоит использовать)
Малоизвестные инвестиционные стратегии, используемые профессионалами
Как начать инвестировать в криптовалюту (какие биржи использовать, какую криптовалюту лучше купить и т.д.)