Технологические гиганты раздвигают границы возможного, чтобы удовлетворить потребность искусственного интеллекта в данных

By James Kinoti
Обновлено: 6 апреля 2024 г., 12:39 UTC

3 минуты чтения

507313

Содержание

1. Инициатива OpenAI «Shiep»: анализ разговоров на YouTube

2. Анализ данных: внедрение нетрадиционных подходов

3. Необходимость в больших массивах данных

Поделиться ссылкой:

В этом посте:

Технологические гиганты прибегают к спорным методам сбора данных об искусственном интеллекте.
OpenAI занимается расшифровкой видеороликов YouTube, а Google и Meta рассматривают возможность приобретения контента, защищенного авторским правом.
Использование искусственным интеллектом огромных массивов данных вызывает юридические и этические споры.

Будь то работа OpenAI , Google и Meta, финансирование ИИ в промышленном секторе, включающее различные способы, такие как сбор или накопление огромных объемов цифровых данных различными творческими, но спорными методами, очевидно, что возможности и потенциал автоматизации растут. Примечательно, что усилия, включающие такие действия, как принятие мер, описанных выше (т. е. с учетом правовых ограничений и корпоративной политики), эквивалентны значительному объему данных, используемых для обучения систем ИИ.

Инициатива OpenAI «Shiep»: анализ разговоров на YouTube

Наша история с Whisper началась всего год назад. Огромная нехватка качественных англоязычных текстов приводит к задержкам в предоставлении образовательных услуг. Whisper стал следующим шагом Google. Он понял огромный объем диалогов на YouTube и был разработан как текстовое приложение для преобразования текста в речь. Сам инструмент на базе ИИ, состоящий из более чем миллиона часов видео с YouTube, прошедших проверку ИИ для генерации новых текстов (по сути, новых диалогов), использовался для обучения моделей ИИ, начиная от самых современных и заканчивая GPT-4, последней версией чат-бота ChatGPT.

Хотя некоторые сотрудники утверждали, что видеоматериалы OpenAI от Microsoft будут представлять собой плагиат YouTube в целом, этические аспекты плагиата оставались спорными; кроме того, некоторые работники признавали, что точно соответствовать намерениям YouTube было бы невозможно. Аналогично, возникновение возражений против алгоритмической обработки видео дляtracтекстового содержимого для моделей ИИ могло быть расценено как угроза авторским правам создателей видео, что вызвало возмущение.

См. также: Хардфорк Polygon исправляет ошибку после сетевого сбоя

Компания Meta, владеющая Facebook и Instagram, также выражала обеспокоенность по поводу использования защищенных авторским правом элементов издательств, таких как Simon & Schuster и других. Одновременно обсуждалась возможность приобретения общего веб-контента, что могло бы привести к нарушению авторских прав.

Анализ данных: внедрение нетрадиционных подходов

Сбор данных в условиях жесткой конкуренции помогает определить ключевую роль данных в развитии технологий искусственного интеллекта. Для обучения ИИdentвсе больше обучающих наборов данных, включая данные из таких источников, как Википедия и Reddit, которые сегодня обрабатываются вне этих платформ. Для технологических компаний, особенно тех, кто испытывает трудности с доступом к распространенным источникам данных, таким как традиционные хранилища данных, создание моделей на основе ИИ может стать альтернативным и достаточно предпочтительным решением в подобных случаях.

Технологические компании заявляют о необходимости сбора данных для обучения ИИ, хотя сам процесс оспаривается в суде. В свою защиту OpenAI и Microsoft выиграли дело о незаконном использовании материалов, защищенных авторским правом. При этом они утверждали, что их действия соответствуют принципу добросовестного использования. В последние годы количество заявок, поданных правообладателями в Управление по авторским правам США, превысило 10 000, что ясно показывает уникальность и новизну авторского права в эпоху ИИ. Следовательно, основные игроки постоянно сталкиваются с опасностями, связанными с нарушением авторских прав на многие произведения под предлогом отсутствия лицензирования для моделей, использующих ИИ на этой основе.

См. также: Криптотрейдеры приветствуют торгового бота Sigmax.io

Необходимость в больших массивах данных

В целом, работа Кайпана и де Джареда, учёного, занимающегося масштабными исследованиями, непреднамеренно стала грандиозной в развитии ИИ. Контент, основанный на данных, является одним из компонентов ИИ, необходимых для процесса обучения, но он не может эффективно функционировать без хорошо обученных и работающих моделей. С ростом технологий искусственного интеллекта спрос на данные для достижения успеха на рынке стремительно растёт, что ставит перед компаниями вопросы, связанные с правом, этикой и конфиденциальностью. Поэтому алгоритмы искусственного интеллекта должны использовать эти наборы данных для достижения успеха на рынке.

Поведение виртуальных личностей в процессе сбора данных искажается в угоду искусственного интеллекта ; типичная методологическая клятва становится всё более грубой. Будь то через свои выступления на YouTube или создание синтетических данных, эти компании являются лидерами в стремлении выяснить, каковы истинные проблемы в области права, этики и конфиденциальности.

Позже они могут стать предметом насмешек на море. В связи с появлением огромных массивов данных, необходимых для стимулирования инновационного процесса, от лидеров общества требуется активное участие в конструктивном диалоге для разработки правил и стандартов, в которых инновационные усилия уравновешиваются с этическими принципами защиты прав интеллектуальной собственности и неприкосновенности частной жизни.

Оригинал статьи: https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html

Совершенствуйте свою стратегию с помощью наставничества и ежедневных идей — 30 дней бесплатного доступа к нашей торговой программе.

Поделиться ссылкой:

Ознакомьтесь с отказом от ответственности

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitan не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы настоятельно tron провести независимое dent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Загрузка статей, выбранных редактором...

Технологические гиганты раздвигают границы возможного, чтобы удовлетворить потребность искусственного интеллекта в данных

Содержание

В этом посте:

Инициатива OpenAI «Shiep»: анализ разговоров на YouTube

Анализ данных: внедрение нетрадиционных подходов

Необходимость в больших массивах данных

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию.
Опережайте события.

Технологические гиганты раздвигают границы возможного, чтобы удовлетворить потребность искусственного интеллекта в данных

Содержание

В этом посте:

Инициатива OpenAI «Shiep»: анализ разговоров на YouTube

Анализ данных: внедрение нетрадиционных подходов

Необходимость в больших массивах данных

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Подписывайтесь на нас

- Криптовалютная рассылка, которая поможет вам быть в курсе событий -

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию. Опережайте события.

Заходите. Получайте достоверную информацию.
Опережайте события.