Your bank is using your money. You’re getting the scraps.WATCH FREE

Компания OpenAI представила веб-краулер GPTBot с функциями контроля конфиденциальности

В этом посте:

  • OpenAI представляет веб-краулер GPTBot с функциями контроля конфиденциальности для администраторов веб-сайтов.
  • GPTBot позволяет принимать превентивные меры по отказу от участия для защиты конфиденциальности и точности данных.
  • Компания OpenAI привержена ответственному развитию искусственного интеллекта посредством повышения уровня конфиденциальности данных.

Компания OpenAI незаметно запустила GPTBot, специализированный веб-сканер, предназначенный для сбора данных для своих моделей ИИ. Однако теперь администраторы веб-сайтов могут запретить сканеру сбор информации. Этот шаг направлен на повышение конфиденциальности и точности данных в моделях ИИ OpenAI. Компания добавила инструкции по отказу от процесса сканирования в свою онлайн-документацию, хотя официального объявления пока не было.

GPTBot от OpenAI можноdentпо токену пользовательского агента 'GPTBot' в строке пользовательского агента. Чтобы запретить доступ сканера к определенным разделам веб-сайта, администраторы могут добавить его в файл robots.txt сайта, аналогично тому, как Googlebot ограничен в доступе к определенным областям. OpenAI также раскрыла блок IP-адресов, используемый сканером, что позволяет администраторам блокировать доступ непосредственно с этих адресов.

Необходима активная мера отказа от участия

Для предотвращения сканирования сайта роботом GPTBot администраторам веб-сайта необходимо заблаговременно добавить его в файл robots.txt. В противном случае собранные данные могут быть использованы в будущих моделях ИИ, если их явно не заблокировать. Такой подход позволяет владельцам веб-сайтов контролировать свои данные и ограничивать доступ OpenAI.

Хотя некоторые предполагают, что шаг OpenAI может быть направлен на подготовку к потенциальному регулированию в сфере сбора данных или на защиту от будущих действий, остается неясным, будут ли ранее собранные данные освобождены от проверки. GPT-4 от OpenAI, запущенный в марте 2023 года, основан на данных, собранных до сентября 2021 года, что можетtracвнимание регулирующих органов.

См. также:  Трамп издаст указы, чтобы опередить Китай в глобальной гонке вооружений в сфере технологий.

Оптимизация ответов и обеспечение точности данных

Возможность обнаружения GPTBot предоставляет владельцам веб-сайтов возможности, выходящие за рамки блокировки доступа. Одно из предложений — выдавать разные ответы OpenAI послеdentкраулера. Такой подход позволяет администраторам намеренно распространять дезинформацию, влияя на точность обучающих наборов данных.

OpenAI планирует использовать GPTBot для усовершенствования своих моделей ИИ, повышения точности, возможностей и безопасности. Поскольку большие языковые модели, такие как GPT-3.5 и GPT-4, полагаются на обширные обучающие наборы данных, веб-краулеры, такие как GPTBot, становятся важными инструментами для сбора данных, позволяющими точно отвечать на запросы пользователей.

Роль веб-краулеров в сборе данных

Веб-краулеры, такие как GPTBot,maticперемещаются по интернету, собирая данные для различных целей, включая индексацию поисковыми системами и архивирование веб-страниц. Следуя инструкциям в файле robots.txt, владельцы веб-сайтов могут указать, какие разделы их сайта могут быть просканированы, обеспечивая защиту конфиденциальных или личных данных.

Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Ранее OpenAI использовала наборы данных, включая Common Crawl, для обучения своих моделей ИИ. Однако GPTBot — это специализированный веб-краулер, разработанный для сбора данных специально для моделей OpenAI. Его цель — помочь повысить точность и безопасность ответов, генерируемых ИИ.

Внедрение компанией OpenAI GPTBot, специализированного веб-краулера, предоставляет администраторам веб-сайтов дополнительное преимущество в виде контроля конфиденциальности. OpenAI стремится повысить конфиденциальность данных и точность своих моделей ИИ, позволяя владельцам веб-сайтов отказаться от сбора данных. Хотя мотивы компании остаются предметом дискуссий, этот шаг свидетельствует о приверженности OpenAI ответственному развитию возможностей ИИ. Благодаря возможности администраторов веб-сайтов управлять доступом GPTBot, они могут лучше контролировать свои данные и обеспечивать точность ответов, генерируемых ИИ.

См. также:  Сняты ограничения на вычислительные мощности для обучения ИИ от Tesla, что обещает более быстрые улучшения.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно .

Поделиться ссылкой:

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitan не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы настоятельно tron провести независимое dent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Загрузка самых читаемых статей...

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Загрузка статей, выбранных редактором...

- Криптовалютная рассылка, которая поможет вам быть в курсе событий -

Рынки быстро меняются.

Мы двигаемся быстрее.

Подпишитесь на Cryptopolitan Daily и получайте своевременные, точные и актуальные аналитические материалы о криптовалютах прямо на свою электронную почту.

Присоединяйтесь прямо сейчас и
ничего не пропустите.

Заходите. Получайте достоверную информацию.
Опережайте события.

Подпишитесь на CryptoPolitan