Компания OpenAI представила веб-краулер GPTBot с функциями контроля конфиденциальности

By John Palmer
Обновлено: 8 августа 2023 г., 11:15 UTC

2 минуты чтения

Добавьте нас в список предпочтительных источников в Google

348041

Содержание

1. Необходима активная мера отказа от участия

2. Оптимизация ответов и обеспечение точности данных

3. Роль веб-краулеров в сборе данных

4. Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Поделиться ссылкой:

В этом посте:

OpenAI представляет веб-краулер GPTBot с функциями контроля конфиденциальности для администраторов веб-сайтов.
GPTBot позволяет принимать превентивные меры по отказу от участия для защиты конфиденциальности и точности данных.
Компания OpenAI привержена ответственному развитию искусственного интеллекта посредством повышения уровня конфиденциальности данных.

Компания OpenAI незаметно запустила GPTBot, специализированный веб-сканер, предназначенный для сбора данных для своих моделей ИИ. Однако теперь администраторы веб-сайтов могут запретить сканеру сбор информации. Этот шаг направлен на повышение конфиденциальности и точности данных в моделях ИИ OpenAI. Компания добавила инструкции по отказу от процесса сканирования в свою онлайн-документацию, хотя официального объявления пока не было.

GPTBot от OpenAI можноdentпо токену пользовательского агента 'GPTBot' в строке пользовательского агента. Чтобы запретить доступ сканера к определенным разделам веб-сайта, администраторы могут добавить его в файл robots.txt сайта, аналогично тому, как Googlebot ограничен в доступе к определенным областям. OpenAI также раскрыла блок IP-адресов, используемый сканером, что позволяет администраторам блокировать доступ непосредственно с этих адресов.

Необходима активная мера отказа от участия

Для предотвращения сканирования сайта роботом GPTBot администраторам веб-сайта необходимо заблаговременно добавить его в файл robots.txt. В противном случае собранные данные могут быть использованы в будущих моделях ИИ, если их явно не заблокировать. Такой подход позволяет владельцам веб-сайтов контролировать свои данные и ограничивать доступ OpenAI.

Хотя некоторые предполагают, что шаг OpenAI может быть направлен на подготовку к потенциальному регулированию в сфере сбора данных или на защиту от будущих действий, остается неясным, будут ли ранее собранные данные освобождены от проверки. GPT-4 от OpenAI, запущенный в марте 2023 года, основан на данных, собранных до сентября 2021 года, что можетtracвнимание регулирующих органов.

См. также: Трамп издаст указы, чтобы опередить Китай в глобальной гонке вооружений в сфере технологий.

Оптимизация ответов и обеспечение точности данных

Возможность обнаружения GPTBot предоставляет владельцам веб-сайтов возможности, выходящие за рамки блокировки доступа. Одно из предложений — выдавать разные ответы OpenAI послеdentкраулера. Такой подход позволяет администраторам намеренно распространять дезинформацию, влияя на точность обучающих наборов данных.

OpenAI планирует использовать GPTBot для усовершенствования своих моделей ИИ, повышения точности, возможностей и безопасности. Поскольку большие языковые модели, такие как GPT-3.5 и GPT-4, полагаются на обширные обучающие наборы данных, веб-краулеры, такие как GPTBot, становятся важными инструментами для сбора данных, позволяющими точно отвечать на запросы пользователей.

Роль веб-краулеров в сборе данных

Веб-краулеры, такие как GPTBot,maticперемещаются по интернету, собирая данные для различных целей, включая индексацию поисковыми системами и архивирование веб-страниц. Следуя инструкциям в файле robots.txt, владельцы веб-сайтов могут указать, какие разделы их сайта могут быть просканированы, обеспечивая защиту конфиденциальных или личных данных.

Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Ранее OpenAI использовала наборы данных, включая Common Crawl, для обучения своих моделей ИИ. Однако GPTBot — это специализированный веб-краулер, разработанный для сбора данных специально для моделей OpenAI. Его цель — помочь повысить точность и безопасность ответов, генерируемых ИИ.

Внедрение компанией OpenAI GPTBot, специализированного веб-краулера, предоставляет администраторам веб-сайтов дополнительное преимущество в виде контроля конфиденциальности. OpenAI стремится повысить конфиденциальность данных и точность своих моделей ИИ, позволяя владельцам веб-сайтов отказаться от сбора данных. Хотя мотивы компании остаются предметом дискуссий, этот шаг свидетельствует о приверженности OpenAI ответственному развитию возможностей ИИ. Благодаря возможности администраторов веб-сайтов управлять доступом GPTBot, они могут лучше контролировать свои данные и обеспечивать точность ответов, генерируемых ИИ.

См. также: Сняты ограничения на вычислительные мощности для обучения ИИ от Tesla, что обещает более быстрые улучшения.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно .

Поделиться ссылкой:

Ознакомьтесь с отказом от ответственности

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitan не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мы настоятельно tron провести независимое dent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Загрузка статей, выбранных редактором...

Компания OpenAI представила веб-краулер GPTBot с функциями контроля конфиденциальности

Содержание

В этом посте:

Необходима активная мера отказа от участия

Оптимизация ответов и обеспечение точности данных

Роль веб-краулеров в сборе данных

Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию.
Опережайте события.

Компания OpenAI представила веб-краулер GPTBot с функциями контроля конфиденциальности

Содержание

В этом посте:

Необходима активная мера отказа от участия

Оптимизация ответов и обеспечение точности данных

Роль веб-краулеров в сборе данных

Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Поделиться ссылкой:

Самые читаемые

Будьте в курсе новостей криптовалютного рынка, получайте ежедневные обновления на свою электронную почту

Выбор редактора

Зарегистрируйтесь и оставайтесь на связи!

Подписывайтесь на нас

- Криптовалютная рассылка, которая поможет вам быть в курсе событий -

Рынки быстро меняются.

Мы двигаемся быстрее.

Заходите. Получайте достоверную информацию. Опережайте события.

Заходите. Получайте достоверную информацию.
Опережайте события.