ПОСЛЕДНИЕ НОВОСТИ
ПОДОБРАНО ДЛЯ ВАС
Еженедельно
ОСТАВАЙТЕСЬ НА ВЕРШИНЕ

Лучшие аналитические материалы о криптовалютах прямо в вашу электронную почту.

Компания OpenAI представила веб-краулер GPTBot с функциями контроля конфиденциальности

КДжон ПалмерДжон Палмер
2 минуты чтения,
GPTBot
  • OpenAI представляет веб-краулер GPTBot с функциями контроля конфиденциальности для администраторов веб-сайтов.
  • GPTBot позволяет принимать превентивные меры по отказу от участия для защиты конфиденциальности и точности данных.
  • Компания OpenAI привержена ответственному развитию искусственного интеллекта посредством повышения уровня конфиденциальности данных.

Компания OpenAI незаметно запустила GPTBot, специализированный веб-сканер, предназначенный для сбора данных для своих моделей ИИ. Однако теперь администраторы веб-сайтов могут запретить сканеру сбор информации. Этот шаг направлен на повышение конфиденциальности и точности данных в моделях ИИ OpenAI. Компания добавила инструкции по отказу от процесса сканирования в свою онлайн-документацию, хотя официального объявления пока не было.

GPTBot от OpenAI можноdentпо токену пользовательского агента 'GPTBot' в строке пользовательского агента. Чтобы запретить доступ сканера к определенным разделам веб-сайта, администраторы могут добавить его в файл robots.txt сайта, аналогично тому, как Googlebot ограничен в доступе к определенным областям. OpenAI также раскрыла блок IP-адресов, используемый сканером, что позволяет администраторам блокировать доступ непосредственно с этих адресов.

Необходима активная мера отказа от участия

Для предотвращения сканирования сайта роботом GPTBot администраторам веб-сайта необходимо заблаговременно добавить его в файл robots.txt. В противном случае собранные данные могут быть использованы в будущих моделях ИИ, если их явно не заблокировать. Такой подход позволяет владельцам веб-сайтов контролировать свои данные и ограничивать доступ OpenAI.

Хотя некоторые предполагают, что шаг OpenAI может быть направлен на подготовку к потенциальному регулированию в сфере сбора данных или на защиту от будущих действий, остается неясным, будут ли ранее собранные данные освобождены от проверки. GPT-4 от OpenAI, запущенный в марте 2023 года, основан на данных, собранных до сентября 2021 года, что можетtracвнимание регулирующих органов.

Оптимизация ответов и обеспечение точности данных

Возможность обнаружения GPTBot предоставляет владельцам веб-сайтов возможности, выходящие за рамки блокировки доступа. Одно из предложений — выдавать разные ответы OpenAI послеdentкраулера. Такой подход позволяет администраторам намеренно распространять дезинформацию, влияя на точность обучающих наборов данных.

OpenAI планирует использовать GPTBot для усовершенствования своих моделей ИИ, повышения точности, возможностей и безопасности. Поскольку большие языковые модели, такие как GPT-3.5 и GPT-4, полагаются на обширные обучающие наборы данных, веб-краулеры, такие как GPTBot, становятся важными инструментами для сбора данных, позволяющими точно отвечать на запросы пользователей.

Роль веб-краулеров в сборе данных

Веб-краулеры, такие как GPTBot,maticперемещаются по интернету, собирая данные для различных целей, включая индексацию поисковыми системами и архивирование веб-страниц. Следуя инструкциям в файле robots.txt, владельцы веб-сайтов могут указать, какие разделы их сайта могут быть просканированы, обеспечивая защиту конфиденциальных или личных данных.

Предыдущее использование наборов данных компанией OpenAI и назначение GPTBot

Ранее OpenAI использовала наборы данных, включая Common Crawl, для обучения своих моделей ИИ. Однако GPTBot — это специализированный веб-краулер, разработанный для сбора данных специально для моделей OpenAI. Его цель — помочь повысить точность и безопасность ответов, генерируемых ИИ.

Внедрение компанией OpenAI GPTBot, специализированного веб-краулера, предоставляет администраторам веб-сайтов дополнительное преимущество в виде контроля конфиденциальности. OpenAI стремится повысить конфиденциальность данных и точность своих моделей ИИ, позволяя владельцам веб-сайтов отказаться от сбора данных. Хотя мотивы компании остаются предметом дискуссий, этот шаг свидетельствует о приверженности OpenAI ответственному развитию возможностей ИИ. Благодаря возможности администраторов веб-сайтов управлять доступом GPTBot, они могут лучше контролировать свои данные и обеспечивать точность ответов, генерируемых ИИ.

Не просто читайте новости о криптовалютах. Разберитесь в них. Подпишитесь на нашу рассылку. Это бесплатно.

Поделитесь этой статьей

Предупреждение. Предоставленная информация не является торговой рекомендацией. Cryptopolitanнастоятельно не несет ответственности за любые инвестиции, сделанные на основе информации, представленной на этой странице. Мыtronпровести независимоеdent и/или проконсультироваться с квалифицированным специалистом, прежде чем принимать какие-либо инвестиционные решения.

Джон Палмер

Джон Палмер

Джон Мурангири пришел в Cryptopolitan обладая навыками анализа рынка. Джон (он же JP) окончил Университет Найроби со степенью бакалавра в области массовых коммуникаций и медиаисследований. Ранее он публиковал аналитические материалы о криптовалютном рынке на InsideBitcoins.com и Metacoingraph.

ЕЩЕ… НОВОСТИ
ЭКСПРЕСС- КУРС ПО ГЛУБОКОЙ КРИПТОГРАФИИ