OpenAI, 개인정보 보호 기능을 갖춘 웹 크롤러 GPTBot 출시

에 의해

존 팔머

읽는 데 2분 소요 , 2023년 8월 7일

OpenAI는 웹사이트 관리자를 위한 개인정보 보호 제어 기능을 갖춘 GPTBot 웹 크롤러를 출시했습니다.
GPTBot은 데이터 개인정보 보호 및 정확성을 보호하기 위한 사전적 옵트아웃 조치를 허용합니다.
OpenAI는 향상된 데이터 개인정보 보호를 통해 책임감 있는 AI 발전을 위해 노력하고 있습니다.

OpenAI는 자사 AI 모델에 필요한 데이터 수집을 위해 설계된 전용 웹 크롤러인 GPTBot을 조용히 출시했습니다. 이제 웹사이트 관리자는 크롤러의 정보 수집을 차단할 수 있습니다. 이는 OpenAI AI 모델의 데이터 프라이버시와 정확성을 강화하기 위한 조치입니다. OpenAI는 온라인 문서에 크롤링 프로세스 거부 방법을 추가했지만, 아직 공식 발표는 없습니다.

OpenAI의 GPTBot은 사용자 에이전트 문자열의 사용자 에이전트 토큰 'GPTBot'으로dent할 수 있습니다. 크롤러가 웹사이트의 특정 부분에 접근하는 것을 막기 위해 관리자는 사이트의 robots.txt 파일에 GPTBot을 추가할 수 있습니다. 이는 Googlebot이 특정 영역에 접근하는 것을 제한하는 방식과 유사합니다. OpenAI는 또한 크롤러가 사용하는 IP 주소 차단 정보를 공개하여 관리자가 해당 주소에서 직접 접근을 차단할 수 있도록 했습니다.

사전적 옵트아웃 조치가 필요합니다.

GPTBot의 사이트 크롤링을 방지하려면 웹사이트 관리자가 사전에 robots.txt 파일에 해당 정보를 추가해야 합니다. 그렇지 않으면 수집된 데이터는 명시적으로 차단하지 않는 한 향후 AI 모델에 사용될 수 있습니다. 이러한 접근 방식을 통해 웹사이트 소유자는 자신의 데이터를 제어하고 OpenAI의 접근을 제한할 수 있습니다.

일부에서는 OpenAI의 이러한 움직임이 잠재적인 스크래핑 방지 규제에 대비하거나 향후 조치에 대응하기 위한 것이라고 추측하지만, 이전에 수집된 데이터가 정밀 조사에서 제외될지는 불확실합니다. 2023년 3월에 출시된 OpenAI의 GPT-4는 2021년 9월까지 수집된 데이터를 기반으로 하며, 이는trac당국의 관심을 끌 수 있습니다.

응답 최적화 및 데이터 정확성 보장

GPTBot을 감지하는 기능은 웹사이트 소유자에게 접근 차단 이상의 기회를 제공합니다. 한 가지 제안은 크롤러가dent되면 OpenAI에 다양한 대응 방안을 제공하는 것입니다. 이러한 접근 방식은 관리자가 의도적으로 잘못된 정보를 제공하여 학습 데이터셋의 정확도에 영향을 미칠 수 있도록 합니다.

OpenAI는 GPTBot을 활용하여 AI 모델을 개선하고 정확도, 기능 및 안전성을 향상시키고자 합니다. GPT-3.5 및 GPT-4와 같은 대규모 언어 모델은 방대한 학습 데이터 세트를 활용하기 때문에, GPTBot과 같은 웹 크롤러는 사용자 질의에 대한 정확한 응답을 위한 데이터 수집의 필수 도구가 되었습니다.

데이터 수집에서 웹 크롤러의 역할

GPTBot과 같은 웹 크롤러는 인터넷을matic으로 탐색하며 검색 엔진 색인 및 웹페이지 보관 등 다양한 목적으로 데이터를 수집합니다. 웹사이트 소유자는 robots.txt 파일의 지침에 따라 사이트의 어떤 영역을 크롤링할지 지정하여 민감하거나 비공개적인 데이터를 보호할 수 있습니다.

OpenAI의 이전 데이터 세트 사용 및 GPTBot의 목적

OpenAI는 이전에 Common Crawl을 포함한 데이터 세트를 사용하여 AI 모델을 학습시켜 왔습니다. 그러나 GPTBot은 OpenAI 모델 전용으로 데이터를 수집하도록 설계된 전용 크롤러입니다. GPTBot의 목적은 AI가 생성한 응답의 정확성과 안전성을 향상시키는 것입니다.

OpenAI가 전담 웹 크롤러인 GPTBot을 출시하면서 웹사이트 관리자에게 개인정보 보호 관리라는 추가적인 이점을 제공합니다. OpenAI는 웹사이트 소유자가 데이터 수집을 거부할 수 있도록 허용함으로써 AI 모델의 데이터 개인정보 보호 및 정확성을 향상시키고자 합니다. OpenAI의 의도에 대한 추측은 여전히 남아 있지만, 이번 조치는 AI 역량을 책임감 있게 발전시키겠다는 OpenAI의 의지를 보여줍니다. 이제 웹사이트 관리자는 GPTBot의 접근 권한을 제어할 수 있게 되어 데이터를 더욱 효과적으로 관리하고 AI가 생성한 응답의 정확성을 보장할 수 있습니다.

암호화폐 뉴스를 단순히 읽는 데 그치지 마세요. 이해하세요. 저희 뉴스레터를 구독하세요. 무료입니다.

이 기사를 공유하세요

면책 조항: 제공된 정보는 투자 조언이 아닙니다. Cryptopolitan이 페이지에 제공된 정보를 바탕으로 이루어진 투자에 대해 어떠한 책임도 지지 않습니다.tron권장합니다dent .

존 팔머

존 무랑기리는 시장 분석 능력을 갖추고 Cryptopolitan 에 합류했습니다. 존(JP라고도 불림)은 나이로비 대학교에서 대중매체 및 미디어학 학사 학위를 취득했습니다. 그는 이전에 InsideBitcoin과 Metacoingraph에 암호화폐 시장 관련 분석 글을 기고한 바 있습니다.

1. 사전적 옵트아웃 조치가 필요합니다.

2. 응답 최적화 및 데이터 정확성 보장

3. 데이터 수집에서 웹 크롤러의 역할

4. OpenAI의 이전 데이터 세트 사용 및 GPTBot의 목적

이 기사를 공유하세요