인공지능 분야의 유명 기업인 오픈아이(OpenAI)는 최근 웹 크롤링용으로 설계된 최신 도구인 "GPTBot"을 출시했는데, 이는 향후 ChatGPT 모델의 개선을 위한 발판을 마련할 가능성이 있습니다.
최근 블로그 게시물에서 OpenAI는 GPTBot 출시를 발표하며, 이 도구가 향후 ChatGPT 버전을 향상시킬 잠재력을 갖고 있다고 강조했습니다. 이 도구의 주요 기능은 웹 크롤링, 즉 웹 스파이더라고도 불리는 봇이 인터넷 전반에 걸쳐 웹사이트 콘텐츠를 색인화하는 과정입니다. 이를 통해 Google이나 Bing과 같은 검색 엔진은 검색 결과에 관련 웹사이트를 표시할 수 있습니다.
OpenAI는 설명했습니다 . 하지만 유료 콘텐츠, 개인 식별 정보가 포함된 소스, 그리고 OpenAI의 정책을 위반하는 텍스트는 제외하도록 프로그래밍되어 있습니다dent웹사이트 소유자는 서버의 표준 파일에 "허용 안 함" 명령어를 삽입하여 GPTBot의 크롤링 활동을 차단할 수 있다는 점에 유의해야 합니다.
속보 🚨
— 슈밤 사부(@Saboo_Shubham_) 2023년 8월 7일
데이터matic인터넷 전체에서 자동으로 데이터를 수집하는 웹 크롤러인 GPTBot을 출시했습니다.
는 GPT-4 및 GPT-5와 같은 미래 AI 모델을 학습하는 데 사용될 예정입니다!
GPTBot은 개인정보를 침해하는 출처와 유료 콘텐츠만 제공하는 사이트는 제외합니다. pic.twitter.com/oR3kY4buaU
이번 새로운 웹 크롤링 시도는 오픈아이얼(OpenAI)이 기존 GPT-4 모델의 후속 모델로 예상되는 "GPT-5"에 대한 상표 출원을 최근 제출한 데 따른 것입니다. 7월 18일 미국 특허상표청에 제출된 이 출원은 AI 기반 텍스트 및 음성 변환, 오디오-텍스트 번역, 음성 인식 등
OpenAI는 차세대 모델을 계획하고 있습니다
하지만 GPT-5에 대한 기대감이 높은 가운데, 오픈AI의 창립자이자 CEO인 샘 알트만은 GPT-5 학습을 시작하기까지는 아직 상당한 시간이 걸릴 것이라고 경고했습니다. 그는 학습 과정에 착수하기 전에 광범위한 안전성 검토가 필요하다고 강조했습니다.
라는 상표를 출원했습니다.
— YK 또는 CS Dojo 📺🐦 (@ykdojo) 2023년 8월 1일
"GPT-5"
이 상표에는
"인간의 음성 및 텍스트의 인공 생성"
"오디오 데이터 파일을 텍스트로 변환",
"음성 및 음성 인식",
"기계 학습 기반 언어 및 음성 처리"를 위한
. 👀 pic.twitter.com/54aJBovDNB
한편, 오픈AI는 데이터 수집 관행, 특히 저작권 및 동의 문제와 관련하여 우려가 커지고 있습니다. 지난 6월, 일본 개인정보보호 당국은 오픈AI가 적절한 승인 없이 민감한 데이터를 수집했다는 이유로 경고 조치를 내렸습니다. 이탈리아 역시 유럽연합 개인정보보호법 위반을 이유로 ChatGPT 사용을 일시적으로 금지했습니다. 이러한 사례들은 데이터 개인정보보호와 AI 기술을 둘러싼 감시가 강화되고 있음을 보여줍니다.
특히, OpenAI는 최근 ChatGPT를 이용한 사용자 상호작용에서 개인 정보를 무단으로 수집했다는 혐의로 16명의 원고가 제기한 집단 소송에 직면했습니다. 마이크로소프트도 피고로 포함된 이 소송은, 혐의가 입증될 경우 두 회사 모두 과거 웹 스크래핑 사건에 적용되어 온 컴퓨터 사기 및 남용 방지법을 위반한 것으로 간주될 수 있다고 주장합니다.
OpenAI가 GPTBot을 통해 웹 크롤링 영역에 진출하면서 AI 모델을 개선할 수 있는 새로운 가능성이 열리고 있습니다. 그러나 이러한 발전은 AI 업계가 혁신, 개인정보 보호, 책임 있는 데이터 사용 사이의 미묘한 균형을 유지해야 하는 법적, 윤리적 고려 사항을 수반합니다.
오픈아이