오픈AI, 브라우저를 사용하여 작업을 처리하는 새로운 AI 에이전트 Operator 출시

2025년 1월 23일, 오픈AI는 작업을 자동화하고 사용자를 대신하여 조치를 취할 수 있는 범용 도구인 AI 에이전트 Operator의 연구용 프리뷰 버전을 출시한다고 발표했습니다. 처음에는 미국 사용자에게 월 200달러의 챗GPT Pro 구독 플랜으로 제공되며, 향후 오픈AI의 플러스, 팀, 엔터프라이즈 등급의 더 많은 사용자에게 출시될 예정입니다. 오픈AI CEO 샘 알트만은 라이브스트림에서 오퍼레이터가 다른 국가에서도 곧 제공될 것이라고 말했지만, 유럽에서는 시간이 좀 걸릴 것이라고 언급했습니다.

Operator.chatgpt.com을 통해 연구 미리보기를 이용할 수 있으며, Operator를 모든 챗GPT 클라이언트에 통합할 계획입니다. Operator는 여행 숙소 예약, 레스토랑 예약, 온라인 쇼핑 등 다양한 온라인 작업을 자동화하는 것을 목표로 합니다. 인터페이스는 쇼핑, 배달, 식사, 여행 등 여러 가지 작업 카테고리를 제공합니다. 활성화되면 Operator는 작업을 독립적으로 완료하는 작은 전용 웹 브라우저를 시작하고 사용자에게 작업에 대한 실시간 설명을 제공합니다. 사용자는 언제든지 제어권을 유지하고 개입할 수 있어 AI 에이전트의 활동을 감독할 수 있습니다.

Operator는 오픈AI의 컴퓨터 사용 에이전트(CUA) 모델에 의해 구동되는데, 이 모델은 GPT-4o 모델의 시각적 기능과 고급 추론 기술을 통합합니다. CUA 모델은 웹사이트의 프런트엔드 인터페이스와 상호 작용하며, 버튼, 메뉴, 양식을 인간이 사용하는 방식과 유사하게 사용하므로 개발자용 API가 필요하지 않습니다. 오픈AI에 따르면, CUA 모델은 외부 부작용이 있는 작업을 완료하기 전에(예를 들어, 주문 제출 또는 이메일 전송 전) 사용자의 확인을 요청하도록 설계되어, 사용자가 영구적으로 적용되기 전에 모델의 작업을 다시 한 번 확인할 수 있습니다. 오픈AI는 DoorDash, eBay, Instacart, Priceline, StubHub, Uber 등 여러 회사와 제휴하여 서비스 이용약관 준수를 보장하고 있습니다.

오픈AI는 고급 기능에도 불구하고, 운영자가 한계가 있으며 모든 시나리오에서 안정적으로 작동하지 않을 수 있음을 인정합니다. 특히, CUA 모델은 세부적인 슬라이드쇼를 만들거나 복잡한 캘린더 시스템을 관리하는 것과 같은 복잡하거나 전문화된 작업에 어려움을 겪습니다. 또한 사용자 개입이 필요한 고도로 맞춤화되거나 비표준적인 웹 인터페이스에 대한 문제도 직면합니다. 은행 업무와 같은 민감한 거래의 경우, 사용자는 신용카드 정보를 수동으로 입력해야 합니다. 보안을 강화하기 위해 오픈AI는 이메일과 같은 민감한 정보가 포함된 작업에 대해 사용자의 적극적인 감독을 요구하여, 사용자가 잠재적인 실수를 영구적으로 수정할 수 있도록 합니다.

또한, 오퍼레이터는 오용을 방지하기 위한 보호 장치가 내장되어 있습니다. 동시 수행 작업 수에 대한 동적 속도 제한과 전체 일일 사용량 제한이 있습니다. 일부 보안 제한은 이메일 전송이나 캘린더 이벤트 삭제 등의 작업을 방지하지만, 오픈AI는 이러한 제한을 해결하기 위한 향후 업데이트를 계획하고 있습니다. 또한, 오퍼레이터는 비밀번호 입력란이나 Captcha 확인과 같은 복잡한 인터페이스를 처리해야 하는 문제에 직면하고 있으며, 사용자는 필요할 때 이를 제어해야 합니다.

오픈AI는 피싱 사기, DDoS 공격, 티켓 스캘핑 등 AI 에이전트의 잠재적 위험을 인지하고 있으며, 의심스러운 활동을 감지하고 차단하기 위한 모니터링 시스템을 구현하고 있습니다. 오픈AI는 운영자가 악의적인 프롬프트, 숨겨진 지침, 피싱 시도에 대한 모델의 취약성을 제한하는 도구를 사용한다고 밝혔습니다. 의심스러운 활동이 감지되면 실행을 일시 중지하는 모니터링 시스템이 마련되어 있으며, 자동화된 보호 기능과 사람이 검토하는 보호 기능 모두 정기적으로 업데이트됩니다.

오픈AI는 구글, 앤트로피컬, 래빗과 같은 경쟁사들보다 뒤처져 AI 에이전트를 출시하는 데 신중한 접근 방식을 취하고 있습니다. 그러나, 연구용 프리뷰로 운영되는 오픈AI의 구조화된 출시는 본격적인 배포 전에 안전성과 신뢰성을 보장하겠다는 오픈AI의 약속을 반영합니다. 구글의 프로젝트 마리너도 마찬가지로 신용카드 결제 같은 민감한 작업을 AI 에이전트가 처리하지 못하도록 제한하여 무단 거래를 방지합니다.

Operator는 최근 출시된 Tasks에 이어 오픈AI의 AI 에이전트 기술 분야에서 가장 과감한 행보로, 사용자들이 알림을 자동화하고 메시지를 예약할 수 있도록 해줍니다. Siri나 Alexa와 같은 이전의 가상 비서들과는 달리, Operator의 기능은 정보 처리에서 나아가 온라인에서 가시적인 행동을 취하는 것으로 확장됩니다. AI 에이전트가 주목을 받으면서, 사용자들이 인터넷과 상호 작용하는 방식을 재정의하여 일상적인 작업을 보다 효율적이고 자동화할 것으로 기대됩니다.

오픈AI는 오퍼레이터의 미래에 대해 낙관적인 태도를 유지하고 있으며, 지원 자료에서 이미 다양한 사례에서 유용성이 입증되었으며, 더 넓은 범위의 작업에 걸쳐 그 신뢰성을 확대하는 것을 목표로 하고 있다고 밝히고 있습니다. 추가적인 개선과 보안 조치로, 오퍼레이터는 온라인 활동을 간소화하고자 하는 기업과 개인에게 없어서는 안 될 도구가 될 수 있습니다.

비슷한 글