OpenAI, 고급 추론 능력 갖춘 AI 모델 개발 위한 'Strawberry' 프로젝트 진행 중
ChatGPT 개발사인 OpenAI가 "Strawberry"라는 코드명으로 새로운 인공지능 모델 접근 방식을 개발하고 있다고 Reuters가 확인한 내부 문서와 관련자에 의해 밝혀졌다. Microsoft의 지원을 받는 이 스타트업은 고급 추론 능력을 제공하는 모델을 선보이기 위해 노력하고 있다. OpenAI 내부 문서에 따르면, Strawberry 프로젝트는 AI가 인터넷을 자율적으로 탐색하고 "깊은 연구"를 수행할 수 있도록 하는 것을 목표로 하고 있다.
이 프로젝트의 구체적인 작동 방식은 OpenAI 내에서도 철저히 비밀로 유지되고 있다. 문서에 따르면, Strawberry 모델을 사용하여 단순히 질문에 답하는 것을 넘어 계획을 세우고, 인터넷을 탐색하며, 신뢰할 수 있는 방식으로 깊이 있는 연구를 수행하는 AI를 개발하려는 계획이 포함되어 있다.
OpenAI 대변인은 Strawberry와 관련된 세부 사항에 대해 "우리의 AI 모델이 우리가 세상을 이해하는 방식에 더 가까워지기를 원한다"고 밝히며, 새로운 AI 기능에 대한 지속적인 연구는 업계에서 흔한 관행이라고 말했다. Strawberry 프로젝트는 이전에 Q*로 알려졌으며, 이는 이미 회사 내부에서 중요한 돌파구로 여겨졌다.
OpenAI는 이 프로젝트를 통해 AI 모델의 추론 능력을 획기적으로 향상시키기를 기대하고 있으며, Strawberry는 대규모 데이터셋으로 사전 훈련된 AI 모델을 특수한 방식으로 처리하는 것을 포함한다고 한다.
AI 연구자들은 추론 능력이 AI가 인간 또는 초인간 수준의 지능을 달성하는 데 중요한 요소라고 본다. OpenAI의 CEO인 Sam Altman은 올해 초 "AI의 가장 중요한 진보 영역은 추론 능력에 있을 것"이라고 말했다.
Strawberry 프로젝트는 이러한 도전 과제를 극복하기 위한 OpenAI의 주요 구성 요소로, 구체적으로는 사전 훈련된 모델을 "후 훈련"하는 특수한 방법을 포함한다. 이 후 훈련 단계는 예를 들어 인간이 모델의 응답에 피드백을 제공하는 것과 같은 과정을 포함한다.
Strawberry는 Stanford에서 2022년에 개발된 "Self-Taught Reasoner" 또는 "STaR" 방법과 유사한 점이 있다. STaR는 AI 모델이 스스로 훈련 데이터를 생성하여 높은 지능 수준으로 "부트스트랩"할 수 있게 한다. OpenAI는 Strawberry를 통해 긴 기간 동안 여러 단계를 계획하고 수행하는 복잡한 작업을 목표로 하고 있으며, 이를 "깊은 연구" 데이터셋을 통해 훈련하고 평가하고 있다. OpenAI는 이러한 기능을 사용하여 자율적으로 웹을 탐색하고, 소프트웨어 및 머신러닝 엔지니어의 업무를 수행할 수 있는 AI 모델을 테스트할 계획이다.