GPT-4o 출시, 성능 및 가격 완벽 정리

OpenAI의 새로운 언어모델 GPT-4o가 출시되었습니다. 이전 모델에 비해 어떤 점이 달라졌을까요? 성능 및 활용 예시, 가격을 정리했습니다.
May 18, 2024
GPT-4o 출시, 성능 및 가격 완벽 정리
 
🤖
지난 5월 13일, GPT-4o가 발표되었습니다. GPT-4o의 o는 ‘모든’이라는 뜻을 가진 omni의 약자인데요. 이름에 내포된 의미처럼, 여러 방면에서 지난 모델과 차이를 갖습니다. 어떤 점이 달라졌을까요? 이번 아티클에서는 기능 및 가격 등 GPT-4o에 대해 자세히 알려 드립니다.
 
목차
  • 사용 예시
  • 성능 개선
  • 가격
 
텍스트 위주의 기능을 제공하는 이전 모델과 다르게, GPT-4o는 텍스트, 오디오, 이미지의 모든 조합을 지원합니다. 특히, 시각 및 청각 이해도가 뛰어나죠. 평균 오디오 응답 시간이 0.32초로, 인간의 평균 응답 시간과 비슷합니다. 영어 및 코드 텍스트는 GPT-4 turbo의 성능과 일치합니다. 영어가 아닌 언어에서도 응답 속도가 상당히 개선되었습니다.

사용 예시를 살펴볼까요?

GPT-4o를 사용하면, 언어가 다른 두 사람이 실시간으로 대화할 수 있습니다.
“지금부터 내가 하는 말을 스페인어로 해석해 줘. 또, 그가 하는 말은 영어로 해석해 줘.”
위와 같은 명령을 부탁하자, GPT-4o는 그들이 하는 말을 각각 스페인어와 영어로 해석합니다. 로딩 속도도 딜레이가 느껴지지 않을 만큼 빠르죠.
notion image
 
GPT-4o는 이미지를 해석할 수 있습니다. 과일, 펜부터 인형까지 빠른 속도로 물체를 번역합니다.
“지금 보이는 물체는 스페인어로 뭐라 말해?”
GPT-4o는 빠르게 다음과 같은 답을 내놓습니다. “보이는 이미지는 스페인어로 사과와 바나나를 의미합니다.”
notion image
이러한 기능은 시각 장애인이 활용할 수 있는데요. 아래 이미지 속 시각 장애인은 GPT-4o의 도움을 받아 영국 곳곳을 누비죠. GPT-4o는 남자에게 보이는 건물, 자연에 대한 설명을 들려줍니다.
notion image
 
GPT-4o는 손글씨를 인식합니다. 기능을 활용하여 수학 문제를 함께 풀어나갈 수 있죠.
“질문을 통해 내 아들이 문제의 답을 도출할 수 있도록 해줘.”
그저 답을 알려주는 것이 아닌, 사람이 답을 직접 도출할 수 있도록 문제와 관련된 질문을 합니다. 화면 위의 손글씨를 인식하고 그에 맞는 설명을 이어가죠. 정답지가 아닌 일종의 수학 선생님이 된 듯합니다.
notion image
 
GPT-4o는 상황을 인식할 수 있습니다.
“우리 지금 뭐 하고 있는지 알겠어?”
다음과 같은 물음에 GPT-4o는 책상 앞에 놓인 케이크를 인식하고 ‘생일’이라는 상황을 추론하죠. 생일 축하 노래까지 불러줍니다.
notion image
 

성능은 어떻게 좋아졌을까요?

1) 음성 모드
GPT-4o 이전 모델도 음성 모드를 제공했지만, 제한 사항이 있었습니다. 오디오-텍스트 변환, 텍스트 출력, 텍스트-오디오 변환이라는 세 가지 개별 모델의 과정을 거쳐야 했죠. 따라서 대략 3-5초 정도의 시간이 지연되었습니다. 또, 변환 과정에서 화자의 수, 음색, 감정 등 많은 정보를 잃었죠.
GPT-4o는 텍스트, 오디오, 시각 등 모든 입출력이 동일한 모델(신경망)에서 수행됩니다. 따라서 앞선 모델에서 파악하지 못했던 정보들을 파악하여 더욱 정밀한 대화가 가능해졌습니다.
 
2) 안전 및 제한
GPT-4o는 데이터 필터링 및 모델 동작 개선과 같은 기술을 통해 모델을 안전하게 사용할 수 있는 기능을 내장했습니다. 사이버 보안, 모델 자율성 등에 대한 평가에도 중간 이상의 위험이 없다고 판단했죠. 또, 새로 추가된 양식에 의한 위험을 식별하기 위해 외부 전문가로 구성된 팀을 통해 안전 시스템을 구축했습니다. 예를 들어, GPT-4o를 통해 상용화될 것으로 예상되는 오디오 모델은 사전 설정된 음성으로 제한됩니다.
 
3) 언어 토큰화
토크나이저(tokenizer)는 텍스트를 모델이 식별가능한 데이터로 변환하는 것입니다. GPT-4o는 다양한 언어군에 대해 언어 토큰을 압축했는데요. 한국어는 기존 45개에서 27개로 약 1.7배 감소했습니다. 토큰 압축을 통해 속도와 비용 면에서 성능을 개선한 것이죠.
 

가격은 어떻게 책정되었나요?

GPT-4o는 무료 회원을 포함한 회원 모두가 사용 가능합니다. 하지만 무료 회원은 제한적으로 사용 가능하며, 유료 회원(Plus 계정)의 1/5 정도의 질문 횟수를 제공합니다.
더불어 GPT를 나의 제품에 통합할 수 있는 API 서비스의 가격도 낮추었습니다. GPT-4o는 GPT-4 Turbo보다 빠르고 저렴합니다. 기존 GPT-4 Turbo는 Input, Output 가격이 각각 10$, 30$임에 비해, GPT-4o는 각각 절반 가격인 5$, 15$에 사용이 가능합니다.
 

🧐 생성형 AI 기업 교육을 찾고 있다면

소개해 드린 GPT-4o를 이용하여 업무의 생산성을 올리고 기업 경쟁력을 갖추고 싶으신가요? 팀스파르타 AI 기업교육과 함께하세요. 생성형 AI의 기본기부터 전문적인 프롬프트 사용법까지. 직무별 맞춤 커리큘럼으로 알려 드립니다.
 
참고 자료
 
Share article
Subscribe to our newsletter

AI 트렌드 미디어