오픈AI의 최신 모델인 챗GPT-5가 출시되자마자 사용자들로부터 실망을 사고 있다. 샘 올트먼 CEO는 GPT-5를 “박사급 전문가 수준”의 성능을 자랑하며, 범용인공지능(AGI)을 향한 중요한 진전을 이루었다고 발표했지만, 실제 사용 결과는 크게 다르다는 평가를 받고 있다.
지난 7일 처음 공개된 GPT-5에 대한 기대감은 한껏 부풀어 있었지만, 사용자들이 직접 체험한 결과는 실망스러웠다. 기본적인 인명이나 지명을 구분하지 못하는 오류가 속속 드러났기 때문이다. 예를 들어, 사용자가 미국의 초기 대통령 12명의 사진과 이름이 포함된 표를 요청하자, GPT-5는 조지 워싱턴을 기어지 워싱지언, 토머스 제퍼슨을 토머슨 제퍼슨으로 잘못 표기했다. 또한, 미국의 주 이름을 표시하는 지도 작업에서는 캘리포니아를 ‘칼포히아’, 아이다호를 ‘1오아호’로 기재하는 실수를 범했다.
이러한 오류는 사용자들 사이에서 빠르게 공유되며 조롱거리로 변모했다. 특히, “GPT-5가 이전 모델인 GPT-4o보다 못하다”는 비판이 잇따르며 온라인에서 이전 버전의 복원을 요구하는 청원 운동이 벌어졌다. 이에 오픈AI는 유료 사용자들에게 GPT-4o를 사용할 수 있는 권한을 제공하기로 결정했다.
올트먼 CEO는 9일 엑스(X, 구 트위터)에 “자동전환장치의 고장으로 GPT-5의 성능이 실제보다 떨어져 보였으며, 빠르게 개선할 것”이라고 설명했으나, 이후에도 여전히 결과물이 엉망이라 비판을 면치 못했다. AI 비평가로 알려진 게리 마커스 교수는 오픈AI의 신뢰성에 의문을 제기하며, “이런 수준의 모델에 브랜드 이름을 붙일 것이라곤 생각하지 못했다”라며 경고의 목소리를 높였다.
특히 GPT-5 출시 직후, 일론 머스크 CEO는 자신이 설립한 xAI의 모델인 ‘그록’의 성능이 더 뛰어나다고 주장했다. 그러나 마커스 교수는 “그록도 별로 나을 게 없다”는 입장을 보이며 AI 성능에 대한 우려를 나타냈다.
이처럼 사용자와 전문가들 사이에서의 비판이 쏟아지고 있는 가운데, 오픈AI의 대응이 얼마나 효과적일지, 그리고 차기 버전에서 과연 어떤 개선을 이룰 수 있을지 주목된다.