챗GPT가 내세운 고급 음성 모드…기대 이상에도 아쉬움 남아 [체험기]

고급 vs. 표준 음성 모드 반응 속도의 차이는? 경상·충청·제주·전라 등 사투리 구사 가능해 어드밴스드 음성 모드, 시간 제한이 걸림돌

2024-10-01     강수연 기자

[시사오늘·시사ON·시사온=강수연 기자]

최근 챗GPT가 한국어 지원을 대폭 강화한 ‘어드밴스드 음성 모드’를 출시했다. 이번 업데이트는 기존의 어색한 음성 말투를 개선, 한국어 사투리까지 인식할 수 있도록 한 것이 특징이다. 정말 AI가 사투리까지 완벽히 이해하고 대응할 수 있을까? 기자는 반신반의로 챗GPT와 대화를 나눠봤다.

새롭게 공개된 챗GPT 어드밴스드 음성 모드는 한국어와 영어를 포함한 50여 개 언어의 사용성과 음성 인식 개선을 이뤘다. 지난 7월 선보인 ‘스탠다드 음성 모드’ 이후 불과 2개월 만의 업데이트라는 점도 눈길을 끈다. 실시간 음성 대화 기능을 포함한 ‘챗GPT-4o’의 개선형 모델로 보면 된다.

챗GPT와 대화하기 이전에도 생성형 AI(인공지능)를 이용해 본 적은 있다. 물론 음성 대화 시의 어색함으로 인해 사용을 꺼린 게 사실이다. 문장 구조가 자연스럽지 않거나, 기계적인 억양 때문에 대화가 매끄럽지 않아서다. 대화의 맥락을 이해하지 못하는 경우도 빈번했다.

하지만 이번 어드밴스 음성 모드는 확실히 달랐다는 게 기자의 생각이다. “저녁 메뉴 추천해 줘” 같은 일상적인 질문을 던지자 챗GPT는 “오늘 저녁엔 삼겹살 어때? 구워서 김치랑 같이 먹으면 정말 맛있잖아. 또는, 간단하게 파스타나 볶음밥도 좋을 것 같아. 뭐가 끌려?”라고 답했다.

재차 기자는 “저녁으로 김치볶음밥을 먹었어”라고 일상 대화를 건네자, 챗GPT는 “만들어 먹었어?”라고 물었다. 이처럼 챗GPT와의 대화는 부드럽고 자연스럽게 이어졌다. 대화 흐름도 끊기지 않았다. 이렇다 보니 AI인 것을 잊고 마치 사람과 얘기하는 듯한 착각이 들었다.

‘사투리 인식’ 기능 역시 기대 이상이다. 챗GPT는 이번 업데이트를 통해 경상도, 전라도, 충청도 등 사투리를 알아들을 수 있게 됐다.

우선 기자는 챗GPT에게 충청도 사투리로 대화할 것을 요구했다. 그러자 챗GPT는 “오늘 날씨 참 좋네유. 뭐 도와드릴 거 있슈?”라고 충청도 억양을 제대로 살리며 말했다.

기자가 예상하지 못한 결과였다. 한국어는 지역마다 사투리가 다양해 AI가 이해하는 것이 쉽지 않을 수 있다고 생각했는데, 챗GPT는 완벽한 사투리를 구사했다.

실시간 음성 반응 속도도 놀라웠다. 음성을 인식하는 데 걸리는 시간이 거의 느껴지지 않아, 끊김 없이 대화할 수 있었다. 챗GPT의 즉각적인 피드백은 몰입감을 높여줬다.

한국은 IT 인프라와 기술적 수요가 높다. 하지만 주요 AI 플랫폼은 여전히 한국어 지원에 한계를 보이고 있는 상황이다. 특히 애플의 AI 서비스는 한국어 지원 일정이 불투명하며, 일부 번역 AI 플랫폼들은 어색한 문장 구조와 비문을 생성하는 문제를 노출한다.

이런 가운데 오픈AI는 한국어 강화 전략을 토대삼아 한계를 넘어서고 있다. 한국어는 문법과 어휘 구조가 복잡하여 AI가 자연스럽게 처리하기 어려운 언어로 꼽힌다. 하지만 챗GPT는 이를 극복하며 사용자들에게 자연스러운 경험을 제공하고 있는 것이다.

물론 다소간의 문제점도 있다. 고급 음성 모드는 일일 사용 시간제한이 있다. 기자와 챗GPT간 대화가 한창 무르익을 쯤 곧바로 한도 도달 알림이 뜨며, 대화가 종료됐다. 이 경우 표준 음성으로 전환된다.

표준 음성으로 전환된 후의 경험은 아쉬웠다. 표준 음성은 고급 음성에 비해 반응 시간이 길었고, 대화의 흐름이 자연스럽지 않아 이질감이 느껴졌다. 고급 음성이 제공한 자연스러운 대화와 몰입감은 표준 모드와 큰 간극을 보였다.

결론적으로 고급 음성 모드를 사용하기 위해 매달 20달러(약 2만6730원)를 지불할 가치가 있는지는 더 따져봐야 하겠다. 일일 사용 제한이 있는 점부터가 매력적이지 않다. 신기한 경험 제공은 의미가 있으나, 아직 일상 속에서 필요한 기능일지는 체감키 어려웠단 생각이다.