• 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

AI platform

"사람 다 됐네"...챗GPT, 이젠 '말'도 한다

오픈AI, 음성 대화·이미지 분석 기능 등 추가
음성 명령 수행하는 데서 나아가 '대화' 가능

URL복사

투데이e코노믹 = 우혜정 기자 | 인공지능(AI)과 사람처럼 대화를 나눌 수 있는 시대가 열렸다. 오픈AI의 챗봇 챗GPT가 문자를 주고 받는 데서 나아가 듣고, 보고, 말할 수 있게 됐다.


지난 25일(현지시간) 오픈AI는 챗GPT와 음성으로 대화하고 이미지를 보고 질문에 답할 수 있는 기능을 추가한다고 밝혔다. 오픈AI는 “생활 속에서 챗GPT를 더욱 다양하게 활용할 수 있게 됐다”고 밝혔다. 


지금까지 프롬프트를 통해 질문과 답변을 주고 받았던 챗GPT가 음성으로 대화할 수 있게 된 것이다. 아마존의 알렉사, 애플의 시리, 삼성의 빅스비와 유사한 기능이지만 기존 음성AI 서비스가 이용자의 음성 명령을 실행하는 데 초점이 맞춰져 있는 것과 달리 챗GPT는 '대화'를 할 수 있다.


예컨대 알렉사 등은 미리 설정된 제한된 질문 목록에 대해서만 답을 할 수 있다. 하지만 챗 GPT는
음성으로 질문을 하면 이를 텍스트로 변환해 대규모 언어 모델(LLM)에 전달하고, 답변을 받아 다시 음성으로 변환해 말한다. LLM은 인터넷에서 수집한 방대한 양의 텍스트를 분석해 즉석에서 언어를 생성하기 때문에 더 빠르고 유연한 답변이 가능하다.


챗GPT 음성은 5가지 형태로 구성됐으며 이 중 하나를 이용자들이 선택할 수 있다.

 

챗GPT에 수학문제 사진 보내고 "문제 풀어줘"

 

오픈AI는 또 챗GPT에 이미지를 '보고 답하는' 기능도 탑재한다. 수학문제를 사진으로 찍어 문제를 풀어달라고 하거나 자전거 매뉴얼과 공구함 사진을 올려 "자전거 안장을 낮추려는데 어떤 공구를 써야 해?"라고 묻고 답변을 받을 수 있는 것이다.


챗GPT의 추가 기능은 약 2주 안에 월 20달러의 ‘GPT플러스’ 구독자에게 선공개된다.


한편 지난 19일(현지시간) 구글은 자사 AI 챗봇 바드 이용자들이 보다 정교한 답변을 받을 수 있도록 서비스를 업데이트했다. 그 다음날에는 아마존이 생성형 AI를 접목한 ‘알렉사 2.0′을 선보이였다. 빅테크 기업들이 AI 챗봇 개발에 총력을 기울이면서 관련 시장 경쟁이 더 치열해질 것으로 전망된다.