"사람 다 됐네"...챗GPT, 이젠 '말'도 한다

  • 등록 2023.09.27 19:18:05
크게보기

오픈AI, 음성 대화·이미지 분석 기능 등 추가
음성 명령 수행하는 데서 나아가 '대화' 가능

투데이e코노믹 = 우혜정 기자 | 인공지능(AI)과 사람처럼 대화를 나눌 수 있는 시대가 열렸다. 오픈AI의 챗봇 챗GPT가 문자를 주고 받는 데서 나아가 듣고, 보고, 말할 수 있게 됐다.


지난 25일(현지시간) 오픈AI는 챗GPT와 음성으로 대화하고 이미지를 보고 질문에 답할 수 있는 기능을 추가한다고 밝혔다. 오픈AI는 “생활 속에서 챗GPT를 더욱 다양하게 활용할 수 있게 됐다”고 밝혔다. 


지금까지 프롬프트를 통해 질문과 답변을 주고 받았던 챗GPT가 음성으로 대화할 수 있게 된 것이다. 아마존의 알렉사, 애플의 시리, 삼성의 빅스비와 유사한 기능이지만 기존 음성AI 서비스가 이용자의 음성 명령을 실행하는 데 초점이 맞춰져 있는 것과 달리 챗GPT는 '대화'를 할 수 있다.


예컨대 알렉사 등은 미리 설정된 제한된 질문 목록에 대해서만 답을 할 수 있다. 하지만 챗 GPT는
음성으로 질문을 하면 이를 텍스트로 변환해 대규모 언어 모델(LLM)에 전달하고, 답변을 받아 다시 음성으로 변환해 말한다. LLM은 인터넷에서 수집한 방대한 양의 텍스트를 분석해 즉석에서 언어를 생성하기 때문에 더 빠르고 유연한 답변이 가능하다.


챗GPT 음성은 5가지 형태로 구성됐으며 이 중 하나를 이용자들이 선택할 수 있다.

 

챗GPT에 수학문제 사진 보내고 "문제 풀어줘"

 

오픈AI는 또 챗GPT에 이미지를 '보고 답하는' 기능도 탑재한다. 수학문제를 사진으로 찍어 문제를 풀어달라고 하거나 자전거 매뉴얼과 공구함 사진을 올려 "자전거 안장을 낮추려는데 어떤 공구를 써야 해?"라고 묻고 답변을 받을 수 있는 것이다.


챗GPT의 추가 기능은 약 2주 안에 월 20달러의 ‘GPT플러스’ 구독자에게 선공개된다.


한편 지난 19일(현지시간) 구글은 자사 AI 챗봇 바드 이용자들이 보다 정교한 답변을 받을 수 있도록 서비스를 업데이트했다. 그 다음날에는 아마존이 생성형 AI를 접목한 ‘알렉사 2.0′을 선보이였다. 빅테크 기업들이 AI 챗봇 개발에 총력을 기울이면서 관련 시장 경쟁이 더 치열해질 것으로 전망된다.

우혜정 기자 wclefnote@todayeconomic.com
Copyright @2020 투데이e코노믹 Corp. All rights reserved.




제호 : 투데이e코노믹 | 서울특별시 강서구 강서로 385, 8층 804-27호(마곡동, 우성에스비타워) 등록번호 : 서울,아52937 | 등록일/발행일 : 2020년 3월 9일 | 발행인/편집인 : 박재형 | 전화번호 : 010-2491-8008 | 운영사 : JH미디어 | 전화번호 : 070-4045-5491 Copyright ©2020 투데이e코노믹. All rights reserved. 「열린보도원칙」 본 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다. 고충처리인 l 우혜진 070-4045-5491 l wh5222@todayeconomic.com