오픈AI, 시청각 활용 추론·대화 가능
“같은 시기 공개, 전략일 뿐...경쟁 과열”
미라 무라티 오픈AI 최고기술책임자(CTO)가 ‘chatGPT-4o’를 소개하고 있다. [오픈AI 유튜브 캡처] |
오픈AI가 최신 거대언어모델(LLM)인 ‘GPT-4o’을 기습적으로 공개했다. 구글이 인공지능(AI) 모델 제미나이 업데이트 및 신규 AI서비스를 공개하기 바로 하루 전날 이뤄졌다.
지난해에는 구글의 ‘생성형 AI챗봇’ 일정이 공개되자, 마이크로소프트(MS)가 자체 행사를 열고 검색엔진과 생성형AI 결합을 발표하는 등 선수를 쳤다.
빅테크 기업 간 AI 대전이 본격화되고 있다. 오픈AI의 GPT-4o 기습 공개와 더불어 하루 뒤에는 구글이 제미나이 업데이트 버전 및 신규 AI를 공개할 것으로 예상된다. 제미나이 업데이트 버전에는 검색 및 생성형AI 융합, AI음성비서 ‘픽시(pixie)’에는 멀티모달 기능이 강화될 전망이다.
전문가는 오픈AI의 GPT-4o 공개가 다분히 경쟁사를 의식한 것으로 진단하고, AI 업데이트를 비롯한 빅테크 기업 간 경쟁이 심화할 것으로 내다봤다.
13일(현지 시간) 오픈AI 미라 무라티 최고기술책임자(CTO)는 GPT-4o를 시연했다. 기존 AI모델이 텍스트를 중심으로 이뤄졌다면, 이날 공개된 GPT-4o는 텍스트는 물론 청각, 시각 등을 활용해 추론 및 대화할 수 있는 음성 어시스턴트다.
무라티 CTO “GPT-4o는 GPT-4 레벨의 지능을 더 빨리 제공하는데 초점을 맞췄다”며 “텍스트, 시각, 청각 데이터를 넘나드는 능력이 더욱 좋아졌다”고 강조했다. 인간과 마찬가지로 보고, 듣고, 말하기가 가능하다는 것이다.
오픈AI는 GPT-4o을 50개 언어로 출시할 예정이다. 모든 이용자들이 GPT-4o를 무료로 이용할 수 있지만, 기존 유료 회원들은 무료 회원보다 5배 많은 메시지를 한꺼번에 입력할 수 있다.
순다르 피차이 구글 최고경영자 [로이터] |
오픈AI가 GPT-4o를 공개하면서 구글 등 빅테크 간 AI를 둘러싼 경쟁은 더욱 치열해질 전망이다. 특히 GPT-4o 공개 시점은 구글이 미국 캘리포니아 마운틴뷰 본사에서 개발자콘퍼런스를 개최하기로 한 ‘전날(14일·현지 시간)’이었다.
개발자콘퍼런스에서 구글은 자사 AI모델인 제미나이의 업데이트 및 신규 AI서비스를 공개할 예정이었다.
앞서 구글은 오픈AI의 챗GPT에 맞서 제미나이를 공개하고 검색 등 적용을 모색해왔는데, 이번 개발자콘퍼런스에서 검색과 생성형AI 융합 관련 청사진을 내놓을 것으로 예상된다. 또 제미나이로 구동되는 AI 음성비서 픽시는 특정 물건 사진 촬영을 통한 사용법, 구입 장소 찾기 기능 등 멀티모달 기능이 적용될 것으로 업계는 전망하고 있다.
전문가들은 갑작스런 오픈AI의 GPT-4o 공개가 구글을 의식한 ‘전략적인 판단’이라고 봤다. 자본력을 갖춘 빅테크 간 경쟁이 고조되면서 경쟁자의 AI신작 발표에 맞서 대중의 시선을 분산시킨 다는 것이다.
샘 알트먼 오픈AI 최고경영자 [소프트뱅크벤처스 제공] |
실제로 지난해 2월에는 구글이 챗GPT 대항마인 생성형 AI챗봇 공개 일정을 공지하자, 마이크로소프트(MS)가 하루 먼저 자체 행사를 열고 검색엔진 빙과 생성형AI 결합을 공개하기도 했다.
이 때문에 전문가들은 GPT-4o 기존 버전인 GPT-4 시리즈로, 버전 넘버(4)를 바꿀 만큼 혁신적인 내용은 아닐 것으로 진단했다. 빅테크 기업 간 경쟁이 과열 되면서 경쟁기업으로부터 스포트라이트를 가져오기 위한 전략의 일환에 불과하다는 것이다.
김명주 서울여대 정보보호학부 교수(바른AI연구센터장)는 “구글의 제미나이1.5 공개 시기 오픈AI가 정밀 동영상을 만드는 생성형 AI ‘소라’를 발표하는 등 희석시키려는 전략을 활용한다”며 “더욱이 버전 번호를 바꿀 만큼 혁신적인 업데이트 등도 아니”라고 설명했다.
이어 “생성형 AI 시장은 자본력이 떨어지는 회사가 쫓아가지 못 할 정도로 ‘자본 싸움’이 됐다”며 “이 때문에 혁신적이지 않은 것을 오도하는 경우도 있는데, 경쟁 과열은 윤리적으로도 좋지 않다”고 덧붙였다. 고재우 기자
ko@heraldcorp.com