구글·어도비, 동영상 생성 AI 개발 박차
챗GPT로 전 세계적인 돌풍을 일으켰던 오픈AI가 지난 2월 AI 동영상 생성기 ‘소라’(Sora)를 공개하며 한 번 더 이목을 집중시켰다. 구글과 어도비도 동영상 생성 AI에 뛰어듦에 따라 한 차례 지각변동이 일어날 전망이다.
소라는 이용자가 입력한 텍스트 내용대로 최대 1분 길이의 고화질 영상으로 변환해주는 멀티모달 AI다. 이전까지의 영상 생성 모델이 4초 정도의 영상을 만들어낸 것과 비교하면 길이도, 품질도 모두 향상됐다.
오픈AI는 최근 소라를 써본 아티스트들의 평가를 자사 홈페이지에 게재하기도 했다. 현재 오픈AI는 제한된 수의 창작자만 소라를 사용할 수 있도록 했으며, 이들의 피드백을 토대로 모델 개선 작업을 진행 중이다.
캐나다 인디밴드 겸 영상제작 집단 샤이키즈(shy kids)의 월터 우드먼 감독은 “추상 표현주의의 새로운 시대”라는 평을 내놨다. 우드먼 감독은 ‘에어헤드’(Air Head)라는 제목으로 1분21초 분량의 영상을 선보이면서 “소라는 실제처럼 보이는 것을 만들어내는 능력도 뛰어나지만 우리를 흥분시키는 건 초현실적인 것을 만들어내는 능력”이라고 밝혔다.
디지털 AR·XR 아티스트 돈 앨런 스티븐슨은 “소라가 영상 제작 분야의 전환점이 될 것”이라고 평하기도 했다.
월스트리트저널(WSJ)에 따르면 오픈AI는 올해 하반기 소라를 공식 출시할 예정으로, 출시 후 일반 사용자들도 소라를 이용해볼 수 있을 것으로 전망된다.
구글은 최근 기업용 업무 관련 프리젠테이션 영상 제작 AI 앱 ‘구글비드(Vids)’를 출시했다. 구글 비드는 구글 클라우드 기반 업무 생산성 플랫폼인 구글 워크스페이스의 일부로 제공되며, 명령어를 통한 동영상 생성은 아니지만 사용자 이미지, 스톡영상, 기타 시각 자료들을 자동으로 종합해 영상으로 제공한다.
구글비드는 현재 제한된 사용자들이 테스트 중이며 6월 구글 랩스에서 테스트 규모가 확대될 예정이다.
지난 1월에는 최대 5초짜리 영상을 생성하는 AI ‘루미에르(Lumiere)’를 공개하기도 했다. 명령어를 비디오로 변환하는 것은 물론이고 이미지의 가려진 부분을 비디오로 구현하거나 특정 영역에 애니메이션 효과를 삽입할 수도 있다는 게 특징이다.
다만 루미에르의 출시 시기는 현재까지 정해져 있지 않았으며, 결과물 예시와 개념 논문이 깃허브에 공개됐을 뿐이다. 테스트 페이지도 아직 구현되지 않았으며 실제 출시된 모델의 기능이 100% 구현되지 못할 가능성도 제기된다.
현지 언론 디인포메이션에 따르면 데미스 허사비스 구글 딥마인드 CEO는 소라 영상 시청 후 동료에게 ‘구글이 오픈AI 기술을 따라잡기는 매우 어려울 것 같다’고 말한 것으로 알려진 바 있다.
어도비도 동영상 생성 AI 개발을 위한 영상 데이터 수집에 나섰다. AI 훈련을 위한 데이터 확보를 위한 것으로 영상 1분당 3~7달러를 지불하기로 한 것이다. 특히 감정 표현 등 일상 활동 모습을 담은 영상을 제출하는 경우 최대 120달러까지 지불하는 것으로 알려졌다.
지난 16일에는 영상 편집 플랫폼 ‘프리미어 프로’에 새롭게 적용될 주요 생성형 AI 영상 툴을 선공개하기도 했다. 사용자는 장면에서 개체를 추가 또는 제거하거나 기존 클립을 확장하는 등의 과정을 AI 툴을 통해 간소화할 수 있을 예정이다.