Post

Ovi: 오디오-비디오 생성을 위한 트윈 백본 크로스모달 융합

Ovi: 오디오-비디오 생성을 위한 트윈 백본 크로스모달 융합

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다.
더 자세한 내용과 원문은 아래 링크를 참고해 주세요.

➡️ 원문 보러 가기


원문 요약

이 프로젝트는 텍스트나 이미지 입력으로부터 동시에 오디오와 비디오를 생성하는 AI 모델로, Character AI가 개발한 Ovi의 기능을 공개함 Ovi는 자체 구축한 5B 규모의 오디오 브랜치와 Wan2.2 기반의 비디오 브랜치를 결합해, 고품질의 동기화된…

This post is licensed under CC BY 4.0 by the author.