2024.05.18 (토)

속초25.2℃
24.5℃
철원22.0℃
동두천21.3℃
파주20.7℃
대관령19.8℃
춘천24.2℃
백령도15.9℃
북강릉26.5℃
강릉28.1℃
동해26.7℃
서울22.4℃
인천20.4℃
원주24.8℃
울릉도20.3℃
수원21.8℃
영월23.5℃
충주24.8℃
서산21.5℃
울진26.7℃
청주25.0℃
대전23.9℃
추풍령21.3℃
안동24.9℃
상주24.7℃
포항28.0℃
군산21.0℃
대구26.7℃
전주22.5℃
울산24.4℃
창원21.4℃
광주24.7℃
부산20.2℃
통영19.9℃
목포22.9℃
여수21.0℃
흑산도17.4℃
완도20.1℃
고창℃
순천21.0℃
홍성(예)21.9℃
23.1℃
제주21.3℃
고산20.3℃
성산20.3℃
서귀포20.4℃
진주22.1℃
강화18.6℃
양평23.9℃
이천23.7℃
인제24.2℃
홍천24.4℃
태백20.7℃
정선군24.1℃
제천22.3℃
보은24.0℃
천안23.0℃
보령20.1℃
부여22.3℃
금산23.3℃
23.4℃
부안20.7℃
임실23.2℃
정읍22.5℃
남원25.1℃
장수21.0℃
고창군22.7℃
영광군23.2℃
김해시22.4℃
순창군25.3℃
북창원22.8℃
양산시23.5℃
보성군21.2℃
강진군21.8℃
장흥20.4℃
해남21.0℃
고흥21.4℃
의령군24.1℃
함양군25.0℃
광양시22.5℃
진도군20.4℃
봉화21.1℃
영주23.3℃
문경21.9℃
청송군21.9℃
영덕24.5℃
의성23.0℃
구미23.6℃
영천26.0℃
경주시25.5℃
거창22.9℃
합천24.3℃
밀양24.8℃
산청23.4℃
거제20.7℃
남해20.0℃
22.3℃

기상청 제공

사진만 주면 노래하고 말하는 동영상으로 변환하는 인공지능 VASA-1

해당된 기사를 공유합니다
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사
- 가나다라마바사

AI

사진만 주면 노래하고 말하는 동영상으로 변환하는 인공지능 VASA-1

정지 이미지도 이제 노래하고 얘기한다!
놀라운 성능! 정지 이미지가 생생하게 움직임!
인공지능 기술의 발전 가능성과 악용 우려

김수현 기자
등록 2024.04.20 11:39

마이크로소프 연구소 아시아 지부 연구팀이 얼굴 사진 한 장과 음성 클립만 있으면, 그 사람이 노래하거나 말하는 동영상을 만드는 인공지능 앱을 개발했다. 이렇게 만들어진 동영상은 실사 영상처럼 매우 사실적이며, 얼굴 표정과 머리 움직임까지 정확하게 재현한다. (논문에 나오는 모든 사실적인 사진들은 가상 인물이며 실제 존재하지 않습니다.)

사진 속 인물이 움직이고 노래 부르다!

연구팀은 이 새로운 인공지능 앱 VASA-1에 대한 설명 논문을 아카이브 서버에 게시했고, 연구 프로젝트 페이지에서는 실제 동영상 샘플도 볼 수 있다.

연구팀은 제공된 음악에 맞춰 정지 이미지를 움직이고, 노래하는 동영상을 만들고자 했다. 특히 얼굴 표정까지 사실적으로 표현하는 것이 중요했다. 그 결과 카메라로 찍은 사진, 만화, 그림 등 어떤 이미지든 정지 이미지를 말하거나 노래하는 매우 사실적인 동영상으로 변환하는 VASA-1 시스템을 개발하는 데 성공했다.

연구팀은 시스템의 효과를 입증하기 위해 테스트 결과 영상 몇 개를 공개했다. 영상 중 하나는 모나리자 만화가 랩 음악을 부르고, 다른 영상에서는 여성 사진이 노래하는 모습으로 변환되었으며, 또 다른 영상에서는 한 남자 그림이 연설하는 모습을 볼 수 있다.

모든 동영상에서 얼굴 표정은 말하는 내용에 따라 변화하며, 말하는 내용을 강조한다. 연구팀은 동영상이 매우 사실적이지만 자세히 보면 인공지능으로 만들어졌다는 것을 알 수 있는 몇몇 흔적을 확인할 수 있다고 언급했다.

인공지능 딥 러닝으로 사실적인 동영상 제작

연구팀은 다양한 얼굴 표정의 수천 장 이미지로 인공지능 앱을 훈련시켰다. 현재 시스템은 512 x 512 픽셀 해상도로 초당 45 프레임의 동영상을 제작할 수 있으며, 데스크탑용 엔비디아 RTX 4090 그래픽 카드를 사용하여 동영상을 만드는데 평균 2분이 소요된다.

연구팀은 VASA-1을 게임이나 시뮬레이션에 매우 사실적인 아바타를 제작하는 데 사용할 수 있다고 제안했다. 하지만 연구팀은 악용 가능성을 인식하고 있으며, 현재로서는 일반에게 시스템을 공개하지 않을 계획이다.