지금까지 AI Human이 컴퓨터 그래픽(CG) 바탕으로 가상의 인간을 만들었다면 이스트소프트의 AI Human은 인공지능(AI)를 활용한 실사 타입의 AI Human을 창조해냅니다.
AI Clone
실제 인물을 완벽하게 재현하는 AI Clone 제작에는 목소리 생성 인공지능 기술(Text To Speech, TTS)과 얼굴 생성 인공 지능 기술(Speech To Face, STF)을 활용합니다. 즉, 원하는 텍스트를 입력하면 목소리부터 얼굴 영상까지 바로 생성하는 기술로써, TTS(Text To Speech)를 통해 입력한 텍스트를 음성으로 변환하고 STF(Speech To Face)를 거쳐 음성에 적절한 얼굴 영상을 생성하도록 설계하여, 얼굴부터 제스처까지 자연스러운 모습을 구현하고 있습니다.
목소리 생성 인공지능이란?
텍스트 음성 변환 기술 Text To Speech (TTS)로써 목소리 생성 AI가 입력된 텍스트를 음성으로 변환하여 활자가 목소리로 생성되는 기술을 말합니다. 이를 실제 사람이 말하는 것과 똑같이 구현하기 위해 말하는 방식, 습관 등을 딥러닝으로 분석하고 이를 토대로 학습합니다.
얼굴 생성 인공지능이란?
음성 신호 얼굴 변환 기술 Speech To Face (STF)로써 목소리에 맞는 얼굴을 구현하기 위해 얼굴 생성 AI를 거치는 과정입니다. 주어진 음성 파일을 사람이 말하는 영상으로 변환하기 위해 화자의 말하는 습관, 억양, 빠르기 등 특징들을 반영하고 본래 얼굴 생김새도 함께 입력합니다.
만들어진 음성과 얼굴을 합성하면 주어진 텍스트를 읽는 새로운 AI Clone의 영상이 만들어집니다.
Service Uses실제 사람을 그대로 재현하여, 언제 어디서든 쉽게 활용 할 수 있는 AI Clone
BroadcastAI 아나운서, AI 기자, AI 기상캐스터 등
EducationAI 강사, AI Tutor
BusinessAI Concierge, AI Receptionist 등 다양한 비즈니스 현장에서 사용 가능
AI Persona
AI Persona은 현실에 존재하지 않는 가상의 인물로서, 이스트소프트가 개발하고있는 '가상 인격체(Virtual Identity)'시스템을 통해 구현한 새로운 디지털 휴먼입니다. AI Persona은 Face Generation 기술을 통해 새로운 얼굴을 생성하고 있으며 존재하지 않는 인물을 만들어 내기 위한 Pre Processing 과정(‘전처리 과정’)을 거쳐 다양한 얼굴을 생성 할 수 있는 Face Creation까지 진행됩니다.
Pre Processing
Pre Processing 단계를 거쳐 사람의 얼굴을 학습한 인공지능이 AI Persona을 만들어 내는 단계로서 얼굴 세부 사항, 목소리, 표정 등의 스타일을 자유롭게 지정하여 이에 적합한 AI Persona을 제작합니다. 컴퓨터 그래픽(CG)의 높은 제작비와 한정된 수량이라는 한계에서 벗어나 딥러닝을 통해 원하는 정보값 입력만으로 다양한 스타일의 AI Human을 만들 수 있는 이스트소프트의 원천 기술입니다.
Face Creation
Pre Processing 단계를 거쳐 사람의 얼굴을 학습한 인공지능이 AI Persona을 만들어 내는 단계로서 얼굴 세부 사항, 목소리, 표정 등의 스타일을 자유롭게 지정하여 이에 적합한 AI Persona을 제작합니다. 컴퓨터 그래픽(CG)의 높은 제작비와 한정된 수량이라는 한계에서 벗어나 딥러닝을 통해 원하는 정보값 입력만으로 다양한 스타일의 AI Human을 만들 수 있는 이스트소프트의 원천 기술입니다.
Service Uses
인플루언서, 아이돌, 모델, 아나운서 등 초상권 제약에서 벗어나 자유롭게 사용 가능한 AI Persona