
KarinAI :: Voice conversion (4)개인 프로젝트/KarinAI2024. 2. 22. 20:05
Table of Contents
CevioAI
장점
- 세부조정을 할 수 있다. (감정파라미터, 피치, 알파값 조절 등)
- CevioAI는 Voicevox와 달리 웹 통신요청이 아니라서 더 많은 양의 문장을 전달할 수 있다.
(과부하 제한으로 인한 문제가 없다.) - CevioAI는 사용자의 컴퓨터 자원을 사용하기 때문에 음성 생성이 더 빠르다.
단점
- 기본 튜닝은 Voicevox의 ‘ずんだもん’이 더 잘되어 있다.
이건 직접 알파값이나 피치조절을 통해서 튜닝을 해봐야 할 듯.
Wav 참조는 어떻게??
ios빌드시 프로젝트 외부의 wav파일을 참조할 수 없다.
또한 CevioAI도 마찬가지로 ios에선 사용불가.
따라서 빌드시에는 개별적인 tts모델을 직접 만들어야 할 듯.
플로우차트
flowchart LR
n0(Input)
n1(OpenAI API)
n2(NaverDev API)
n25(OpenAI API)
n3(CevioAI API)
n35(CevioAI Controller)
n4(Output)
n1s1[Whisper]
n25s1[ChatGPT]
n2s1[Papago]
n3s1[CevioAI]
n0-->|Mic|n1
n3-->|IOS Build|n4
n1<-->|Whisper-1|n1s1
n25<-->|GPT3.5 turbo|n25s1
n2<-->|Translate|n2s1
n3<-->n35
n35-->|TTS|n3s1
subgraph Unity Framework
direction LR
n1-->n2
n2-->n25
n25-->n3
end
subgraph WPF
direction TB
n35
end
'개인 프로젝트 > KarinAI' 카테고리의 다른 글
KarinAI :: Voice conversion (6) & Corpus (0) | 2024.02.22 |
---|---|
KarinAI :: Voice conversion (5) (0) | 2024.02.22 |
KarinAI :: Voice conversion (3) & CevioAI (1) | 2024.02.22 |
KarinAI :: Voice conversion (2) (0) | 2024.02.22 |
KarinAI :: Voice conversion (1) (0) | 2024.02.22 |
@체리비! :: 체리비 Lab。
틀린 부분은 언제든지 말씀해주세요!!! 감사합니다!