
KarinAI :: 프로젝트 소개개인 프로젝트/KarinAI2024. 2. 22. 21:06
Table of Contents
프로젝트 설명
'KarinAI'는 'GPT 3.5 API'와 'CeVIO AI'의 '나츠키 카린' 음성 모델을 활용한 인공지능 챗봇입니다.
메인 프레임워크는 유니티 엔진을 사용하였습니다.
개발 기간 : 20230311 ~ 20230423
개발 내역
- 음성 인식 Whisper STT
- Papago API를 활용한 실시간 번역
- GPT API를 활용한 인공지능 챗봇 시스템
- TTS 음성 모델에 의한 응답 및 WPF 프로세스 분기
- 캐릭터 모델 및 모션 적용 등 시각화
- UI
- 호감도와 감정 파라미터 시스템
- 알람 시계 설정 이벤트
UI
호감도와 감정 파라미터 시스템
사용자와의 채팅을 통해 캐릭터의 호감도가 실시간으로 변화합니다.
호감도는 음성 모델의 감정 파라미터에 연계되어 억양과 음정을 변화시킵니다.
예를 들어 캐릭터의 호감도가 낮다면 조금 화난 목소리로 응답합니다.
알람 시계
기존 'ChatGPT'는 현실의 시간을 반영하지 못하지만 'KarinAI'는 사용자의 시스템 시간을 받아와서 알람 시계를 구현할 수 있었습니다.
알람 시계는 캐릭터의 호감도에 따라 울릴 수도, 울리지 않을 수도 있습니다.
그러니 평상시에 호감도를 잘 쌓아놓는 편이 좋겠네요!
API 사용 내역
- OpenAI API - gpt 3.5 turbo, whisper-1
- NaverDev - Papago API
- Voicevox API
- CevioAI API
플로우차트
flowchart LR
n0(Input)
n1(OpenAI API)
n2(NaverDev API)
n25(OpenAI API)
n3(CevioAI API)
n35(CevioAI Controller)
n4(Output)
n1s1[Whisper]
n25s1[ChatGPT]
n2s1[Papago]
n3s1[CevioAI]
n0-->|Mic|n1
n3-->|IOS Build|n4
n1<-->|Whisper-1|n1s1
n25<-->|GPT3.5 turbo|n25s1
n2<-->|Translate|n2s1
n3<-->n35
n35-->|TTS|n3s1
subgraph Unity Framework
direction LR
n1-->n2
n2-->n25
n25-->n3
end
subgraph WPF
direction TB
n35
end
향후 계획
- AR 적용.
'개인 프로젝트 > KarinAI' 카테고리의 다른 글
KarinAI :: Final Test (0) | 2024.02.22 |
---|---|
KarinAI :: Motion & Event (0) | 2024.02.22 |
KarinAI :: UI (0) | 2024.02.22 |
KarinAI :: Voice conversion (6) & Corpus (0) | 2024.02.22 |
KarinAI :: Voice conversion (5) (0) | 2024.02.22 |
@체리비! :: 체리비 Lab。
틀린 부분은 언제든지 말씀해주세요!!! 감사합니다!