저는 유튜브나 인스타그램 같은 SNS 플랫폼도 함께 운영하고 있는데요! 콘텐츠를 만들다 보면 내 목소리 대신 인공지능 AI 목소리가 필요한 순간이 종종 있습니다.
그동안 저는 ‘Vrew’라는 영상 편집 프로그램에 포함된 TTS(Text to Speech) 기능을 사용해 왔습니다. 하지만 음성이 자연스럽지 않고 기계음 같아서 자주 활용하진 않았습니다. 그럼에도 불구하고 콘텐츠 아이디어상 꼭 필요할 때는 어쩔 수 없이 사용하곤 했죠.
그러던 중 최근에 Google AI Studio에서 제공하는 무료 TTS 기능을 알게 되었고, 직접 사용해보면서 정말 깜짝 놀랐습니다. 이 TTS는 단순한 음성 출력이 아니라, 대화 상황에 따라 감정 연기까지 가능하다는 점이 인상 깊었습니다.
기쁨, 놀람, 슬픔, 차분함 등 다양한 감정을 표현하는 목소리를 듣고 나니, TTS 기술이 AI와 결합해 얼마나 사실적으로 발전했는지 실감하게 되었습니다.
그런데 의외로 Google AI Studio의 무료 TTS 기능을 모르는 분들이 많더라고요. 아직 널리 알려지지 않은 점이 아쉬워서, 오늘 이 글을 통해 직접 소개해드리려 합니다.
콘텐츠에 감정을 담은 자연스러운 AI 음성을 넣고 싶다면, Google AI Studio에서 제공하는 무료 TTS 기능을 꼭 한번 사용해보세요. 사람처럼 말하는 AI 음성이 여러분의 콘텐츠에 큰 힘이 될 수 있습니다.
정말 놀라울 정도로 자연스럽습니다!
Google AI Studio 무료 TTS 사용 방법
회원 가입(필수)
1 아래 링크를 클릭하시면 Google AI Studio 사이트에 접속 할 수 있습니다.
2 Google AI Studio에서 제공하는 TTS 기능은 회원 가입을 해야 사용할 수 있습니다. 따라서 ‘Sign into Google AI Studio’ 버튼을 클릭하여 Google 계정으로 로그인하거나 회원 가입을 진행해야 합니다.
3 이미 로그인된 상태라면 현재 계정을 선택하시면 됩니다. 로그인이 되어 있지 않다면 Google 계정으로 로그인을 진행하세요.
또한, 간혹 집 주소를 입력하라는 항목이 나타날 수 있습니다. 이 경우에는 임의로 주소를 입력한 뒤 ‘저장’ 버튼을 클릭하면 됩니다.
4 "It's time to build"라는 팝업 창이 나타나면, 우측 상단의 'X' 아이콘을 클릭하여 팝업을 종료합니다.
5 그러면 서비스 약관에 대한 팝업 창이 나타납니다. 약관 내용을 확인한 뒤 동의 항목에 체크하고 "동의" 버튼을 클릭하면, Google AI Studio에서 제공하는 감정 연기까지 가능한 무료 TTS 기능을 자유롭게 사용할 수 있습니다.
감정 연기 가능한 무료 TTS 사용 방법
1 우측 상단에서 ‘Gemini 2.5 Pro’ 버전을 선택한 후, ‘GEMINI 2.5’ 옵션을 클릭합니다. 그다음 ‘Gemini 2.5 Flash Preview’를 선택 합니다.
2 메인 화면으로 이동하면, ‘Native Speech Generation’ 버튼을 클릭합니다.이 버튼을 통해 자연스러운 음성 합성 기능(TTS)을 시작할 수 있습니다.
3 오른쪽 패널을 보면, 혼자 말하는 방식의 ‘싱글 스피커 오디오 모드’와 여러 사람이 대화하는 형태의 ‘멀티 스피커 오디오 모드’를 선택할 수 있습니다.
원하는 모드를 선택한 후, 아래 ‘Voice Settings’ 항목에서 스피커 1과 스피커 2의 이름과 목소리를 각각 지정합니다. 이때 목소리에 표시된 이름은 모두 외국 이름으로 되어 있어 “한국어는 안 되는 건가?” 하고 의문이 들 수 있지만, 실제로는 외국어 이름이더라도 여러분이 작성한 한글 텍스트를 자연스러운 한국어 발음으로 읽어줍니다. 여러 목소리를 들어보면서 글의 분위기와 가장 잘 어울리는 음성을 선택해 활용해 보세요.
4 그리고 ‘Add Dialog’ 버튼을 대화할 내용의 수만큼 클릭하면, 해당 개수만큼 텍스트를 입력할 수 있는 창이 생성됩니다. 각 창에 원하는 대사를 입력하면, 설정한 음성으로 자연스럽게 읽어주는 TTS 결과를 얻을 수 있습니다.
5 화면 상단의 ‘Style Instructions’ 항목은 말하는 분위기나 말투를 설정하는 기능입니다. 예를 들어 “비장하게”, “농담하듯이”, “차분하게” 등으로 입력하면, TTS가 해당 분위기에 맞춰 감정을 담아 음성을 생성합니다. 이후, 여러분이 설정한 각 스피커 이름 아래에 대본을 입력하면, 선택한 목소리와 스타일로 음성이 생성됩니다.
6 모든 설정‘RUN Ctrl’ 버튼을 클릭하세요. 그러면 왼쪽에 재생 바가 생성되며, 지금까지 설정한 TTS 음성을 미리 들어볼 수 있습니다. 재생 바를 통해 원하는 구간을 다시 들어볼 수도 있습니다.
7 생성된 대화를 들어보고 마음에 든다면, 재생 바 오른쪽의 ‘⁝’(점 세 개 아이콘)을 클릭하세요. 그 후 나타나는 ‘Download’ 메뉴를 선택하면, 오디오 파일을 WAV 형식으로 컴퓨터에 저장할 수 있습니다.
8 다운로드한 파일을 실행해 보면, 입력한 텍스트가 음성으로 변환된 결과물을 재생할 수 있습니다. WAV 형식의 오디오 파일이기 때문에, 대부분의 미디어 플레이어에서 문제 없이 재생됩니다.
긴 글 읽어주셔서 감사합니다.
끝.
0 댓글