自分で制作した動画に付けるナレーションをAIで作りたいけれど、作り方が分からないとお困りではありませんか。生成AIを使えば、声による身バレを防げる・長文を読む必要がないなどのメリットを得られます。動画投稿における問題点を、AIで解決できるでしょう。
本記事では、AI音声生成とは何か、どうやって作るのかを解説します。おすすめの無料ツール3選と使用上の注意点も紹介します。この記事を読めば、専門的な知識がなくても、AIを活用してナレーション音声を生成できるようになるでしょう。
AI音声生成という言葉を聞いたことはあるけれど、どんなサービスなのか分からないとお困りの方も多いでしょう。ここでは、AIを使った生成サービスのひとつである音声生成とは何かを紹介しましょう。
AI音声生成とは、大量の音声データを学習したAIが、ユーザーの指示文に沿って新たな人間のような自然な音声を作り出すサービスです。似た言葉に音声認識と音声合成があるものの、意味合いが異なるのでチェックしておきましょう。
- AI音声生成:学習データをもとに、AIが新たな人間のような自然な音声を作り出す
- 音声認識:音声データをテキストに変換する
- 音声合成:人の声を機械的に作る技術
言葉は似ているものの、意味合いが大きく変わります。動画にナレーションを付けるのであれば、AI音声生成を活用することがおすすめです。

これまでも音声を作成するサービスはありましたが、AI音声生成はより人間らしい音声を作り出せる点が、これまでの音声作成サービスとの違いであり、大きなメリットです。
以前までは違和感のあった機械音声が、ディープラーニング(深層学習)技術によって人間の声とほぼ区別がつかない自然な声へとなったことで、活用の幅が広がっており、様々な用途で活用されています。
AI音声生成と従来のナレーション作成との違いは、人件費や作業時間におけるコストを減らせる点です。AIサービスが展開されるまでは、自身でナレーションを録音したり、声優に依頼してナレーションをしてもらうことが一般的でした。
自身で声を吹き込む場合は作業時間や身体への負担、声優に依頼する場合は依頼費用がかかるといったデメリットが発生していましたが、AIが登場したことにより、それぞれのデメリットを解消できるようになったのです。
AI音声生成であれば、台本を用意するだけで済みます。後はツールを使って手軽にナレーションを生成できるので、作業時間の短縮・体への負担の軽減・コスト削減などのメリットを得られます。
AI音声生成に興味があるけれど、どんな活用シーンがあるの?と気になっている方も多いでしょう。ここでは、AI音声を活用できるシーンとそのメリットについて解説します。
自分で制作した動画にナレーションをつける以外にも、AIが生成した音声を活用できるの?と気になっている方も多いでしょう。AI音声の活用シーンは以下の通りです。
- 動画のナレーション
- 企業の電話自動応答システム(コールセンターの省人化・無人化)
- ゲーム・アプリの音声素材作り
- 英語の学習
AI音声生成は、企業でも積極的に採用されています。個人でも動画への音声付け・英語の学習・趣味や遊びでの音声データ生成など、さまざまな使い方ができます。
AI音声を活用するメリットは以下の通りです。
- 魅力的な声のナレーションを生成できる
- 外部への依頼費用と手間を削減できる
- 専門の機材は不要
- 短時間でナレーションを生成可能
- 豊富なバリエーションから声の種類を選べる
AI音声を活用すれば、初心者が抱えがちなナレーション作成における手間やコストなどの問題を解決できます。自分の声に自信がなくても、AI音声生成サービスには豊富なバリエーションの声が用意されているので、動画にぴったりなナレーションを付けられます。
AI音声生成ツールにはさまざまなものがあるため、選ぶポイントを押さえることが大切です。ここでは、初心者に知っておいてほしいツールの選び方を解説します。
聞き手が持つ印象をよくするためにも、生成される音声の品質が高いかどうかを確認しましょう。品質が高いと判断されるポイントは、機械的ではない・感情表現が豊かで抑揚がある・自然な間の取り方・誤読がない、自然な日本語(イントネーションや正しいアクセント)を使っていることです。すべてを満たす場合は音声の品質が高いといえるので、複数のツールでテスト用の音声を生成し、比較してみましょう。
外国語の音声を生成する予定の方は、ツールが対応する言語をチェックすることがおすすめです。外国人向けの日本旅行の動画やアナウンスなどを作成する際は、複数の言語を付ける必要があります。対応言語が豊富であれば、世界各国の人に自分で制作した動画を見てもらえるでしょう。
ツールに無料プランはあるか、有料プランの価格は機能に見合っているかをチェックすることも大切です。利用頻度が少なく、趣味程度に使うのであれば無料プランを利用することがおすすめです。利用頻度が多く、複数の機能を活用して本格的な音声生成を行う方は、有料プランの価格が適正かを見極めましょう。継続して利用する場合は、無理なく払える価格帯かも確認してみてください。

定額(固定)課金の場合は分かりやすいですが、従量課金の場合は利用量に応じて金額が変動するため、導入前に入念にシミュレーションしておくことが重要です。
海外サービスなどの外貨払い、且つ利用量や支払金額が大きい場合は、為替相場も考慮した検討もしておきましょう。
収益化を目的とした動画に音声を使う場合は、商用利用の可否をチェックする必要があります。商用利用が禁止されているツールで生成した音声を、収益化を目的とした動画に付けると規約違反になる恐れがあります。生成する音声によって利益が発生するかどうかにあわせてツールを選びましょう。商用利用の可否は、ツールの利用規約に記載されています。
次から紹介するAI音声生成ツールは、ここまでに紹介したポイントを満たすものばかりです。おすすめツールを3つ紹介するので、ぜひチェックしてみてください。
動画に付けるAI音声生成ツールを探したいという方に、おすすめの無料ツール3選を紹介します。いずれも無料プランが提供されているツールなので、初心者でも安心して利用できます。
ElevenLabsは、他ツールにはない便利機能を兼ね備えているツールです。ツールで使える機能を見てみましょう。
- 音声のイントネーションや抑揚を自動で調整
- 音声のバリエーションが豊富
- 音声の高速生成
- 高精度のノイズ除去
- 32カ国語に対応
使用する際に注意したいのが、商用利用の点です。月額5ドル(約730円)のStarterプラン以上に加入すれば生成した音声を商用利用できます。無料プランで商用利用する場合は、「elevenlabs.io」か「11.ai」と表記しておく必要があります。
ElevenLabsの使い方を見ていきましょう。
1.アカウントを登録する
引用:ElevenLabs
ElevenLabsのホームページ(https://elevenlabs.io/ja)にアクセスし、右上の登録ボタンをクリックします。Googleアカウント、またはメールアドレスとパスワードの入力が求められるので、登録方法を選択して次に進みましょう。
登録後、名前や生年月日、ElevenLabsを利用する目的などを聞かれるので、それぞれを入力してください。入力後、音声生成を使えるようになります。
2.音声を生成する
引用:ElevenLabs
アカウントを登録したら、実際に音声を生成してみましょう。アカウント登録後にログインすると、遊び場(Playground)と製品(Products)の大きく2つに分かれており、今回は遊び場(Playground)テキスト読み上げ(Text to Speech)を利用して音声を作成してみます。
※ 画面が英語表記になっている場合は、以下の内容を参考にしてください。
・遊び場(Playground)
テキスト読み上げ(Text to Speech)
ボイスチェンジャー(Voice Changer)
効果音(Sound Effects)
・製品(Products)
スタジオ(Studio)
ダビング(Dubbing)
会話型AI(Conversational AI)
音声テキスト変換(Speech to Text)
左側のメニューから「テキスト読み上げ(Text to Speech)」を選択すると、画像の画面が表示されます。中央に生成したいテキストを入力し、右側で音声モデルや話すスピード、安定性などを設定したら、下部にある「音声を生成する」をクリックします。
引用:ElevenLabs
実際に生成した音声はこちらです。
elevenlabs.io
1分もかからず音声を生成できるため、さまざまな音声モデルを試しながら、動画に合うナレーションを作ってみましょう。

画面の操作方法やサービスの内容で分からないことがある場合、右上の「エルと話す」をクリックすると音声でAIが分からないことについて説明してくれます。
CoeFontは、日本製のAI音声生成ツールです。日本製ならではの魅力を持つツールの特徴を見てみましょう。
- 日本語特有の抑揚・イントネーションが自然
- 人気声優や著名人からの音声提供があり、声のバリエーションが豊富
- 有料プランのほかに無料プランを用意
- 自分の声を収録してオリジナルのAI音声が作れる
趣味や収益化を目的としない動画のナレーション音声の生成であれば、無料プランがおすすめです。ただし、商用利用は有料プランのみ可としているため、ビジネスや収益化を目的とする動画に使う場合は有料プランに加入しましょう。
なお、無料プランでは、商用利用以外の場合においても「Voiced by coefont.cloud」と表記しておく必要があります。
CoeFontの使い方を見ていきましょう。
1.アカウントを登録する
引用:CoeFont
CoeFontのホームページにアクセスし、画面下部の「無料で始める」をクリックしましょう。Googleアカウント・AppleID・メールアドレスなどの登録方法を選び、手続きを進めます。
2.音声を生成する
引用:CoeFont
登録が完了したら、早速音声を生成してみましょう。画面中央にある声のモデルを選択し、画面下部にテキストを入力します。声のモデルには人気声優や著名人も存在するため、好みの音声を探してみることがおすすめです。「AI音声を追加」をクリックすると検索画面が表示されるため、性別、年齢層、用途、特徴やキーワードなどで探してみましょう。
実際に生成した音声はこちらです。
Voiced by coefont.cloud
VOICEVOXは、AI音声生成機能を備えるソフトウェア(デスクトップアプリケーション)です。ソフトウェアが持つ特徴を見てみましょう。
(ElevenLabsやCoeFontはブラウザ上で利用できるウェブアプリケーションです)
- 声のモデルが豊富
- イントネーションや抑揚を細かく手動調整できる
- ほかのツールと連携してテキスト読み上げ機能を利用できる
VOICEVOXにはさまざまなキャラクターモデルがおり、モデル別に商用利用の可否が異なります。キャラクター別に利用規約が定められているので、商用利用する場合は、キャラクターの規約を確認しておきましょう。
VOICEVOXの使い方を紹介します。
1.ソフトウェアをインストールする
引用:VOICEVOX
VOICEVOXのホームページにアクセスし、トップページの「ダウンロード」からソフトウェアをダウンロードします。ダウンロード後、ソフトウェアを開いてセットアップを行いましょう。
2.音声を生成する
セットアップ終了後、ソフトウェアを開いて利用規約を確認します。規約同意後、キャラクターの選択画面が表示されるので、それぞれのテスト用音声を確認してキャラクターを選択しましょう。選択後、画面右下に表示される「+」ボタンをクリックすると、音声生成画面に切り替わります。
実際に生成した音声はこちらです。
VOICEVOX:四国めたん
ツールを活用することで、動画にあった声モデルによるナレーションを手軽に作れます。便利な反面、使用上の注意点もあるため、ここで解説します。
音声生成後に、イントネーションや抑揚など編集が必要になる場合があります。AI音声生成で人が話しているかのような音声を生成できるものの、文章が長くなるほど精度は低くなります。多くのツールには文章の変更・イントネーションや抑揚の調整などの編集機能が付いているので、違和感のある部分をその都度調整しましょう。
AI音声生成ツールにはそれぞれ利用規約が用意されているため、使用前に確認することが大切です。特に注意しておきたいのが、商用利用の可否とクレジット表記の条件です。有料プランは商用利用可としているツールが多い一方で、無料プランの大半はクレジット表記が必要となります。どのように表記するかはツールによって変わるので、商用利用する予定の方は必ず事前にチェックしておいてください。
AI音声を生成するときは、著作権を侵害しないよう注意が必要です。キャラクターや声優などの声をAIに学習させて音声を生成すると、権利や倫理の問題に触れる可能性があります。トラブルなく生成した音声を使うためにも、他人の声を無断でコピーしてAIに学習させない、生成音声を悪用しないよう気を付けましょう。
AI音声生成とは、AIが学習した音声データをもとに、新たな音声を作り出すサービスです。従来のナレーション作成とは違い、作成にかかる人件費や手間を大幅に削減できます。さらに、音声生成の技術が高くなっていることから、人が話しているかのような高品質な音声を作ることが可能です。
本記事では、無料プランを用意するAI音声生成ツールを3つ紹介しました。
- ElevenLabs:豊富な音声バリエーションと自然な話し方に近づける編集機能が魅力
- CoeFont:日本語特有のイントネーションや抑揚に対応、自然な音声を生成
- VOICEVOX:声のモデルが豊富、イントネーションや抑揚を手動で調整できる
それぞれに無料プランがあるので、まずはテスト用の音声を生成してみましょう。無料プランでもクレジット表記をすることで商用利用可能なツールもあるので、コストを抑えてナレーションを作成をしたい方も安心です。使いやすさや機能性に優れたツールを活用して、気軽にAIナレーションを始めてみましょう。