RHVoice

提供: ArchWiki
ナビゲーションに移動 検索に移動

関連記事

RHVoice は、多言語対応の音声合成ソフトウェアです。statistical parametric synthesis を使用し、既存のオープンソース音声技術(主に HTS および関連ソフトウェア)に依存しています。

インストール

rhvoice パッケージをインストールしてください。あわせて、必要な #対応言語#音声 もインストールしてください。

対応言語

当初、RHVoice はロシア語のみ対応していましたが、現在では多くの言語をサポートしています。

対応している言語の一覧は、以下のコマンドで確認できます。


$ pacman -Ss rhvoice-lang
パッケージ名 言語
rhvoice-language-albanian アルバニア語
rhvoice-language-brazilian-portuguese ポルトガル語
rhvoice-language-english 英語
rhvoice-language-esperanto エスペラント語
rhvoice-language-georgian ジョージア語
rhvoice-language-kyrgyz キルギス語
rhvoice-language-macedonian マケドニア語
rhvoice-language-polish ポーランド語
rhvoice-language-russian ロシア語
rhvoice-language-tatar タタール語
rhvoice-language-ukrainian ウクライナ語

音声

音声は自然な音声の録音から構築されています。音声は統計モデルのみがユーザーのコンピューターに保存されるため、サイズは小さくなっています。これらの音声は、録音されたセグメントを直接組み合わせて音声を生成する合成器に比べて自然さには欠けますが、それでも十分に聞き取りやすく、録音に使用された話者に似た音声を提供します。

対応している音声の一覧は、以下のコマンドで確認できます。

$ pacman -Ss rhvoice-voice
パッケージ名 言語 備考
rhvoice-voice-hana アルバニア語
rhvoice-voice-leticia-f123 ポルトガル語
rhvoice-voice-alan 英語 スコットランド英語
rhvoice-voice-bdl
rhvoice-voice-clb
rhvoice-voice-evgeniy-eng Evgeniy Chebatkov(スタンダップ・コメディアン、声優)
rhvoice-voice-lyubov Lyubov Sablina(語学センター「Lingua Belle」の教師)
rhvoice-voice-slt
rhvoice-voice-spomenka エスペラント語
rhvoice-voice-natia ジョージア語
rhvoice-voice-azamat キルギス語
rhvoice-voice-nazgul
rhvoice-voice-kiko マケドニア語 LouderPages によって開発
rhvoice-voice-suze Branislav Gerazov によって開発
rhvoice-voice-magda ポーランド語
rhvoice-voice-natan
rhvoice-voice-aleksandr ロシア語 Aleksandr Karlov(テレビ・ラジオ司会者、オーディオブック朗読者)による音声。
HQ 版は旧バージョンより高音質で、音質も異なるため、フィードバックを収集する目的で一時的に別の音声として提供されています。このバージョンには、元の音声にはない問題が含まれている可能性があります。音声ベースはオープンなので、改善へのご協力 を歓迎します。
rhvoice-voice-aleksandr-hq
rhvoice-voice-anna
rhvoice-voice-arina Arina Syukkya(イベントオーガナイザー、デザイナー)
rhvoice-voice-artemiy Artemiy Lebedev(デザイナー、ブロガー、旅行家)
rhvoice-voice-elena
rhvoice-voice-evgeniy-rus Evgeniy Chebatkov(スタンダップ・コメディアン、声優)
rhvoice-voice-irina
rhvoice-voice-mikhail Mikhail Sokolov(Autoradio のニュースキャスター)
rhvoice-voice-pavel Pavel Klyachenko(心理学者、視覚障害者心理学者)
rhvoice-voice-tatiana Tatiana Kruk(「Tiflo Info」放送の司会)
rhvoice-voice-victoria Natalya Arsenyeva(ラジオ司会者、「I was there」旅行ブログの著者)
rhvoice-voice-vitaliy Vitaliy Chuvaev(ロシア・トゥデイ TV チャンネルのブランド音声)
rhvoice-voice-yuriy Yuriy Zaborovsky(ソビエトおよびロシアの俳優、オーディオブック朗読者)
rhvoice-voice-talgat タタール語
rhvoice-voice-anatol ウクライナ語
rhvoice-voice-marianna Marianna Firtka(ラジオパーソナリティ)
rhvoice-voice-natalia
rhvoice-voice-volodymyr Volodymyr Beglov(ジャーナリスト、ラジオ司会者、講師)

合成の例

さまざまな音声による音声合成の例は、こちらこちら で試聴できます。

設定

設定ファイルは /etc/RHVoice/RHVoice.conf にあります。

ファイル形式と利用可能な設定項目については、公式ドキュメント に詳しく説明されています。

Speech-dispatcher

RHVoice には speech-dispatcher 用のモジュールが含まれています。

追加設定なしでそのまま動作するはずですが、speech-dispatcher のデフォルト合成エンジンとして RHVoice を使用したい場合は、spd-conf ユーティリティを使うか、設定ファイルを手動で変更してください(ユーザーごとの設定を変更したい場合は ~/.config/speech-dispatcher/speechd.conf を編集してください):

/etc/speech-dispatcher/speechd.conf
# -----OUTPUT MODULES CONFIGURATION-----
...
DefaultModule rhvoice
...

使用方法

設定が正しければ、以下のコマンドで合成を開始できます(音声 bdl を使用する場合):

$ echo "test" | RHVoice-test -p "bdl"
$ spd-say -o rhvoice -y bdl "test"

辞書

ユーザー辞書は /etc/RHVoice/dicts/ ディレクトリに作成する必要があります。例えば、英語用なら /etc/RHVoice/dicts/English/ に配置してください。

参照