Fish Audio
Fish Audio — 表現力の高いTTSと音声クローン(S1)+従量課金API
Fish Audioは、プロダクトチームとクリエイターが表現力のあるTTSと音声クローンをスケールして提供したいときに運用しやすい選択肢です。LinkStart Labでは、S1の“演技を指示する”発想が、手作業のVO編集よりもスタイル統一に効くと感じました。席課金の音声サービスが購買最適化に強い一方で、Fish Audioはクレジット+従量APIで 自動化 パイプラインに寄せやすいです。
好きなポイント
- 頻繁に配信する人ほど、無料枠でワークフロー検証→有料で商用移行がスムーズ。
- Plus/Proで長文と商用が解禁され、YouTube収益化や広告用途に現実的。
- APIでバッチ生成、ASR(transcribe-1)連携、同時リクエスト制御まで設計できる。
注意点
- 無料は非商用のため、収益化するなら早めのアップグレードが必要。
- 多言語・多話者の運用ではクレジット管理がボトルネックになりやすい。
- 音声クローンは同意・権利・安全性のガバナンスが必須で、運用設計が前提。
について
Fish Audioは、制作に耐えるAI音声プラットフォームです。S1で自然なTTSを生成し、音声クローンと感情/スタイル制御で“ナレーション”ではなく“声優の演技”として出力を指示できます。Fish Audioはフリーミアムで、有料はPlus $11/月、Pro $75/月から。クレジット制+従量課金APIを活かすチームにとって、固定席課金よりコスパが良くなりやすい設計です。無料枠は月8,000クレジット(S1最高品質で約7分相当)、1回500文字、公開ボイス枠3つで、Plusでは商用利用や強化クローン、文字数上限の拡大、API利用が可能になります。Audio GeneratorsやAutomation Toolsの観点では、UIとAPIの両輪で“運用”に乗せやすいのが強みです。
主な機能
- ✓S1で表現力の高いTTSを生成し、有料では長文生成に対応
- ✓公開/非公開のボイス枠でクローンを管理し、有料で商用利用を解禁
- ✓UIからAPIへ拡張:従量課金と同時リクエスト制限が明確で運用しやすい
- ✓ASR(transcribe-1)もあり、音声ワークフローを一気通貫で構築できる
よくある質問
従量課金です。 APIはサブスク料金や月額ミニマムなしとされ、TTS(s1 / speech-1.5 / speech-1.6)は**$15/100万UTF-8 bytes**、ASR(transcribe-1)は**$0.36/音声1時間**です。企業プランにAPI費用が埋もれがちな Audio Generators と比べ、料金と同時実行制限が公開されています。
主な違いは“提供形態”です。Fish Audioはクレジット制+料金が明確な従量API(TTSはUTF-8 bytes課金)に寄せており、**ElevenLabs**は洗練されたStudio体験やエンタープライズ向けパッケージで選ばれやすいです。ElevenLabsが統合ワークスペース寄りなのに対し、Fish Audioは 自動化 パイプラインへ組み込みやすい設計です。