Podcastを始めてみようと思った。そう、まずそう思った。なぜそう思ったかというと、ブログという文字だけのコンテンツがあり、これをテキストスピーチソフトであるVOICEPEAKで読み上げたら音声のコンテンツもできあがるではないかと考えたからだ。
テキスト読み上げソフトを活用
テキストスピーチソフトはTSS(Text to Speech)と言われていて、テキストから音声を生成するもので、古くからは1980年代にNECの「音声合成LSI」というものからある(ChatGPTに歴史を聞いたら答えてくれた)。LSIという名の通り、専用のチップでロボットのような機械音だったそうだ。
1990年代に入ってPCとの連携で富士通の「VoiceFun」が登場。2000年代に東芝の「ToSpeak」、HOYAの「VoiceText」といったものがある。2010年以降はクラウドが活用されたGoogle Cloud Text-to-Speech、Amazon Pollyが出てくる(この段落もChatGPTに聞いた)。
個人向けで有名なのは「VOICEROID」や「CeVIO Creative Studio」とかではないだろうか。年代が上がってくるにつれてAIによる学習でよりリアルな音声に近づいたソフトが出てきた。「CeVIO AI」や「VOICEVOX」などがそうだ。特に「VOICEVOX」はYouTubeでずんだもんコンテンツによく活用されている。
2022年にはぼくがメインで使っている「VOICEPEAK」が登場し、当時「CeVIO AI」を使っていたぼくを驚かせるほどの自然なテキスト読み上げを聞いて、これはもう買うしかないと思って即断した記憶がある。
ぼくはメインのソフトを「CeVIO Creative Studio」から「CeVIO AI」、そして「VOICEPEAK」と乗り換えてきているが、「VOICEPEAK」はまだ英語の読み上げはできないので、どうしても英語が必要なシーンは「CeVIO AI」の弦巻マキを活用して遊んだりしている。
こういったテキスト読み上げソフトを活用することで、自分の声がきれいじゃないと思っている人でも、気軽に音声のコンテンツを世に出すことができる時代になってきているのだ。
なぜPodcastか
ぼくはYouTubeにも動画をあげていて、その中で「CeVIO AI」や「VOICEPEAK」を活用したりしている。YouTubeに動画を上げるということもできるけど、やっぱり動画を作るのはそれなりに手間がかかるものである。
動画は映像を用意しなくてはいけない。中には写真だけを見せる動画をたまに見かけるけど、やっぱり動く絵でないと人は見てくれないものだ。また、それなりに作り込みをしなくてはいけない。
もちろん、Adobe Premiere Proで簡単に切りはりしたものを出すことはできるけど、それなりに効果をつけたり、Adobe After Effectsでアニメーションを作ったりすると時間はかかるものだ。
自分ひとりでやるにしても時間がかかってしまうと、ネタの消費期限が切れてしまう。ネタにはやっぱり自分の中で世に出したいと思う期限があり、それを超えてしまうと「ああ、もういいかな。面倒だし」と思うようになってきてしまう。だから、その期限の前にコンテンツを世に出すというのが重要なのだ。
Podcastなら映像はいらないので、ブログなどで出したコンテンツのテキストをPodcast向けに修正して出すだけだ。動画を作るよりも遥かに手間が少なくて済む。自分が出したいと思ったコンテンツを動画より早く世に出すことができるわけだ。
どんなコンテンツにするか
せっかくやるのだから、ゆくゆくは独自のコンテンツを出していきたい。だけど、まずはブログで書いたことをPodcastにしていくことから始めたい。せっかく積み上げてきたブログの資産を有効に活用していきたいからだ。
ラジオ番組のような感じに仕上げていけたらと思っている。BGMなんかに乗せてコンテンツを話すようなおしゃれな感じがいいなと。こう見えて、ぼくはaudiioのLifetimeライセンスとAudiostockのスタンダードプランのサブスクがあるので、BGMには困らない環境にある。
中年男性の日常のブログにどれぐらいのコンテンツ価値があるのかというところだけど、自分は多趣味なほうだと思っているので、中にはひとつぐらいは聞いてやってもいいだろうと思ってもらえるものが出せるんじゃないかなと思っている。歳をとっていくと新しいことを始めるのが億劫になってしまいがちなので、意識して積極的に自分がいままでやったことがないことを実行していこうと思っている。





