SNS騒然!「ELT持田香織の声になりきるマイク」の誕生秘話
2022年8月末、SNSを騒然とさせる実証研究の開始が、ヤマハからアナウンスされました。
今年2022年の夏、約1ヵ月限定で、全国3店舗のビッグエコーにオープンしたのは「なりきりマイク™ feat.ELT持田香織 スペシャルルーム」(以下「なりきりマイク」)。この特別ルームに設置されたマイクを使うと、誰でもEvery Little Thingのボーカル・持田香織さんの声になれるのだとか……。
ヤマハの「TransVox™(トランスヴォックス)」という技術を活用したこの「なりきりマイク」を生み出したのは、ヤマハで商品企画を担当する倉光大樹さん。なぜ倉光さんは、こういったユニークな実証研究を行ったのでしょうか。リリースに至るまでの舞台裏を伺いました。
「大丈夫?」という声も上がった「なりきりマイク」構想
――倉光さんは普段、どういった商品企画に携わっていらっしゃるんですか?
主に新規事業の企画考案を担当しています。社内で開発された技術を、世の中へ発信する方法を考えるのも自分の役目です。
2004年の入社以降、たとえば照明付きオーディオの「Relit(レリット)」やコミュニケーションロボット「Charlie(チャーリー)」など、さまざまなプロダクトの企画を立ち上げてきました。今回の「なりきりマイク」でもアイデアの考案と、ディレクションを担当しています。
――「なりきりマイク」では「TransVox」という、人の歌声を別人の歌声にリアルタイム変換する技術が搭載されています。この企画が動き始めた時、すでにこの技術はほかのプロダクトなどに活用されていたのでしょうか?
弊社の音声合成技術を専門に研究を行うチームから相談を受けた時は、まだ構想段階でした。今から2年前の2020年、「マイクが拾った音声をリアルタイムで別の音声に変換する技術が生まれるかも」という共有を受けたことがすべての発端です。
当時はまだ「TransVox」という技術名すら決まっていない状態でした。技術がオーディオに使えるのか、楽器に使えるのか……などの用途すら定まっていませんでした。ただ、話を聞く限りなんとなく「技術が完成すれば面白いことができそう」という印象がありました。そこで、私がアウトプットの企画を考案することになったんです。
――「なりきりマイク」というアイデアにはどのようにたどり着いたんですか?
「芸能人の声になりきれる」という案は、技術を活用するアイデアとして結構ストレートだと思います。当初は声が出せなくなってしまった人の声を再現できたりと社会的意義に直結するような企画も考えていました。
ただ、あくまで今回のミッションは、可能な限り多くの人に知ってもらうこと。「TransVox」という技術の活用例を世に示し、注目されることが目的の一つでした。ブレストを重ねた上で、できるだけ皆が「使ってみたい」と思えるアイデアを選びました。
――アイデアに対し、当時の社内からはどういった反応がありましたか?
「面白そう」という声がある一方で、「大丈夫?」という声も上がりました(笑)。そもそも弊社では、研究技術が生まれる前の段階でアウトプットとなる企画を準備すること自体が異例だったんです。加えてこのコンテンツの肝は「ちゃんとそっくりな声に変換できるか」。本来であれば「ね、ちゃんとクオリティが高いでしょう」と試作を用意しないと社内を説得できないであろう企画でした。
ちなみに2年前に体験した時は技術もまだ伸びしろだらけ。「あれ、本当に声変わった?」というレベルでした。研究チームを信じつつ「やってみないと分からないから!」と企画を突き進めた記憶があります(笑)。
――なぜ技術の完成を待たずに企画を進めたのでしょうか?
個人的に「TransVox」は、社外の研究機関や企業に協力してもらった方が、より良いアウトプットの方法が集まると感じていました。いろんな人の知恵を取り入れて技術を発展させるためにも、まずは「興味を持ってくれそうな人や企業」に情報が届くことが重要。
そして注目されるためには、なるべく早く世に出すことが必要だと判断したんです。「TransVox」の完成を待っていると出遅れてしまうと思いました。
その一方で「大丈夫?」という心配の声が社内から挙がった理由もすごく分かるんです。そもそもカラオケは自分の声で歌を歌うことを楽しむ場所。世の中の人々が「なりきりマイク」を使ってカラオケを楽しむ姿を想像しきれず、堂々と「楽しいコンテンツになります!」とは断言できませんでした。コケたら頭を丸める覚悟で挑みましたね(笑)。
キャンペーン開始の2カ月前に発覚した致命的な「欠陥」
――そもそも、なぜ持田さんとのコラボレーションに至ったのでしょうか?持田さんの声になった経緯をぜひお聞きしたいです。
理由はいくつかあります。まずは幅広い世代の方に楽しんでいただきたかったので、世代を問わず認知度の高いミュージシャンが数組候補に挙がっていました。その中でもELTの楽曲は男女問わず歌いやすい。歌って体験してもらわないと意味がないからこそ、皆さんが歌いやすい楽曲のアーティストを選ぶようにしました。
そして、持田さんの声は特徴的です。誰が聞いても「確かに持田さんだよね」と本人の声に似ているかどうかをジャッジしやすい。あらゆる条件に当てはまるボーカリストを絞り込んだ結果、必然的に持田さんへたどり着きました。
――持田さんの歌声を、どのようにAIへ学習させたのでしょう?新規でご本人の声をレコーディングしたんですか?
いえ、過去にリリースされた音源がベースとなっています。レコーディングデータからボーカルパートだけを共有いただき、AIに「持田さんのクセ」を学習してもらいました。しかし、カラオケで活用できるようになるほどの精度を上げるのは、かなり大変でしたよ。
――AIの声が持田さんにあまり似ていなかった、とか?
AIによって出力されたボイス自体は、良い感じに持田さんの特徴を捉えていたんです。弊社には「VOCALOID™」をはじめとする音声合成技術の基盤もあるので、もとからある程度の音質も担保できました。
しかしリリース予定日の2カ月前、試運転としてカラオケ店で試作品の「なりきりマイク」をつないでみたところ、まったく使い物にならなかったんです。
というのも、カラオケ店内には喋り声やタンバリンなど、歌声以外のノイズが多くて。カラオケのブース内でマイクをONにした途端、なんとカラオケのバック演奏もAIが「声」と認識してしまいました。
レコーディングスタジオの静かな環境で開発を進めてしまったからこそ、カラオケ特有の環境を加味しなきゃいけない、という問題を甘くみていました。
――企画が通っている手前、倉光さんも非常に焦ったのでは?
「まずいぞ!」と感じました。そこから最後の2ヶ月間、研究チームでは猛スピードで調整を行いました。その期間中は何度もカラオケ店を訪れましたよ。
ぼくが歌い、エンジニアが真顔でタンバリンを叩きながら歩き回る。ちゃんと音声だけを拾えるかをチェックする重要な作業だったのですが、改めて思い返すとめちゃくちゃシュールですね(笑)。異様な光景だったと思います。
実は、企画が動き出してしばらくは「感動できるクオリティ」に到達しなかったんです。出力された音声の機械っぽさやザラザラ感など、課題はありました。また「TransVox」の特徴である「リアルタイム変換」を実装することも大変だったんです。
「TransVox」ではマイクがユーザーの声を拾いあげ「音声」を認識し、歌詞の発音を解析することで持田さんの声に変換します。リアルタイムで解析し、合成音を作り出すので、必然的に微妙なタイムラグが発生してしまうんです。当初は発した歌声がかなり遅れて返ってくるので、カラオケに耐えられませんでした。
しかし最終的にクオリティがグッと上がった。自分の想像していた「ここまで来てくれたら問題ないだろう」というボーダーを、技術チームが突破したんです。想像以上の仕上がりになったと思います。
ちなみにリリース直前、ELTのギタリストである伊藤一朗さんのYouTube収録がありました。リハで伊藤さんに体験してもらった時、照明や舞台美術のスタッフさんたちが「えっ!」って一斉に振り向いたんです。そこで初めて安心感と、「面白い企画を生み出せた」という確信が生まれましたね。
新しいカラオケの楽しみ方を提案できた
――22年8月末、カラオケ店・ビッグエコーの国内3店舗で「なりきりマイク feat.ELT持田香織 スペシャルルーム」がオープンしました。利用者からの反応はいかがでしたか?
キャンペーンを終えた今だからこそ「そりゃ盛り上がるでしょう」と思えるのですが、実はこれだけ「楽しい」という声が集まるとは想像していませんでした。「何度もカラオケに通いました」「ストレスが癒された」という声もあって。自分の予想をはるかに超える良い反響があったのはうれしかったです。
また、「このアーティストの声でも歌ってみたい」という要望の声も多かったです。自分の声で歌うカラオケも楽しいけれど、好きなアーティストになりきって歌うのも気持ちがいい。新しいカラオケの楽しみ方が提案できたのかな、と思います。
――今後「TransVox」がカラオケ以外のシーンで活用される可能性はありますか?
当初の目的通り、このキャンペーンを通しお問い合わせも何件かいただけました。今後もエンタメの領域以外でも活用はできるのでは、と期待しています。
特に今回、avexさんや第一興商さんなどにご協力をいただき「他社との協業」によって事業を進められたのですが、これは個人的にも大きかったです。「ELTの持田さんの声」だから反応があったし、「カラオケで体験できる」から注目されたと考えています。協業によりパワーが増していく感じが、私にとっては新鮮でした。
今後、社外からの新たな知見をもとに「TransVox」を成長させ、他社とのコラボレーションを通して新たなアウトプットが生まれることを期待しています。
――最後に「なりきりマイク」の仕事を振り返っての感想を教えてください。
これまで新規プロダクトの企画・開発の経験はありましたが、今回のように「サービス」へ技術を落とし込むのはぼく自身にとっては初めての試みでした。アウトプットが「プロダクト」の場合、モノが完成してユーザーの声が届いても、すぐに商品へ反映することができません。
しかし、「サービス」の場合は世の中の反応を聞きながら、すぐに商品をブラッシュアップできるんです。利用者のフィードバックを受けながらスピーディに調整を進めていく過程が新鮮で面白かったです。
不安だらけの準備期間でしたが、そもそも挑戦をしなければ面白さに気付くことすらできなかったはず。改めて、チャレンジすることの大切さを実感することができました。
(文:高木望 写真:宮本七生)
※ この記事は「グッ!」済みです。もう一度押すと解除されます。