The Fool In The Valleyの雑記帳

-- 好奇心いっぱいのおじいちゃんが綴るよしなし事 --

PowerDVDのカラオケ機能

PowerDVDはその名の通りDVD、BD等の動画再生用のソフトなのですが、DLNA(Digital Living Network Alliance)のプレーヤー機器としても使えるので、リビングルームにあるHDDレコーダーをサーバーにして、そこで録画したTV番組や受信したTV放送を宅内のネットを使って他の部屋で見ることができ重宝しています。

これまで使って来たPowerDVD15で、そのDLNA接続が最近なぜか機能しなくなって困っていたのですが、無料で試用できる最新版のPowerDVD23を試すと快適に使えるので、そろそろ買い替えの時期かと思ってダウンロード購入しました。

15から23になって性能・機能ともに強化されていますが、23になって一番面白いと感じているのがカラオケ機能です。
音楽ファイルからボーカルと伴奏を分離して、そのバランスを任意に変えることができるし、キーの高さを任意に変えることもできるのです。

その実行例を下のビデオで紹介します。
良く知られた曲でボーカルが美しい曲が分かりやすいので、The CarpentersのSuper starを使わせてもらいました。(効果を説明するための部分的な使用なので著作権の問題は許可頂きたいと思います。問題があれば削除します)

www.youtube.com

非常に良くできています。

PowerDVD 23 の公式サイトを見ると、「AI により音楽からボーカルのみを除去、キーの調整、パソコンにつないだマイクからの録音などに対応したカラオケ機能を搭載しました。」とあります。所謂音源分離の応用です。

音源分離については、昨年Paul McCartneyAIを使った「音源分離」を使用してJohn Lennonの歌声を抽出し、Beatlesの“最後の曲”を完成させたということが話題になりましたが、どうやっているのか気になります。

最近の技術動向については、全く把握していないので、「音源分離 AI 原理」で検索するといろいろと記事が出てきます。その辺りを手掛かりにすれば初歩的な知識は得られそうです。

細かいところまで追いかける気力はおじいさんにはもうないのですが、それでも野次馬根性で具体的な論文にはどんなことが書かれているんだろうと思って学術記事を見てみると、いくつも論文が見つかります。その中に角野 隼斗さんの名前を見つけました。これです。

http://d-kitamura.net/pdf/paper/Kitamura2018EA03.pdf

彼はこういう研究もしていたんですね。

音源分離技術の世界も随分と進んでいます。