自己紹介・会社紹介(その4)ーAIとサウンド分野

2020年からAI(人工知能)の研究を始めました。

(2024年3月「久保德理皇」に改名)
弊社としては、3方向の使い方をしています。
1D音質評価というのは、あらゆる計測値(音圧レベル、心理音響パラメーター群、そのほか)を集め機械学習し、評価点との相関を見出す音質評価を行うAIを作成します。特に、次元削減ークラスタリングを行う教師なし学習から分類も重視しており、この考えはワインのクラス分けを、計測値(光学データと化学データ)からAI判定する機械学習の事例からヒントを得て、AI”サウンドソムリエ”と呼んでいます。

2D音質評価は、画像認識AIによる音質判定になります。そのため、音を画像データに変換し、そこからCNN(畳み込みニューラルネットワーク)のような画像認識AIを用いるわけですが、音をどのように画像にするのかは、対象音に合う信号処理表現を行います。
自動車エンジン音の事例ではフェラーリが特徴的に倍音が多いことに着目し、リカレンスプロットを用いた”フェラーリフラワー”という手法を行いました。

最後に、サウンドデザインですが、画像生成AIからイメージ、効果音生成AIから漠然としたサウンド生成、画像から得たイメージに合わせ込むようにフィルターやエフェクターを用いて最終加工を行うといった三段階を経て、AIを用いたサウンド・イメージングを行っています。
この手法であれば、電気自動車だけでなく、未来のモビリティ、つまりどのような動作環境かわからない(場合によっては空を飛ぶ)まで想定してサウンドデザインの提案が行えます。

AIを用いて、もっと音の世界を豊かに、皆さんの生活が豊かにしたいと思い、会社のモットーを

(AI)enriches your daily sound

に2023年に変更しました。