千葉工業大学 プロジェクト研究年報 2015年版
120/168

図1 対数パワースペクトルによるデータベース音源のクラスタリング結果 図2 対数パワースペクトルによるクラスタ分布密度 4 実収録音源のクラスタリング 次に,日常生活でよく耳にする生活音を,音響的なライフログデータとして収録して同様の実験を行った. 被験者にICレコーダを装着し,録音機器にSONY製リニアPCMレコーダICD-SX800を使用,サンプリング周波数22.05kHz,量子化ビット数16bitの条件で日常生活の音を収録した.総収録時間は44時間12分である.収録場所と主な収録音を表2に示す. 表2 収録した日常生活音 収録場所 収録音 研究室 音声,PCの操作音,空調音 教室 音声,空調音 大学屋内外 音声,足音,空調音,エレベータ駆動音 路上 音声,足音,車・電車の走行音 書店 音声,音楽,エスカレータ駆動音 駅構内 電車の走行音,音声,雑踏,チャイム 電車内 電車の走行音,音声,車内アナウンス 自動車内 音声,車の走行音 自宅 音声,TVの音 これらの音を,60秒ごとに分割し,総データ数2,652個となった.この中から,統計的に信頼できるサンプルとして336個をランダムに抽出した. 各データの特徴量ベクトルを,k-means法により8個のクラスタに分割した.この結果から形成されたクラスタの様子を表3に示す.最もよくクラスタリングが行われたのは,メルケプストラムを用いた場合である. 表3 特徴量ごとの形成されたクラスタ 特徴量 形成されたクラスタ 振幅差分の最大値, パワー,零交差数 形成されず 線形パワースペクトル 研究室(2),自動車内,自宅 対数パワースペクトル 研究室,自動車内 ケプストラム 研究室(2),自動車内 メルケプストラム 研究室(3),教室,駅構内,自動車内自己相関係数 研究室(2),路上(2) また,対数パワースペクトル特徴量を主成分分析した結果の第1・第2主成分得点の分布を図3に示す.第2主成分までの累積寄与率は80.8%であった.これにより,多次元に渡る特徴量を低次元の空間に写像して可視化できる. 図3 対数パワースペクトルによる実収録音源クラスタリングにおける主成分分析結果 5 おわりに 音カテゴリを合理的に分類・識別する方法を検討するために,データベース音源および実収録音源に対して,教師なしクラスタリング実験を行った.短時間単一音の非音声音ドライソースの分類では,対数パワースペクトルを用いた場合に,最も聴覚心理的(意味的)分類に近い音源系統のクラスタリングが行えた.また,長時間複数音の実収録音源の場合は,メルケプストラムを用いた場合に,場所の分類に良好な結果を示した.今後は,時間変化を考慮した新たな音響特徴量の導入,ライフログとしてさらに膨大な量のデータを分析する予定である. 本研究を進めるにあたり,鎌形勇樹君,木原崇宏君(当研究室卒業生)と能澤智弥君(当研究室修士課程)の各位より協力を得た.記して謝意を表す. 文 献 (1) J. Dennis, “Spectrogram image feature for sound event classification in mismatched condisions,” IEEE Signal Processing Letters, Vol.18, No.2 (2011) (2) 中鹿,滝口,有木, “確率スペクトル包絡に基づくNMV基底生成モデルを用いた混合楽音解析,” 情報処理学会研究報告,Vol.2011-MUS-89 (2011) 1042015 千葉工業大学附属研究所 プロジェクト研究年報          Project Report of Research Institute of C.I.T 2015    

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer10.2以上が必要です