FaceOSC+Maxのフォルマント合成音声

①Xcodeのプロジェクトファイルを開く

授業内で指示。前ページと同様。

 

②プログラムのビルド

授業内で指示。

FaseOSCでは以下のOSCメッセージが送信される。

/found 顔の認識
/pose/position 顔の位置
/pose/scale 顔の大きさ
/pose/orientation 顔の方向
/gesture/mouth/width 口の幅
/gesture/mouth/height 口の高さ
/gesture/eyebrow/left 左眉毛
/gesture/eyebrow/right 右眉毛
/gesture/eye/left 左目
/gesture/eye/right 右目
/gesture/jaw 顎
/gesture/nostrils 鼻の穴

 

③Maxパッチの起動

授業内で指示。(of_v0.8.0_osx_ma2014/addons/apps/myApps/FaceOSC/05-06-08naka_OSC.maxpat)

ここで利用するパッチでは、顎の移動変化量(口の開き具合)を取得して、フォルマント合成音声の高さを変化させている。

※フォルマント合成とは、録音された人間の音声は使用せず、基底周波数、音色、雑音レベルなどのパラメータを調整して波形を作り、人工的な音声を作る合成音声の手法の一つ。合成された音声はロボット的に聞こえる音声になるため、人間の音声と間違えることはない。(Wiki: 音声合成