SIExtractPhonemes

導入

v9.0 (2011)

カテゴリ

アニメーション

詳細

認識の指針となるテキストを使用して、オーディオ ファイルから音素を抽出します。

スクリプト構文

oReturn = SIExtractPhonemes( Language, FileName, GuideText );

戻り値

結果の多方向の配列を戻します。 各列には次の内容が含まれます。

1)音素の Unicode IPA コード

2)音素の開始時間(秒)

3)音素の終了時間(秒)

4)デバッグに有効な、人間に読み取れる音素の手掛かり

パラメータ

パラメータ タイプ 詳細
Language 文字列 使用する言語。 英語の場合は「en」、日本語の場合は「jp」。
FileName 文字列 オーディオ ファイル(.wav または .avi ファイルなど)へのパス。 Mono および 16000k が推奨されます。 Softimage の Audio と同じオーディオ形式。MP3 はサポートされません。
GuideText 文字列 オーディオ ファイルで話されている言葉と同じテキスト。 エンジンが混乱する可能性があるため、通常とは異なる句読点や変わった文字は使用しないでください。

JScript の例

//Returns a VBArray object, which require using the .getItem method in Jscript because they are not 
//native objects there.  However, they work transparently like multi-dimentionnal arrays in VBscript and Python
var res = SIExtractPhonemes ("en", "s:\\here_be_dragons.wav", "Here be dragons, the map says");
arraysize = res.ubound( 1 );
logmessage( arraysize + "phenemes found" );
for (  i=0; i < arraysize; i++)
{
logmessage( "IPA#" + res.getItem(i,0) 
+ "(" + res.getItem(i,3) + ") "
+ "Start Time(sec) " + res.getItem(i,1) 
+ "End Time(sec) " + res.getItem(i,2) );
}

関連項目

GetPhonemeFromSpeechClip