SIExtractPhonemes

導入

v9.0 (2011)

詳細

認識の指針となるテキストを使用して、オーディオ ファイルから音素を抽出します。

スクリプト構文

oReturn = SIExtractPhonemes( Language, FileName, GuideText );

戻り値

結果の多方向の配列を戻します。 各列には次の内容が含まれます。

1)音素の Unicode IPA コード

2)音素の開始時間(秒)

3)音素の終了時間(秒)

4)デバッグに有効な、人間に読み取れる音素の手掛かり

パラメータ

パラメータ タイプ 説明
Language 文字列 使用する言語。 英語の場合は「en」、日本語の場合は「jp」。
FileName 文字列 オーディオ ファイル(.wav または .avi ファイルなど)へのパス。 Mono および 16000k が推奨されます。 Softimage の Audio と同じオーディオ形式。MP3 はサポートされません。
GuideText 文字列 オーディオ ファイルで話されている言葉と同じテキスト。 エンジンが混乱する可能性があるため、通常とは異なる句読点や変わった文字は使用しないでください。

JScript の例

//Returns a VBArray object, which require using the .getItem method in Jscript because they are not 

//native objects there.  However, they work transparently like multi-dimentionnal arrays in VBscript and Python

var res = SIExtractPhonemes ("en", "s:\\here_be_dragons.wav", "Here be dragons, the map says");

arraysize = res.ubound( 1 );

logmessage( arraysize + "phenemes found" );

for (  i=0; i < arraysize; i++)

{

logmessage( "IPA#" + res.getItem(i,0) 

+ "(" + res.getItem(i,3) + ") "

+ "Start Time(sec) " + res.getItem(i,1) 

+ "End Time(sec) " + res.getItem(i,2) );

}

関連項目

GetPhonemeFromSpeechClip