v9.0 (2011)
認識の指針となるテキストを使用して、オーディオ ファイルから音素を抽出します。
oReturn = SIExtractPhonemes( Language, FileName, GuideText ); |
結果の多方向の配列を戻します。 各列には次の内容が含まれます。
1)音素の Unicode IPA コード
2)音素の開始時間(秒)
3)音素の終了時間(秒)
4)デバッグに有効な、人間に読み取れる音素の手掛かり
パラメータ | タイプ | 説明 |
---|---|---|
Language | 文字列 | 使用する言語。 英語の場合は「en」、日本語の場合は「jp」。 |
FileName | 文字列 | オーディオ ファイル(.wav または .avi ファイルなど)へのパス。 Mono および 16000k が推奨されます。 Softimage の Audio と同じオーディオ形式。MP3 はサポートされません。 |
GuideText | 文字列 | オーディオ ファイルで話されている言葉と同じテキスト。 エンジンが混乱する可能性があるため、通常とは異なる句読点や変わった文字は使用しないでください。 |
//Returns a VBArray object, which require using the .getItem method in Jscript because they are not //native objects there. However, they work transparently like multi-dimentionnal arrays in VBscript and Python var res = SIExtractPhonemes ("en", "s:\\here_be_dragons.wav", "Here be dragons, the map says"); arraysize = res.ubound( 1 ); logmessage( arraysize + "phenemes found" ); for ( i=0; i < arraysize; i++) { logmessage( "IPA#" + res.getItem(i,0) + "(" + res.getItem(i,3) + ") " + "Start Time(sec) " + res.getItem(i,1) + "End Time(sec) " + res.getItem(i,2) ); } |