分割データ内の読みデータ判定 #2

MikuroXina · 2022-06-08T07:39:34Z

分割データ内の読みデータ判定

0.5 秒以上の分割データには, 88 種類の既知の読みデータが含まれている. この読みデータサンプルはプロコン公式サイトからダウンロードできる. この読みデータそれぞれごとの含まれる確率 88 個を畳み込みニューラルネットワークで求める.

分割データはノイズがほぼ無い肉声を加算したもので, クリッピングが起こることがある. そのため単純な波形のマッチングではうまく判定できない. 前処理として定 Q 変換を施し精度を高める.

0.5 秒以上, 量子化ビット数 16 bit, サンプリング周波数 48kHz, リニア PCM の音声波形の数列.

読みデータ 88 個それぞれが入力音声に含まれている確率. 全体の合計が 1.0 に近いことが期待される.

The text was updated successfully, but these errors were encountered:

MikuroXina assigned zero-two0925 and dwudwu-ko and unassigned zero-two0925 and dwudwu-ko Jun 8, 2022