We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
0.5 秒以上の分割データには, 88 種類の既知の読みデータが含まれている. この読みデータサンプルはプロコン公式サイトからダウンロードできる. この読みデータそれぞれごとの含まれる確率 88 個を畳み込みニューラルネットワークで求める.
分割データはノイズがほぼ無い肉声を加算したもので, クリッピングが起こることがある. そのため単純な波形のマッチングではうまく判定できない. 前処理として定 Q 変換を施し精度を高める.
0.5 秒以上, 量子化ビット数 16 bit, サンプリング周波数 48kHz, リニア PCM の音声波形の数列.
読みデータ 88 個それぞれが入力音声に含まれている確率. 全体の合計が 1.0 に近いことが期待される.
1.0
The text was updated successfully, but these errors were encountered:
No branches or pull requests
分割データ内の読みデータ判定
0.5 秒以上の分割データには, 88 種類の既知の読みデータが含まれている. この読みデータサンプルはプロコン公式サイトからダウンロードできる. この読みデータそれぞれごとの含まれる確率 88 個を畳み込みニューラルネットワークで求める.
考察
分割データはノイズがほぼ無い肉声を加算したもので, クリッピングが起こることがある. そのため単純な波形のマッチングではうまく判定できない. 前処理として定 Q 変換を施し精度を高める.
仕様
入力
0.5 秒以上, 量子化ビット数 16 bit, サンプリング周波数 48kHz, リニア PCM の音声波形の数列.
出力
読みデータ 88 個それぞれが入力音声に含まれている確率. 全体の合計が
1.0
に近いことが期待される.The text was updated successfully, but these errors were encountered: