Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

分割データ内の読みデータ判定 #2

Open
MikuroXina opened this issue Jun 8, 2022 · 0 comments
Open

分割データ内の読みデータ判定 #2

MikuroXina opened this issue Jun 8, 2022 · 0 comments

Comments

@MikuroXina
Copy link
Member

分割データ内の読みデータ判定

0.5 秒以上の分割データには, 88 種類の既知の読みデータが含まれている. この読みデータサンプルはプロコン公式サイトからダウンロードできる. この読みデータそれぞれごとの含まれる確率 88 個を畳み込みニューラルネットワークで求める.

考察

分割データはノイズがほぼ無い肉声を加算したもので, クリッピングが起こることがある. そのため単純な波形のマッチングではうまく判定できない. 前処理として定 Q 変換を施し精度を高める.

仕様

入力

0.5 秒以上, 量子化ビット数 16 bit, サンプリング周波数 48kHz, リニア PCM の音声波形の数列.

出力

読みデータ 88 個それぞれが入力音声に含まれている確率. 全体の合計が 1.0 に近いことが期待される.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants