Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Hackathon 7th No.55】rfc: 在 PaddleSpeech 中实现 DAC 的训练中使用的第三方库 audiotools PaddlePaddle/Paddle#68244] #1016

Open
wants to merge 1 commit into
base: master
Choose a base branch
from

Conversation

suzakuwcx
Copy link

No description provided.

Copy link

paddle-bot bot commented Nov 16, 2024

你的PR提交成功,感谢你对开源项目的贡献!
请检查PR提交格式和内容是否完备,具体请参考示例模版
Your PR has been submitted. Thanks for your contribution!
Please check its format and content. For this, you can refer to Template and Demo.

@CLAassistant
Copy link

CLAassistant commented Nov 16, 2024

CLA assistant check
All committers have signed the CLA.

@suzakuwcx
Copy link
Author

image

目前计划的调用路径如上图,使用 paddlespeech.audio.audiotools 来调用接口

因为主要的目的还是复现 dac 模型为主,所以目前的开发思路是

  • 后续会优先移植 audiotools 下面的测试用例,然后逐渐用 paddle 的实现替换掉 torch 的实现,以保证测试用例通过的方式来迭代开发
  • 尽可能移除不必要的依赖,像原仓库的 tempfile 完全就是不必要的依赖,完全可以用 ByteIO 代替

这里存在几个可以讨论一下的问题:

  • paddlespeech 的测试方式是使用脚本实现的,是否可以添加 pytest 作为额外的测试方式?
  • 为了尽可能贴近实现,大量借鉴原仓库代码是比较快速的方案,但这是否是符合预期的?还是预期希望在保证接口的情况尽可能的用 paddle 重现一下原代码的逻辑

然后有木有群呀,这样会方便沟通一些 ~


## 3、意义

- 扩充PaddleOcr中的语音预处理能力
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

speech

@zxcd
Copy link
Contributor

zxcd commented Nov 20, 2024

image

目前计划的调用路径如上图,使用 paddlespeech.audio.audiotools 来调用接口

因为主要的目的还是复现 dac 模型为主,所以目前的开发思路是

  • 后续会优先移植 audiotools 下面的测试用例,然后逐渐用 paddle 的实现替换掉 torch 的实现,以保证测试用例通过的方式来迭代开发
  • 尽可能移除不必要的依赖,像原仓库的 tempfile 完全就是不必要的依赖,完全可以用 ByteIO 代替

这里存在几个可以讨论一下的问题:

  • paddlespeech 的测试方式是使用脚本实现的,是否可以添加 pytest 作为额外的测试方式?
  • 为了尽可能贴近实现,大量借鉴原仓库代码是比较快速的方案,但这是否是符合预期的?还是预期希望在保证接口的情况尽可能的用 paddle 重现一下原代码的逻辑

然后有木有群呀,这样会方便沟通一些 ~

首先移植的时候需要使用paddle重现代码逻辑,单测总量如果不算特别多建议保持原有格式。后续可以拉个如流群加群快速交流下。

@luotao1
Copy link
Collaborator

luotao1 commented Nov 20, 2024

后续可以拉个如流群加群快速交流下。

请通过【如流】扫描下方的二维码,我会把你拉入交流群。
image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging this pull request may close these issues.

4 participants