latex公式识别
#14487
Replies: 2 comments 1 reply
-
图片中是每隔200步记录一次的 |
Beta Was this translation helpful? Give feedback.
0 replies
-
从你的描述来看,问题的核心是模型在训练时表现良好,但在测试阶段(无论是测试集还是训练集)预测结果与真实值严重不符,输出乱码。这种情况通常是由以下几种原因之一导致的: 1. 解码器或后处理逻辑问题
2. 数据预处理不一致
3. 训练过程中过拟合或漂移
4. 模型权重保存或加载错误
5. 损失函数或指标计算问题
6. 字符字典及Tokenization问题
具体推荐操作根据你的描述,建议按以下顺序操作:
结论从你的描述中,最可能的原因是测试阶段的解码器逻辑或字符字典的使用不一致。建议优先从解码器和字典入手排查。如果仍然无法解决,可以尝试将训练日志和更多上下文(如修改的代码段)提供出来,以便更具体地定位问题。 希望对你有所帮助! Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
在原来基础上改了些代码,现在训练时的效果特别好,第一个epoch_rate就已经达到0.9。在训练时指标看着也没有过拟合的迹象,但是在测试模型时输出的预测结果和真实的结果完全 不一样。并且我使用训练集来进行测试,结果也是一样的,预测 ['{{{{{{{{{{{{{{{{{', '\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,']
真实 ['\sigma(42)=96=3\times4\times8=\sigma(2)\times\sigma(3)\times\sigma(7)=1+2+3+6+7+14+21+42', 't\rightarrow t+\xi^{t}(x,X^{a})\,,\quad x^{m}\rightarrow x^{m}+\xi^{m}(x,X),\quad X^{a}\rightarrow X^{a}+\xi^{a}(X)\,,']。
我把 训练日志也传上来,现在不知道到底是什么情况,说是解码器中评估时生成预测输出的代码有问题吧,但是弄到源码中去又能识别出来一些,不会像现在这样乱七八糟的。有没有大佬能看出来是什么问题吗?
train.log
Beta Was this translation helpful? Give feedback.
All reactions