You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
这两个参数的作用效果有重叠,增大这两个参数值都会增加正类的权重,所以调参的时候考虑固定一个参数,只调整其中一个参数。调重参数可以分析一下p r f1 值,如果p值大而r值小考虑减小正类权重,否则降低权重。另外建议你分析一下词典的特性,是否覆盖面太小导致词典标注的数据没有代表性,如果是的话考虑扩充词典。词典标注是否错误率太高,是的话考虑筛选词典。最后,我们没有在中文数据集上做过实验,所以没有复现一说:)。
这两个参数的作用效果有重叠,增大这两个参数值都会增加正类的权重,所以调参的时候考虑固定一个参数,只调整其中一个参数。调重参数可以分析一下p r f1 值,如果p值大而r值小考虑减小正类权重,否则降低权重。另外建议你分析一下词典的特性,是否覆盖面太小导致词典标注的数据没有代表性,如果是的话考虑扩充词典。词典标注是否错误率太高,是的话考虑筛选词典。最后,我们没有在中文数据集上做过实验,所以没有复现一说:)。
作者您好,我尝试了将PU算法这篇复现到中文数据集ResumeNER上,当时通过不断尝试loss的权重参数和正例的比例参数成功了一类,但是其他几类就无法复现了,对于这两个参数的选择感觉也很玄学,所以想请教一下您这两个参数具体的设置原理是什么以及您是否有在中文数据集上做过尝试,万分感谢!
The text was updated successfully, but these errors were encountered: