bert bert_wos46895.xlsx文件是一些公开数据集的评测结果,这只是一部分,其它数据集是公司内部的就不公开了,只需3-4个epoch就能跑到最优性能,各种超参数几乎都尝试过,都没达到更好的性能,总的来说优化空间不大,但和公开方法相比是最优的,这点不得不服. 还有一点要提一下,就是文本序列长度对最终性能几乎没有有任何影响,各种长度都跑过,相比RNN模型来说,这点真的很强大.