8000 模型微调的训练数据处理 · Issue #7 · THUDM/AutoRE · GitHub
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content
模型微调的训练数据处理 #7
Open
@QiankunPi

Description

@QiankunPi

您好!这篇论文的工作对DocRE方向起到了非常好的指导性工作。但有一个问题请问一下:对于RE-DocRED数据集,您在使用训练数据进行模型微调时,labels中的是三元组信息是怎么转换的呢?例如对于labels中的一组信息[h:11,r:P1580,t:6],这里r:P1580很好理解它是代表id为P1580的关系,但对于h:11,它表示是实体编号为11的那个实体,但如果该实体有多个提及,我应该取哪个提及呢,还是说默认取第一个?还是所有提及都取一次?这个问题一直困惑着我,因为如果不确定取哪个提及的话,那提供的训练数据在微调时可能会存在很大问题。还请您百忙之中能帮助解答一下这个问题,非常感谢!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions

      0