更改
跳到导航
跳到搜索
第45行:
第45行:
− [[File:5.png]]+
→量化无证生物医学同义词的影响和程度
===量化无证生物医学同义词的影响和程度===
===量化无证生物医学同义词的影响和程度===
从研究文献中提取和整合信息的自动化系统在生物医学中已经很普遍。由于相同的含义可以用许多不同但同义的方式表达,因此访问综合叙词表可以使这样的系统最大化其性能。在这里,我们确定了同义词对于特定文本挖掘任务(命名实体规范化)的重要性,并且我们建议当前的叙词表在他们的语言现象的记录中可能不足。为了测试这个主张,我们开发了一个估计缺失同义词数量的模型。我们将模型应用于生物医学术语和通用英语叙词表,预测两个词汇中大量缺失的同义词。此外,我们通过“众包”来验证我们对后一领域的一些预测。
从研究文献中提取和整合信息的自动化系统在生物医学中已经很普遍。由于相同的含义可以用许多不同但同义的方式表达,因此访问综合叙词表可以使这样的系统最大化其性能。在这里,我们确定了同义词对于特定文本挖掘任务(命名实体规范化)的重要性,并且我们建议当前的叙词表在他们的语言现象的记录中可能不足。为了测试这个主张,我们开发了一个估计缺失同义词数量的模型。我们将模型应用于生物医学术语和通用英语叙词表,预测两个词汇中大量缺失的同义词。此外,我们通过“众包”来验证我们对后一领域的一些预测。