第107行: |
第107行: |
| | | |
| ===科学家研究策略的传统与创新=== | | ===科学家研究策略的传统与创新=== |
| + | [[File:科学家研究策略的传统与创新.png|300px|thumb|center|科学家研究策略的传统与创新]] |
| | | |
− | [[File:科学家研究策略的传统与创新.png]]
| + | 哪些因素会影响科学家对研究问题的选择?科学史,哲学和社会学的定性研究表明,这种选择是由专业人士对生产力的需求与对风险创新的冲突驱动之间的“本质张力”所塑造的。本研究在生物医学化学的背景下根据经验检验这种紧张。使用复杂的网络来表示科学知识不断发展的状态,如出版物所述。然后,定义与这些网络相关的研究策略。科学家可以引入新的化学物质或化学关系或深入研究已知的化学物质。他们可以整合现有的知识集群,或者桥接远程知识集群。综合分析这些选择,结果发现策略的分布仍然非常稳定,即使化学知识急剧增长。探索新化学关系的高风险策略在文献中不那么普遍,反映出以牺牲新机会为代价越来越关注既定知识。遵循风险策略的研究更有可能被忽视,但也更有可能实现高影响和认可。虽然风险策略的结果具有比保守策略的结果更高的预期回报,但额外奖励不足以弥补额外风险。通过研究生物医学和化学中137种不同奖项的获奖者,结果表明,偶然的“赌博”对于非凡的影响是对观察到的冒险水平最合理的解释。 |
− | | |
− | 哪些因素会影响科学家对研究问题的选择?科学史,哲学和社会学的定性研究表明,这种选择是由专业人士对生产力的需求与对风险创新的冲突驱动之间的“本质张力”所塑造的。我们在生物医学化学的背景下根据经验检验这种紧张。我们使用复杂的网络来表示科学知识不断发展的状态,如出版物所述。然后,我们定义与这些网络相关的研究策略。科学家可以引入新的化学物质或化学关系 - 或深入研究已知的化学物质。他们可以整合现有的知识集群,或者桥接远程知识集群。综合分析这些选择,我们发现策略的分布仍然非常稳定,即使化学知识急剧增长。探索新化学关系的高风险策略在文献中不那么普遍,反映出以牺牲新机会为代价越来越关注既定知识。遵循风险策略的研究更有可能被忽视,但也更有可能实现高影响和认可。虽然风险策略的结果具有比保守策略的结果更高的预期回报,但额外奖励不足以弥补额外风险。通过研究生物医学和化学中137种不同奖项的获奖者,我们表明,偶然的“赌博”对于非凡的影响是对观察到的冒险水平最合理的解释。
| |
| | | |
| ===编制科学结构:科学展开结构的动态网络模型=== | | ===编制科学结构:科学展开结构的动态网络模型=== |
| + | [[File:2.jpg|300px|thumb|center|科学展开结构的动态网络模型]] |
| | | |
− | [[File:2.jpg]]
| + | 科学是一个复杂的系统。在拉图尔的演员网络理论的基础上,本文将已发表的科学模型化为动态超图,并探索这种结构如何为未来的科学发现提供基础。使用来自MEDLINE的数百万篇摘要,发现生物医学事物(即人,方法,疾病,化学品)之间的网络距离非常小。然后,文章还将展示科学如何通过加权随机游走模型从一年内回答的问题转移到下一个问题。文中的分析揭示了生物医学科学发展方式中有趣的模态倾向:方法起着桥接作用,一种类型的东西通过另一种类型的东西联系起来。 |
− | | |
− | 科学是一个复杂的系统。在拉图尔的演员网络理论的基础上,我们将已发表的科学模型化为动态超图,并探索这种结构如何为未来的科学发现提供基础。使用来自MEDLINE的数百万篇摘要,我们发现生物医学事物(即人,方法,疾病,化学品)之间的网络距离非常小。然后,我们将展示科学如何通过加权随机游走模型从一年内回答的问题转移到下一个问题。我们的分析揭示了生物医学科学发展方式中有趣的模态倾向:方法起着桥接作用,一种类型的东西通过另一种类型的东西联系起来。
| |
| | | |
| ===预言预测网络的模块化社区结构=== | | ===预言预测网络的模块化社区结构=== |
| + | [[File:3.png|300px|thumb|center|预言预测网络的模块化社区结构]] |
| | | |
− | [[File:3.png]]
| + | 本文考察了英语文本中语言预测的结构。通过copular“is-a”形式识别,预测断言两个词之间的类别成员 hypernymy 或等同 synonymy。由于预测表达了本体论结构,假设预测网络将形成模块化群体。为了衡量这一点,文中引入了一种语义动机的预测强度测量方法来衡量文本中观察到的相关预测。结果表明,预测确实形成了没有任何加权的模块化结构(Q _ 0.6),并且使用预测强度增加了这种模块性(Q _ 0.9)而不丢弃低频项目。这种高级模块化支持基于网络的分析和预测强度的使用,作为提取密集语义聚类的一种方式。 |
− | | |
− | 本文考察了英语文本中语言预测的结构。通过copular“is-a”形式识别,预测断言两个词之间的类别成员(hypernymy)或等同(synonymy)。由于预测表达了本体论结构,我们假设预测网络将形成模块化群体。为了衡量这一点,我们引入了一种语义动机的预测强度测量方法来衡量文本中观察到的相关预测。结果表明,预测确实形成了没有任何加权的模块化结构(Q _ 0.6),并且使用预测强度增加了这种模块性(Q _ 0.9)而不丢弃低频项目。这种高级模块化支持基于网络的分析和预测强度的使用,作为提取密集语义聚类的一种方式。 | |
| | | |
| ===从非结构化文本中提取专家术语集群=== | | ===从非结构化文本中提取专家术语集群=== |
| | | |
− | | + | 自动识别相关的专家术语是理解词典中较不突出部分的结构所需的困难且重要的任务。术语通常定义特定域的特征。James团队开发了一种基于语料库的方法,使用非结构化文本中的共现网络,提取卫星术语的相干聚类 - 词典边缘的术语。通过在共现图中提取社区来识别聚类,之后我们最大的被丢弃并且通过中心性对剩余组中的词进行排名。该方法在大型语料库上是计算上易处理的,不需要文档结构和最小规范化。结果表明,该方法确实在语料库中提取了具有不同内容,风格和结构的连贯卫星术语组。 |
− | | |
− | 自动识别相关的专家术语是理解词典中较不突出部分的结构所需的困难且重要的任务。术语通常定义特定域的特征。我们开发了一种基于语料库的方法,使用非结构化文本中的共现网络,提取卫星术语的相干聚类 - 词典边缘的术语。通过在共现图中提取社区来识别聚类,之后我们最大的被丢弃并且通过中心性对剩余组中的词进行排名。该方法在大型语料库上是计算上易处理的,不需要文档结构和最小规范化。结果表明,该方法确实在语料库中提取了具有不同内容,风格和结构的连贯卫星术语组。
| |
| | | |
| ===量化无证生物医学同义词的影响和程度=== | | ===量化无证生物医学同义词的影响和程度=== |
− |
| |
− |
| |
| | | |
| 从研究文献中提取和整合信息的自动化系统在生物医学中已经很普遍。由于相同的含义可以用许多不同但同义的方式表达,因此访问综合叙词表可以使这样的系统最大化其性能。在这里,我们确定了同义词对于特定文本挖掘任务(命名实体规范化)的重要性,并且我们建议当前的叙词表在他们的语言现象的记录中可能不足。为了测试这个主张,我们开发了一个估计缺失同义词数量的模型。我们将模型应用于生物医学术语和通用英语叙词表,预测两个词汇中大量缺失的同义词。此外,我们通过“众包”来验证我们对后一领域的一些预测。 | | 从研究文献中提取和整合信息的自动化系统在生物医学中已经很普遍。由于相同的含义可以用许多不同但同义的方式表达,因此访问综合叙词表可以使这样的系统最大化其性能。在这里,我们确定了同义词对于特定文本挖掘任务(命名实体规范化)的重要性,并且我们建议当前的叙词表在他们的语言现象的记录中可能不足。为了测试这个主张,我们开发了一个估计缺失同义词数量的模型。我们将模型应用于生物医学术语和通用英语叙词表,预测两个词汇中大量缺失的同义词。此外,我们通过“众包”来验证我们对后一领域的一些预测。 |
| | | |
| ===寻找文化洞穴:学术交流网络中结构与文化的分歧=== | | ===寻找文化洞穴:学术交流网络中结构与文化的分歧=== |
| + | [[File:寻找文化洞穴:学术交流网络中结构与文化的分歧.png|300px|thumb|center|寻找文化洞穴:学术交流网络中结构与文化的分歧]] |
| | | |
− | [[File:寻找文化洞穴:学术交流网络中结构与文化的分歧.png]]
| + | 不同的兴趣,专业知识和语言形成了沟通的文化障碍。没有任何形式可以描述这些\文化漏洞。“在这里,我们使用信息理论来衡量文化漏洞,并使用JSTOR的论文在科学传播的背景下展示我们的形式主义。我们从引文流的结构中提取科学领域,通过在全文中对短语频率进行编目并测量场间通信的相对效率来推断特定领域的文化。然后我们将引文和文化信息结合在一个新颖的科学地形图中,将引文与地理距离和文化洞穴映射到地形。通过分析完整的引文网络,发现交际效率随着引用距离以场特定的方式衰减。这些衰变率揭示了隐藏的凝聚力和分裂模式。例如,生态科学被行话标准化,而社会科学则相对融合。研究结果强调了利用文化数据丰富结构分析的重要性。 |
− | | |
− | 不同的兴趣,专业知识和语言形成了沟通的文化障碍。没有任何形式可以描述这些\文化漏洞。“在这里,我们使用信息理论来衡量文化漏洞,并使用JSTOR的论文在科学传播的背景下展示我们的形式主义。我们从引文流的结构中提取科学领域,通过在全文中对短语频率进行编目并测量场间通信的相对效率来推断特定领域的文化。然后我们将引文和文化信息结合在一个新颖的科学地形图中,将引文与地理距离和文化洞穴映射到地形。通过分析完整的引文网络,我们发现交际效率随着引用距离以场特定的方式衰减。这些衰变率揭示了隐藏的凝聚力和分裂模式。例如,生态科学被行话标准化,而社会科学则相对融合。我们的研究结果强调了利用文化数据丰富结构分析的重要性。 | |
| | | |
| ===关注地方卫生负担与全球卫生研究差距=== | | ===关注地方卫生负担与全球卫生研究差距=== |
| | | |
− | | + | 大多数关于全球卫生不平等的研究都考虑到不平等的卫生保健和社会经济条件,但忽视了与解决疾病负担相关的卫生知识生产中的不平等。James等证明了这种不平等并找出了可能的原因。使用世界卫生组织在全球和国家评估的111种突出医疗条件的残疾调整生命年 DALY,我们将DALYs与MEDLINE文章联系起来,以评估基于DALY的全球疾病负担与全球疾病负担的影响治疗市场,相关MEDLINE的制作,系统评价,临床试验和使用动物模型与人类的研究。然后,我们探讨了国家内部的DALY,财富和研究生产如何与这种全球模式相关联。我们表明,每种情况的全球DALYs与该条件下每种MEDLINE文章的产生有一个小的,显着的负相关关系。健康研究的当地进程似乎就在此背后。临床试验和动物研究,但没有在国家内部进行的系统评价,受到当地DALY的强烈指导。越来越不发达的国家的疾病状况非常不同,富裕国家的出版率远远超过贫穷国家。因此,发达国家共同的条件比欠发达国家的共同条件获得了更多的临床研究。欠发达国家的许多卫生需求并没有引起发达国家研究人员的注意,这些研究人员根据他们自己的当地需求生产绝大多数全球卫生知识 - 包括临床试验。这引起了对缺乏自身研究基础设施的贫困人口相关知识的关注。我们建议采取措施解决全球卫生不平等的这一关键方面。 |
− | | |
− | 大多数关于全球卫生不平等的研究都考虑到不平等的卫生保健和社会经济条件,但忽视了与解决疾病负担相关的卫生知识生产中的不平等。我们证明了这种不平等并找出了可能的原因。使用世界卫生组织在全球和国家评估的111种突出医疗条件的残疾调整生命年(DALY),我们将DALYs与MEDLINE文章联系起来,以评估基于DALY的全球疾病负担与全球疾病负担的影响治疗市场,相关MEDLINE的制作,系统评价,临床试验和使用动物模型与人类的研究。然后,我们探讨了国家内部的DALY,财富和研究生产如何与这种全球模式相关联。我们表明,每种情况的全球DALYs与该条件下每种MEDLINE文章的产生有一个小的,显着的负相关关系。健康研究的当地进程似乎就在此背后。临床试验和动物研究,但没有在国家内部进行的系统评价,受到当地DALY的强烈指导。越来越不发达的国家的疾病状况非常不同,富裕国家的出版率远远超过贫穷国家。因此,发达国家共同的条件比欠发达国家的共同条件获得了更多的临床研究。欠发达国家的许多卫生需求并没有引起发达国家研究人员的注意,这些研究人员根据他们自己的当地需求生产绝大多数全球卫生知识 - 包括临床试验。这引起了对缺乏自身研究基础设施的贫困人口相关知识的关注。我们建议采取措施解决全球卫生不平等的这一关键方面。
| |
| | | |
| ==出版物== | | ==出版物== |