更改

跳到导航 跳到搜索
删除1字节 、 2021年8月29日 (日) 00:43
第180行: 第180行:  
客观指的是具有事实信息的事件。<ref name="Wiebe 2005 486–497">{{Cite journal|last1=Wiebe|first1=Janyce|last2=Riloff|first2=Ellen|date=2005|editor-last=Gelbukh|editor-first=Alexander|title=Creating Subjective and Objective Sentence Classifiers from Unannotated Texts|url=https://link.springer.com/chapter/10.1007%2F978-3-540-30586-6_53|journal=Computational Linguistics and Intelligent Text Processing|series=Lecture Notes in Computer Science|volume=3406|language=en|location=Berlin, Heidelberg|publisher=Springer|pages=486–497|doi=10.1007/978-3-540-30586-6_53}}</ref>
 
客观指的是具有事实信息的事件。<ref name="Wiebe 2005 486–497">{{Cite journal|last1=Wiebe|first1=Janyce|last2=Riloff|first2=Ellen|date=2005|editor-last=Gelbukh|editor-first=Alexander|title=Creating Subjective and Objective Sentence Classifiers from Unannotated Texts|url=https://link.springer.com/chapter/10.1007%2F978-3-540-30586-6_53|journal=Computational Linguistics and Intelligent Text Processing|series=Lecture Notes in Computer Science|volume=3406|language=en|location=Berlin, Heidelberg|publisher=Springer|pages=486–497|doi=10.1007/978-3-540-30586-6_53}}</ref>
    +
* 客观句的例子:“要当选美国总统,候选人必须年满35岁。”
   −
* 客观句的例子:“要当选美国总统,候选人必须年满35岁。”
   
主观这个术语描述的事件包含各种形式的非事实信息,如个人意见、判断和预测。也被Quirk等人称为“私人状况(private states)”。<ref name=":10">{{Cite book|last1=Quirk|first1=Randolph|title=A Comprehensive Grammar of the English Language (General Grammar)|last2=Greenbaum|first2=Sidney|last3=Geoffrey|first3=Leech|last4=Jan|first4=Svartvik|publisher=Longman|year=1985|isbn=1933108312|pages=175–239}}</ref>在下面的例子中,它反映了“我们美国人”这样一个私人状态。此外,被评论的目标实体可以是从有形到无形的话题事项等多种形式(Liu,2010)。<ref name="Liu2010" />  此外,刘(2010)还观察到三种类型的态度: 1)正面的观点,2)中性的观点,3)负面的观点。<ref name="Liu2010" />
 
主观这个术语描述的事件包含各种形式的非事实信息,如个人意见、判断和预测。也被Quirk等人称为“私人状况(private states)”。<ref name=":10">{{Cite book|last1=Quirk|first1=Randolph|title=A Comprehensive Grammar of the English Language (General Grammar)|last2=Greenbaum|first2=Sidney|last3=Geoffrey|first3=Leech|last4=Jan|first4=Svartvik|publisher=Longman|year=1985|isbn=1933108312|pages=175–239}}</ref>在下面的例子中,它反映了“我们美国人”这样一个私人状态。此外,被评论的目标实体可以是从有形到无形的话题事项等多种形式(Liu,2010)。<ref name="Liu2010" />  此外,刘(2010)还观察到三种类型的态度: 1)正面的观点,2)中性的观点,3)负面的观点。<ref name="Liu2010" />
    +
* 主观句的例子:“我们美国人需要选出一位成熟且能够做出明智决定的总统。”
   −
* 主观句的例子:“我们美国人需要选出一位成熟且能够做出明智决定的总统。”
   
这种分析是一个分类的问题。<ref name=":1" />
 
这种分析是一个分类的问题。<ref name=":1" />
   第210行: 第210行:  
# 人为错误。人工标记是一项细致的工作,需要精力高度集中才能完成。
 
# 人为错误。人工标记是一项细致的工作,需要精力高度集中才能完成。
 
# 耗时长。人工注释是一项繁重的工作。Riloff(1996)的调查研究表明,一个标记者完成160篇文本标记需要8个小时。<ref name=":17">{{Cite journal|last=Riloff|first=Ellen|date=1996-08-01|title=An empirical study of automated dictionary construction for information extraction in three domains|url=https://dx.doi.org/10.1016%2F0004-3702%2895%2900123-9|journal=Artificial Intelligence|language=en|volume=85|issue=1|pages=101–134|doi=10.1016/0004-3702(95)00123-9|issn=0004-3702|doi-access=free}}</ref>
 
# 耗时长。人工注释是一项繁重的工作。Riloff(1996)的调查研究表明,一个标记者完成160篇文本标记需要8个小时。<ref name=":17">{{Cite journal|last=Riloff|first=Ellen|date=1996-08-01|title=An empirical study of automated dictionary construction for information extraction in three domains|url=https://dx.doi.org/10.1016%2F0004-3702%2895%2900123-9|journal=Artificial Intelligence|language=en|volume=85|issue=1|pages=101–134|doi=10.1016/0004-3702(95)00123-9|issn=0004-3702|doi-access=free}}</ref>
 +
    
上面所有提到的这些原因都会影响主客观分类的效率和效果。因此,研究者设计了两种自举算法(bootstrapping methods),这两种方法的目的是从未标记的文本数据中学习语言模式。两种方法都以少量种子词和大量未标记的文本语料开始。
 
上面所有提到的这些原因都会影响主客观分类的效率和效果。因此,研究者设计了两种自举算法(bootstrapping methods),这两种方法的目的是从未标记的文本数据中学习语言模式。两种方法都以少量种子词和大量未标记的文本语料开始。
      
# Meta-Bootstrapping(Riloff & Jones,1999)。<ref name=":18">{{Cite journal|last1=Riloff|first1=Ellen|last2=Jones|first2=Rosie|date=July 1999|title=Learning dictionaries for information extraction by multi-level bootstrapping|url=https://aaai.org/Papers/AAAI/1999/AAAI99-068.pdf|journal=AAAI '99/IAAI '99: Proceedings of the Sixteenth National Conference on Artificial Intelligence and the Eleventh Innovative Applications of Artificial Intelligence Conference Innovative Applications of Artificial Intelligence|pages=474–479}}</ref>  第一步: 根据预定义的规则生成提取模式,并根据每个模式所包含的种子词数量生成提取模式。第二步: 将分数排名前5的单词标记并添加到语义字典中。重复上述方法。
 
# Meta-Bootstrapping(Riloff & Jones,1999)。<ref name=":18">{{Cite journal|last1=Riloff|first1=Ellen|last2=Jones|first2=Rosie|date=July 1999|title=Learning dictionaries for information extraction by multi-level bootstrapping|url=https://aaai.org/Papers/AAAI/1999/AAAI99-068.pdf|journal=AAAI '99/IAAI '99: Proceedings of the Sixteenth National Conference on Artificial Intelligence and the Eleventh Innovative Applications of Artificial Intelligence Conference Innovative Applications of Artificial Intelligence|pages=474–479}}</ref>  第一步: 根据预定义的规则生成提取模式,并根据每个模式所包含的种子词数量生成提取模式。第二步: 将分数排名前5的单词标记并添加到语义字典中。重复上述方法。
第222行: 第222行:     
主观和客观分类器可以增强自然语言处理的服务应用。该分类器的主要好处之一是,它使数据驱动的决策过程在各个行业中得到普及。据Liu介绍,主观和客观识别的应用已经在商业、广告、体育和社会科学中得到了实践。<ref name=":20">{{Cite journal|last=Liu|first=Bing|date=2012-05-23|title=Sentiment Analysis and Opinion Mining|url=https://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016|journal=Synthesis Lectures on Human Language Technologies|volume=5|issue=1|pages=1–167|doi=10.2200/S00416ED1V01Y201204HLT016|issn=1947-4040}}</ref>
 
主观和客观分类器可以增强自然语言处理的服务应用。该分类器的主要好处之一是,它使数据驱动的决策过程在各个行业中得到普及。据Liu介绍,主观和客观识别的应用已经在商业、广告、体育和社会科学中得到了实践。<ref name=":20">{{Cite journal|last=Liu|first=Bing|date=2012-05-23|title=Sentiment Analysis and Opinion Mining|url=https://www.morganclaypool.com/doi/abs/10.2200/S00416ED1V01Y201204HLT016|journal=Synthesis Lectures on Human Language Technologies|volume=5|issue=1|pages=1–167|doi=10.2200/S00416ED1V01Y201204HLT016|issn=1947-4040}}</ref>
      
* 在线评论分类:在商业行业,分类器帮助公司更好地理解产品的反馈和对评论背后逻辑的推理。
 
* 在线评论分类:在商业行业,分类器帮助公司更好地理解产品的反馈和对评论背后逻辑的推理。
1,068

个编辑

导航菜单