更改

添加35字节 、 2021年8月9日 (一) 21:24
第456行: 第456行:     
现有的情感分析的方法主要可以分成三类:基于知识的技术(knowledge-based techniques)、统计方法(statistical methods)和混合方法(hybrid approaches)。<ref name="“Cambria" /> 基于知识的技术根据明确的情感词(如快乐、悲伤、害怕和无聊)的存在对文本进行分类。<ref name="Ortony" /> 一些知识库不仅列出了明显的情感,而且还赋予了任意词汇与特定情感可能的“亲和性”。<ref name="Stevenson" /> 统计方法通过调控机器学习中的元素,比如潜在语意分析(latent semantic analysis),SVM(support vector machines),词袋(bag of words),(Pointwise Mutual Information for Semantic Orientation)和深度学习(depp learning)等等。一些复杂的方法意在检测出情感持有者(比如,保持情绪状态的那个人)和情感目标(比如,让情感持有者产生情绪的实体)。<ref name="Kim+Hovy06" /> 语法依赖关系是通过对文本的深度解析得到的。<ref name="DeyHaque08" /> 与单纯的语义技术不同的是,混合算法的思路利用了知识表达(knowledge representation)的元素,比如知识本体 (ontologies)、语意网络(semantic networks),因此这种算法也可以检测到文字间比较微妙的情感表达。例如, 通过分析一些没有明确表达相关信息的概念与明确概念的隐性的联系来获取所求信息。<ref name="“Hussain" />要想挖掘在某语境下的意见,或是获取被给予意见的某项功能,需要使用到语法之间的关系。语法之间互相的关联性经常需要通过深度解析文本来获取。
 
现有的情感分析的方法主要可以分成三类:基于知识的技术(knowledge-based techniques)、统计方法(statistical methods)和混合方法(hybrid approaches)。<ref name="“Cambria" /> 基于知识的技术根据明确的情感词(如快乐、悲伤、害怕和无聊)的存在对文本进行分类。<ref name="Ortony" /> 一些知识库不仅列出了明显的情感,而且还赋予了任意词汇与特定情感可能的“亲和性”。<ref name="Stevenson" /> 统计方法通过调控机器学习中的元素,比如潜在语意分析(latent semantic analysis),SVM(support vector machines),词袋(bag of words),(Pointwise Mutual Information for Semantic Orientation)和深度学习(depp learning)等等。一些复杂的方法意在检测出情感持有者(比如,保持情绪状态的那个人)和情感目标(比如,让情感持有者产生情绪的实体)。<ref name="Kim+Hovy06" /> 语法依赖关系是通过对文本的深度解析得到的。<ref name="DeyHaque08" /> 与单纯的语义技术不同的是,混合算法的思路利用了知识表达(knowledge representation)的元素,比如知识本体 (ontologies)、语意网络(semantic networks),因此这种算法也可以检测到文字间比较微妙的情感表达。例如, 通过分析一些没有明确表达相关信息的概念与明确概念的隐性的联系来获取所求信息。<ref name="“Hussain" />要想挖掘在某语境下的意见,或是获取被给予意见的某项功能,需要使用到语法之间的关系。语法之间互相的关联性经常需要通过深度解析文本来获取。
 +
      第482行: 第483行:  
A human analysis component is required in sentiment analysis, as automated systems are not able to analyze historical tendencies of the individual commenter, or the platform and are often classified incorrectly in their expressed sentiment. Automation impacts approximately 23% of comments that are correctly classified by humans.<ref>{{cite web|title=Case Study: Advanced Sentiment Analysis|url=http://paragonpoll.com/sentiment-analysis-systems-case-study/|access-date=18 October 2013}}</ref> However, humans often disagree, and it is argued that the inter-human agreement provides an upper bound that automated sentiment classifiers can eventually reach.<ref>{{Cite journal|last1=Mozetič|first1=Igor|last2=Grčar|first2=Miha|last3=Smailović|first3=Jasmina|date=2016-05-05|title=Multilingual Twitter Sentiment Classification: The Role of Human Annotators|journal=PLOS ONE|volume=11|issue=5|pages=e0155036|doi=10.1371/journal.pone.0155036|issn=1932-6203|pmc=4858191|pmid=27149621|arxiv=1602.07563|bibcode=2016PLoSO..1155036M}}</ref>
 
A human analysis component is required in sentiment analysis, as automated systems are not able to analyze historical tendencies of the individual commenter, or the platform and are often classified incorrectly in their expressed sentiment. Automation impacts approximately 23% of comments that are correctly classified by humans.<ref>{{cite web|title=Case Study: Advanced Sentiment Analysis|url=http://paragonpoll.com/sentiment-analysis-systems-case-study/|access-date=18 October 2013}}</ref> However, humans often disagree, and it is argued that the inter-human agreement provides an upper bound that automated sentiment classifiers can eventually reach.<ref>{{Cite journal|last1=Mozetič|first1=Igor|last2=Grčar|first2=Miha|last3=Smailović|first3=Jasmina|date=2016-05-05|title=Multilingual Twitter Sentiment Classification: The Role of Human Annotators|journal=PLOS ONE|volume=11|issue=5|pages=e0155036|doi=10.1371/journal.pone.0155036|issn=1932-6203|pmc=4858191|pmid=27149621|arxiv=1602.07563|bibcode=2016PLoSO..1155036M}}</ref>
   −
在情感分析中,需要有人工分析的成分。因为自动化系统无法分析评论者个人的历史倾向,也无法分析平台的历史倾向,这往往导致对表达的情感的错误分类。自动化情感分类器通常能够识别大约23% 被人类正确分类的评论。然而,人们往往不同意这种说法,。并认为人与人之间的一致意见提供了一个自动化情感分类器最终可以达到的上限
+
在情感分析中,需要有人工分析的成分。因为自动化系统无法分析评论者个人的历史倾向,也无法分析平台的历史倾向,这往往导致对表达的情感的错误分类。自动化情感分类器通常能够识别大约23% 被人类正确分类的评论。然而,人们往往不同意这种说法,并认为自动化情感分类器最终可以达到的与人类一致的判断上限。
    
== Evaluation 评估 ==
 
== Evaluation 评估 ==
第501行: 第502行:  
</ref>
 
</ref>
    +
原则上来说,情感分析系统的准确性就是它与人类判断的一致性程度。这通常由基于负面和正面文本这两个目标类别识别的查准率和查全率的变量来衡量的。这通常是衡量的不同措施的基础上的准确率召回率,超过两个目标类别的消极和积极的文本。然而,根据现有研究,人类评分员之间通常只有80%的几率是达成一致的(参见评分者之间的信度Inter-rater reliability)。因此,一个情感分类的程序如果能够达到70%的准确率,那么尽管这样的准确率这听起来还不算引人注目,但它的表现已经和人工识别的表现得几乎一样好。同时需要注意的是,因为人类本身对任何情感分类的答案都可能有很大的不同意见,如果一个程序有100%的准确率,人类仍然会有20%的可能不同意其判断的结果。
   −
  −
  −
  −
情感分析系统的准确性,原则上来说,就是它与人类判断的一致程度。这通常是衡量的不同措施的基础上的准确率召回率,超过两个目标类别的消极和积极的文本。然而,根据研究,人类评分员通常只有80% 的时间同意(参见评分员之间的可靠性)。因此,一个在分类情绪上达到70% 准确率的程序几乎和人类一样好,即使这样的准确率听起来并不令人印象深刻。如果一个程序在100% 的时间里是“正确的”,人类仍然会在20% 的时间里不同意它,因为他们对任何答案都有很大的不同意见。
      
On the other hand, computer systems will make very different errors than human assessors, and thus the figures are not entirely comparable. For instance, a computer system will have trouble with negations, exaggerations, [[joke]]s, or sarcasm, which typically are easy to handle for a human reader: some errors a computer system makes will seem overly naive to a human. In general, the utility for practical commercial tasks of sentiment analysis as it is defined in academic research has been called into question, mostly since the simple one-dimensional model of sentiment from negative to positive yields rather little actionable information for a client worrying about the effect of public discourse on e.g. brand or corporate reputation.<ref>
 
On the other hand, computer systems will make very different errors than human assessors, and thus the figures are not entirely comparable. For instance, a computer system will have trouble with negations, exaggerations, [[joke]]s, or sarcasm, which typically are easy to handle for a human reader: some errors a computer system makes will seem overly naive to a human. In general, the utility for practical commercial tasks of sentiment analysis as it is defined in academic research has been called into question, mostly since the simple one-dimensional model of sentiment from negative to positive yields rather little actionable information for a client worrying about the effect of public discourse on e.g. brand or corporate reputation.<ref>
第527行: 第525行:     
为了更好地适应市场需求,情绪分析的评估已转向更多基于任务的措施,与公关机构和市场研究专业人士的代表共同制定。中的焦点。RepLab 评估数据集较少考虑文本的内容,而更多考虑文本对品牌声誉的影响。Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij, and Maarten de Rijke.“ RepLab 2012概述: 评估在线信誉管理系统”在 CLEF (网上工作笔记/实验室/工作坊)。2012.Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke, and Damiano Spina.“ replab 2013概述: 评估在线声誉监控系统。”欧洲语言跨语言评价论坛国际会议,第页。333-352.Springer Berlin Heidelberg,2013年。Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke, and Damiano Spina.“ replab 2014概述: 在线声誉管理的作者特征和声誉维度。”欧洲语言跨语言评价论坛国际会议,第页。307-322.斯普林格国际出版社,2014年。
 
为了更好地适应市场需求,情绪分析的评估已转向更多基于任务的措施,与公关机构和市场研究专业人士的代表共同制定。中的焦点。RepLab 评估数据集较少考虑文本的内容,而更多考虑文本对品牌声誉的影响。Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij, and Maarten de Rijke.“ RepLab 2012概述: 评估在线信誉管理系统”在 CLEF (网上工作笔记/实验室/工作坊)。2012.Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke, and Damiano Spina.“ replab 2013概述: 评估在线声誉监控系统。”欧洲语言跨语言评价论坛国际会议,第页。333-352.Springer Berlin Heidelberg,2013年。Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke, and Damiano Spina.“ replab 2014概述: 在线声誉管理的作者特征和声誉维度。”欧洲语言跨语言评价论坛国际会议,第页。307-322.斯普林格国际出版社,2014年。
  −
Because evaluation of sentiment analysis is becoming more and more task based, each implementation needs a separate training model to get a more accurate representation of sentiment for a given data set.
      
Because evaluation of sentiment analysis is becoming more and more task based, each implementation needs a separate training model to get a more accurate representation of sentiment for a given data set.
 
Because evaluation of sentiment analysis is becoming more and more task based, each implementation needs a separate training model to get a more accurate representation of sentiment for a given data set.
54

个编辑