第277行: |
第277行: |
| == 方法和特征 == | | == 方法和特征 == |
| | | |
− | 现有的情感分析的方法主要可以分成三类:基于知识的技术(knowledge-based techniques)、统计方法(statistical methods)和混合方法(hybrid approaches)。<ref name="“Cambria">
| + | 现有的情感分析的方法主要可以分成三类:基于知识的技术knowledge-based techniques、统计方法statistical methods和混合方法hybrid approaches。<ref name="“Cambria"> |
| {{cite journal | | {{cite journal |
| | first1 = E | | | first1 = E |
第296行: |
第296行: |
| | citeseerx = 10.1.1.688.1384 | | | citeseerx = 10.1.1.688.1384 |
| }} | | }} |
− | </ref>基于知识的技术根据明确的情感词(如快乐、悲伤、害怕和无聊)的存在对文本进行分类。<ref name="Ortony"> | + | </ref>基于知识的技术根据明确的情感词如快乐、悲伤、害怕和无聊的存在对文本进行分类。<ref name="Ortony"> |
| {{cite book | | {{cite book |
| |first1 = Andrew | | |first1 = Andrew |
第331行: |
第331行: |
| | doi-access = free | | | doi-access = free |
| }} | | }} |
− | </ref>统计方法通过调控机器学习中的元素,比如潜在语意分析(latent semantic analysis),SVM(support vector machines),词袋(bag of words),(Pointwise Mutual Information for Semantic Orientation)<ref name="Turney02"> | + | </ref>统计方法通过调控机器学习中的元素,比如潜在语意分析latent semantic analysis,SVMsupport vector machines,词袋bag of words,Pointwise Mutual Information for Semantic Orientation<ref name="Turney02"> |
| {{cite conference | | {{cite conference |
| | first = Peter | last = Turney | | | first = Peter | last = Turney |
第340行: |
第340行: |
| | arxiv = cs.LG/0212032 | | | arxiv = cs.LG/0212032 |
| }} | | }} |
− | </ref>和深度学习(depp learning)等等。一些复杂的方法意在检测出情感持有者(比如,保持情绪状态的那个人)和情感目标(比如,让情感持有者产生情绪的实体)。<ref name="Kim+Hovy06"> | + | </ref>和深度学习depp learning等等。一些复杂的方法意在检测出情感持有者比如,保持情绪状态的那个人和情感目标比如,让情感持有者产生情绪的实体。<ref name="Kim+Hovy06"> |
| {{cite conference | | {{cite conference |
| |last1 = Kim | | |last1 = Kim |
第347行: |
第347行: |
| |first2 = E. H. | | |first2 = E. H. |
| |title = Identifying and Analyzing Judgment Opinions. | | |title = Identifying and Analyzing Judgment Opinions. |
− | |book-title = Proceedings of the Human Language Technology / North American Association of Computational Linguistics conference (HLT-NAACL 2006). New York, NY. | + | |book-title = Proceedings of the Human Language Technology / North American Association of Computational Linguistics conference HLT-NAACL 2006. New York, NY. |
| |year = 2006 | | |year = 2006 |
| |url = http://acl.ldc.upenn.edu/P/P06/P06-2063.pdf | | |url = http://acl.ldc.upenn.edu/P/P06/P06-2063.pdf |
第362行: |
第362行: |
| | url = http://portal.acm.org/citation.cfm?id=1390763&dl=GUIDE&coll=GUIDE&CFID=92244761&CFTOKEN=30578437 | | | url = http://portal.acm.org/citation.cfm?id=1390763&dl=GUIDE&coll=GUIDE&CFID=92244761&CFTOKEN=30578437 |
| }} | | }} |
− | </ref>与单纯的语义技术不同的是,混合算法的思路利用了知识表达(knowledge representation)的元素,比如知识本体 (ontologies)、语意网络(semantic networks),因此这种算法也可以检测到文字间比较微妙的情感表达。例如, 通过分析一些没有明确表达相关信息的概念与明确概念的隐性的联系来获取所求信息。<ref name="“Hussain"> | + | </ref>与单纯的语义技术不同的是,混合算法的思路利用了知识表达knowledge representation的元素,比如知识本体 ontologies、语意网络semantic networks,因此这种算法也可以检测到文字间比较微妙的情感表达。例如, 通过分析一些没有明确表达相关信息的概念与明确概念的隐性的联系来获取所求信息。<ref name="“Hussain"> |
| {{cite book | | {{cite book |
| | first1 = E | | | first1 = E |
第385行: |
第385行: |
| | url = http://portal.acm.org/citation.cfm?id=1964867 | | | url = http://portal.acm.org/citation.cfm?id=1964867 |
| }} | | }} |
− | </ref> 另一方面,基于知识的系统利用公开可用的资源,提取与自然语言概念相关的语义和情感信息。该系统可以帮助执行情感常识推理。<ref name=":24">{{Cite journal|last1=Sasikala|first1=P.|last2=Mary Immaculate Sheela|first2=L.|date=December 2020|title=Sentiment analysis of online product reviews using DLMNN and future prediction of online product using IANFIS|journal=Journal of Big Data|language=en|volume=7|issue=1|pages=33|doi=10.1186/s40537-020-00308-7|issn=2196-1115|doi-access=free}}</ref>此外,情感分析也可以在视觉内容层面上进行,例如多模态情感分析(multimodal sentiment analysis)中对图像和视频进行分析。这方面的第一种方法是SentiBank。<ref name="Borth13"> | + | </ref> 另一方面,基于知识的系统利用公开可用的资源,提取与自然语言概念相关的语义和情感信息。该系统可以帮助执行情感常识推理。<ref name=":24">{{Cite journal|last1=Sasikala|first1=P.|last2=Mary Immaculate Sheela|first2=L.|date=December 2020|title=Sentiment analysis of online product reviews using DLMNN and future prediction of online product using IANFIS|journal=Journal of Big Data|language=en|volume=7|issue=1|pages=33|doi=10.1186/s40537-020-00308-7|issn=2196-1115|doi-access=free}}</ref>此外,情感分析也可以在视觉内容层面上进行,例如多模态情感分析multimodal sentiment analysis中对图像和视频进行分析。这方面的第一种方法是SentiBank。<ref name="Borth13"> |
| {{cite conference | | {{cite conference |
| | first1 = Damian | last1 = Borth | | | first1 = Damian | last1 = Borth |
第395行: |
第395行: |
| | url = https://visual-sentiment-ontology.appspot.com | | | url = https://visual-sentiment-ontology.appspot.com |
| }} | | }} |
− | </ref> SentiBank方法利用形容词-名词对来代表视觉内容的属性。另外,绝大多数的情感分类方法都依赖于词袋模型(bag-of-words model),它忽略上下文语境、语法甚至是语序。根据词语如何构成较长短语的意义来分析情感的方法显示出了更好的效果,<ref name=":25">{{Cite journal|last1=Socher|first1=Richard|last2=Perelygin|first2=Alex|last3=Wu|first3=Jean Y.|last4=Chuang|first4=Jason|last5=Manning|first5=Christopher D.|last6=Ng|first6=Andrew Y.|last7=Potts|first7=Christopher|date=2013|title=Recursive deep models for semantic compositionality over a sentiment treebank|journal=In Proceedings of EMNLP|pages=1631–1642|citeseerx=10.1.1.593.7427}}</ref> 但它们会也会导致产生额外的标识成本。 | + | </ref> SentiBank方法利用形容词-名词对来代表视觉内容的属性。另外,绝大多数的情感分类方法都依赖于词袋模型bag-of-words model,它忽略上下文语境、语法甚至是语序。根据词语如何构成较长短语的意义来分析情感的方法显示出了更好的效果,<ref name=":25">{{Cite journal|last1=Socher|first1=Richard|last2=Perelygin|first2=Alex|last3=Wu|first3=Jean Y.|last4=Chuang|first4=Jason|last5=Manning|first5=Christopher D.|last6=Ng|first6=Andrew Y.|last7=Potts|first7=Christopher|date=2013|title=Recursive deep models for semantic compositionality over a sentiment treebank|journal=In Proceedings of EMNLP|pages=1631–1642|citeseerx=10.1.1.593.7427}}</ref> 但它们会也会导致产生额外的标识成本。 |
| | | |
| | | |
| 在情感分析中,需要有人工分析的成分。因为自动化系统无法分析评论者个人的历史倾向,也无法分析平台的历史倾向,这往往导致对表达的情感的错误分类。自动化情感分类器通常能够识别大约23% 被人类正确分类的评论。<ref>{{cite web|title=Case Study: Advanced Sentiment Analysis|url=http://paragonpoll.com/sentiment-analysis-systems-case-study/|access-date=18 October 2013}}</ref>然而,人们往往不同意这种说法,并认为自动化情感分类器最终可以达到的与人类一致的判断上限。<ref>{{Cite journal|last1=Mozetič|first1=Igor|last2=Grčar|first2=Miha|last3=Smailović|first3=Jasmina|date=2016-05-05|title=Multilingual Twitter Sentiment Classification: The Role of Human Annotators|journal=PLOS ONE|volume=11|issue=5|pages=e0155036|doi=10.1371/journal.pone.0155036|issn=1932-6203|pmc=4858191|pmid=27149621|arxiv=1602.07563|bibcode=2016PLoSO..1155036M}}</ref> | | 在情感分析中,需要有人工分析的成分。因为自动化系统无法分析评论者个人的历史倾向,也无法分析平台的历史倾向,这往往导致对表达的情感的错误分类。自动化情感分类器通常能够识别大约23% 被人类正确分类的评论。<ref>{{cite web|title=Case Study: Advanced Sentiment Analysis|url=http://paragonpoll.com/sentiment-analysis-systems-case-study/|access-date=18 October 2013}}</ref>然而,人们往往不同意这种说法,并认为自动化情感分类器最终可以达到的与人类一致的判断上限。<ref>{{Cite journal|last1=Mozetič|first1=Igor|last2=Grčar|first2=Miha|last3=Smailović|first3=Jasmina|date=2016-05-05|title=Multilingual Twitter Sentiment Classification: The Role of Human Annotators|journal=PLOS ONE|volume=11|issue=5|pages=e0155036|doi=10.1371/journal.pone.0155036|issn=1932-6203|pmc=4858191|pmid=27149621|arxiv=1602.07563|bibcode=2016PLoSO..1155036M}}</ref> |
− |
| |
| | | |
| == 评估 == | | == 评估 == |