更改

跳到导航 跳到搜索
删除197字节 、 2021年8月25日 (三) 14:55
无编辑摘要
第109行: 第109行:  
  | citeseerx = 10.1.1.84.9735
 
  | citeseerx = 10.1.1.84.9735
 
}}
 
}}
</ref> 等特定分类器。原则上由两种方法可以进行中性分类。一是,算法首先识别出中性分类后将其过滤,再根据正面和负面的情感二分类对其他内容进行评估。二是,一步构建包含中性、正面和负面三种类别的分类。<ref>{{Cite journal|last1=Ribeiro|first1=Filipe Nunes|last2=Araujo|first2=Matheus|date=2010|title=A Benchmark Comparison of State-of-the-Practice Sentiment Analysis Methods|url=https://www.researchgate.net/publication/286302059|journal=Transactions on Embedded Computing Systems |volume=9 |issue=4}}</ref>  第二种方法通常会涉及到估计所有类别的概率分布(比如[[Nltk|NLTK]]实现的naive Bayes分类器)。是否以及如何使用中性分类取决于数据的性质:如果数据被清晰地分类为中性、正面和负面的语言,那么过滤掉中性语言并关注正面和负面情感的极性是有意义的。相比之下,如果数据大部分是中性的,对正面和负面影响的偏差很小,这种策略就会使其更难明确区分两极。
+
</ref> 等特定分类器。原则上由两种方法可以进行中性分类。一是,算法首先识别出中性分类后将其过滤,再根据正面和负面的情感二分类对其他内容进行评估。二是,一步构建包含中性、正面和负面三种类别的分类。<ref>{{Cite journal|last1=Ribeiro|first1=Filipe Nunes|last2=Araujo|first2=Matheus|date=2010|title=A Benchmark Comparison of State-of-the-Practice Sentiment Analysis Methods|url=https://www.researchgate.net/publication/286302059|journal=Transactions on Embedded Computing Systems |volume=9 |issue=4}}</ref>  第二种方法通常会涉及到估计所有类别的概率分布(比如NLTK实现的naive Bayes分类器)。是否以及如何使用中性分类取决于数据的性质:如果数据被清晰地分类为中性、正面和负面的语言,那么过滤掉中性语言并关注正面和负面情感的极性是有意义的。相比之下,如果数据大部分是中性的,对正面和负面影响的偏差很小,这种策略就会使其更难明确区分两极。
      第444行: 第444行:     
== Web 2.0 ==
 
== Web 2.0 ==
{{See also|Reputation management|web 2.0|web mining}}
  −
参阅:声誉管理(Reputation management)、web 2.0和web数据挖掘(web mining)
  −
      
博客和社交网络等社交媒体的兴起激发了人们对情感分析的兴趣。随着评论、评级、推荐和其他形式的网络在线表达的激增,网络在线评论语料已经变成了一种虚拟货币,企业可以借此来推销自己的产品、寻找新的机会和管理自己的声誉。随着企业寻求将过滤噪音、理解对话、识别相关内容并采取适当行动的过程的自动化程度加深,许多企业将目光投向了情感分析领域。<ref name="Mining the Web for Feelings, Not Facts">Wright, Alex. [https://www.nytimes.com/2009/08/24/technology/internet/24emotion.html?_r=1 "Mining the Web for Feelings, Not Facts"], ''New York Times'', 2009-08-23. Retrieved on 2009-10-01.</ref>使问题进一步复杂化的是匿名社交媒体平台的崛起,如4chan和Reddit。<ref name=":33">{{cite web|title=Sentiment Analysis on Reddit|url=http://news.humanele.com/sentiment-analysis-reddit/|access-date=10 October 2014|date=2014-09-30}}</ref>如果说web 2.0完全是关于民主化发布,那么web的下一个阶段很可能是基于对所有正在发布的内容的民主化数据挖掘。<ref name="The Future of Social Media Monitoring">Kirkpatrick, Marshall. [https://readwrite.com/2009/04/15/whats_next_in_social_media_monitoring/ "], ''ReadWriteWeb'', 2009-04-15. Retrieved on 2009-10-01.</ref>
 
博客和社交网络等社交媒体的兴起激发了人们对情感分析的兴趣。随着评论、评级、推荐和其他形式的网络在线表达的激增,网络在线评论语料已经变成了一种虚拟货币,企业可以借此来推销自己的产品、寻找新的机会和管理自己的声誉。随着企业寻求将过滤噪音、理解对话、识别相关内容并采取适当行动的过程的自动化程度加深,许多企业将目光投向了情感分析领域。<ref name="Mining the Web for Feelings, Not Facts">Wright, Alex. [https://www.nytimes.com/2009/08/24/technology/internet/24emotion.html?_r=1 "Mining the Web for Feelings, Not Facts"], ''New York Times'', 2009-08-23. Retrieved on 2009-10-01.</ref>使问题进一步复杂化的是匿名社交媒体平台的崛起,如4chan和Reddit。<ref name=":33">{{cite web|title=Sentiment Analysis on Reddit|url=http://news.humanele.com/sentiment-analysis-reddit/|access-date=10 October 2014|date=2014-09-30}}</ref>如果说web 2.0完全是关于民主化发布,那么web的下一个阶段很可能是基于对所有正在发布的内容的民主化数据挖掘。<ref name="The Future of Social Media Monitoring">Kirkpatrick, Marshall. [https://readwrite.com/2009/04/15/whats_next_in_social_media_monitoring/ "], ''ReadWriteWeb'', 2009-04-15. Retrieved on 2009-10-01.</ref>
第461行: 第458行:     
== 推荐系统中的应用 ==
 
== 推荐系统中的应用 ==
{{See also|Recommender system}}
  −
     −
对于一个推荐系统来说,情感分析已经被证明是一种有价值的技术。推荐系统的目的是预测目标用户对某个项目的偏好。<u>'''主流推荐系统是基于显性数据集工作的。例如,协同过滤(collaborative filtering)基于评分矩阵工作,基于内容的过滤(content-based filtering)基于项目元数据工作。'''</u>
+
对于一个推荐系统来说,情感分析已经被证明是一种有价值的技术。推荐系统的目的是预测目标用户对某个项目的偏好。'''主流推荐系统是基于显性数据集工作的。例如,协同过滤(collaborative filtering)基于评分矩阵工作,基于内容的过滤(content-based filtering)基于项目元数据工作。'''
     
1,068

个编辑

导航菜单