如何做文本情感分析

情感分析也称为意见挖掘,是自然语言处理(NLP)中的一个领域,它试图在文本中识别和提取意见

除了提取意见,还可以提取:

态度:发言者是表达了积极还是消极的意见

主题:正在谈论的事情

意见持有人:表达意见的实体

有很多实际应用场景,例如:

社交媒体监控 品牌监控 客户之声(VoC) 客户服务 员工分析 产品分析 市场研究与分析

实现情感分析的方法有很多种,可分为:

基于规则的,手动制定一些规则来执行情绪分析。

自动系统,依靠机器学习技术从数据中进行学习。

混合系统,结合了基于规则和自动的方法。

基于规则的: 这时需要定义一组规则,用于识别态度,意见主体等。

例如可以这样做:

1. 定义两个态度极性的词列表(例如,诸如差,最差,丑陋等负面词,和好,最佳,美丽等正面词)。

2. 给一个文本 计算文本中出现的正面词数。 计算文本中出现的否定词数。

3. 如果正面词出现的数量大于负面单词出现的数量,则返回正面情绪,相反,返回负面情绪。否则,返回中立。

当然这个方法非常非常简单,没有考虑单词如何在一个序列中组合的

自动方法 这种主要是依赖于机器学习技术。

情绪分析任务通常被建模为分类问题,可以使用 Naïve Bayes, Logistic Regression, Support Vector Machines, Neural Networks 等算法。

Naïve Bayes:使用贝叶斯定理来预测文本的类别。

Logistic Regression:非常着名的算法,给定一组特征(X)的情况下预测值(Y)。

Support Vector Machines::非概率模型,将文本看作多维空间中的点,被映射到空间的不同区域作为不同的类别。

Neural Networks:用 RNN 等神经网络来处理 之前写过一篇简单的 怎样做情感分析 ***/p/1909031bb1f2

我是不会停的蜗牛 Alice

欢迎关注我

版权声明:本文来自用户投稿,不代表【青檬情感】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:shiyucn@qq.com)我们将及时处理,共同维护良好的网络创作环境。

发表评论

登录后才能评论

评论列表(0条)

    联系我们

    在线咨询: QQ交谈

    邮件:shiyucn@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息