python emoji 表情处理过滤

emoji库安装 直接pip install emoji 源数据:(数据是瞎编的哈…

emoji库安装
直接pip install emoji

源数据:(数据是瞎编的哈)

emoji库主要有两个函数:
emojize()——>生成emoji表情
demojize()——>emoji表情解码

处理
我的目的是把emoji表情剃掉,所以还需要用到re库,re就不详细叙述了。# 导入库

结果
源文件

记录:face_with_tears_of_joy:
嗯嗯

组长:party_popper::party_popper::party_popper:
来吧
回收:face_with_tears_of_joy:
大家记得哈:face_with_tears_of_joy:

你坐哪呢?

处理后

记录
嗯嗯

组长
来吧
回收
大家记得哈

你坐哪呢?

注意替换的这些emoji是标准的表情字符,每个表情本来是2个字节,替换成字符串后,每个表情就变成12个字符了,浪费了很多空间,不过简单,不需要专门写个map一一对应了;

把表情变成字符串
view plain copy

把字符串变成表情

[python] view plain copy

————————————————
版权声明:本文为CSDN博主「junli_chen」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/junli_chen/article/details/77685128

本文来自网络,不代表软粉网立场,转载请注明出处:https://www.rfff.net/p/4158.html

作者: HUI

发表评论

您的电子邮箱地址不会被公开。

返回顶部