今天采集数据时候 偶然发现了一个问题,当采集的数据包含 emoji表情时,例如:😄,数据只保存了部分,存在缺失问题,最开始我怀疑的采集时正则匹配不到的问题,网上搜了一下,也没我要的答案,后来还是博学的碧老师给点出,这是utf8mb4编码。
关于这个编码 大概就是兼容utf-8比utf-8包含字符更多,而那些emoji表情utf-8中并没有编码,改一下表的编码和数据库连接编码,问题就这么解决了。
今天采集数据时候 偶然发现了一个问题,当采集的数据包含 emoji表情时,例如:😄,数据只保存了部分,存在缺失问题,最开始我怀疑的采集时正则匹配不到的问题,网上搜了一下,也没我要的答案,后来还是博学的碧老师给点出,这是utf8mb4编码。
关于这个编码 大概就是兼容utf-8比utf-8包含字符更多,而那些emoji表情utf-8中并没有编码,改一下表的编码和数据库连接编码,问题就这么解决了。