//需要过滤的字库
let filterWordsArr = '广告|下载|邀请|邀请码';
//切割字库成数组
filterWordsArr = filterWordsArr .slice(1, filterWordsArr.length - 1).split('|');
let filterWords = {};
//处理字符串,将字符串切割使用对象递归嵌套存储
function dealWords(wordObj, insertString) {
if (insertString && insertString.length > 0) {
//获取第一个字符
let firstWord = insertString[0].toLocaleLowerCase();
//获取剩余字符
let remainStr = insertString.slice(1, insertString.length);
if (!wordObj[firstWord]) {
wordObj[firstWord] = {};
}
if (remainStr.length > 0) {
wordObj[firstWord] = dealWords(wordObj[firstWord], remainStr);
}
else {
wordObj[firstWord].isEnd = true;
}
return wordObj;
}
return wordObj;
}
filterWordsArr.forEach((e) => {
dealWords(filterWords, e);
});
/**
* 提取字符串里面符合规则的文字,并返回数组,都不符合会返回空数组
*/
function checkStr(str) {
let result = [];
let stack = [];
let rule = filterWords;
//状态,true表面传入字符串符合规则
for (let i = 0; i < str.length; i++) {
let ch = str.charAt(i).toLocaleLowerCase();
let item = rule[ch];
if (!item) {
i = i - stack.length;
stack = [];
rule = filterWords;
}
else if (item.isEnd) {
stack.push(ch);
result.push(stack.join(""));
stack = [];
rule = filterWords;
}
else {
stack.push(ch);
rule = item;
}
}
return result;
}
/**
*
* @param str //要替换的字符串
* @param replaceWords //替换成的字符
*/
function getReplaceWord(str, replaceWords) {
let replaceStr = '';
for (let i = 0; i < str.length; i++) {
replaceStr += replaceWords;
}
return replaceStr;
}
/**
* 将符合过滤规则的字符替换成*号
* @param str //传入要过滤的字符串
* 如 filterStr('我的邀请码') =》 返回 "我的**码"
*/
function filterStr(str) {
str = str.toLocaleLowerCase();
let replaceWord = '*';
let filterWordList = checkStr(str);
if (filterWordList && filterWordList.length > 0) {
filterWordList.forEach(e => {
let replaceWords = getReplaceWord(e, replaceWord);
str = str.replace(e, replaceWords);
});
}
return str;
}
采用DFA算法实现字库屏蔽规则
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 环境 python版本:3.5 数据来源 数据来自51CTO网站的分享,点此下载 关联规则 所谓关联规则,就是指现...
- 简言 用正则表达式做用户密码强度的通过性判定,过于简单粗暴,不但用户体验差,而且用户帐号安全性也差。那么如何准确评...
- SensitiveWords 基于DFA算法用golang实现了一个敏感词、违禁词插件,可以直接集成到项目...