用chatterbot从零开始搭建一个聊天机器人(一)

简介

  • chatterbot是一个python的第三方库,可以构建一个任何语言的问答机器人。

安装

pip install chatterbot
pip install chatterbot-corpus

原理

  • chatterbot是以搜索匹配的方式来找寻训练库中最接近的回答;
  • 它不会进行分词,因此支持任何语言的训练;
  • 由于它会全库扫描一便以寻求最佳答案,训练库越多他的效率就越慢,只适合单一领域的简单应答;
  • 训练库会保留每一次的输入和回答记录,因此可以在使用的过程中进行学习。

训练

  • ChatterBot包含一些工具,可以帮助简化训练聊天机器人实例的过程。
  • ChatterBot的训练过程包括将示例对话框加载到聊天机器人的数据库中。
  • 这将创建或构建表示已知语句和响应集的图形数据结构。
  • 当向聊天机器人训练器提供数据集时,它将在聊天机器人的知识图中创建必要的条目,以便正确表示语句输入和响应。
  • 通过列表数据进行训练
from chatbot import chatbot
from chatterbot.trainers import ListTrainer

chatbot = ChatBot('Training Example')
trainer = ListTrainer(chatbot)

trainer.train([
    "Hi there!",
    "Hello",
])

trainer.train([
    "Greetings!",
    "Hello",
])
  • 通过语料库进行训练
from chatbot import chatbot
from chatterbot.trainers import ChatterBotCorpusTrainer

chatbot = ChatBot('Training Example')
trainer = ChatterBotCorpusTrainer(chatbot)

trainer.train(
    "chatterbot.corpus.english"
)
  • 通过文件进行训练
from chatbot import chatbot
from chatterbot.trainers import ChatterBotCorpusTrainer

chatbot = ChatBot('Training Example')
trainer = ChatterBotCorpusTrainer(chatbot)

trainer.train(
    "./data/greetings_corpus/custom.corpus.json",
    "./data/my_corpus/"
)

组成

1、预处理:

  • 删除任何连续的空白字符。
chatterbot.preprocessors.clean_whitespace(statement)
  • 去除html标签
chatterbot.preprocessors.unescape_html(statement)
  • 将unicode字符转换为的ASCII
chatterbot.preprocessors.convert_to_ascii(statement)

2、逻辑适配器

  • Best Match Adapter--最佳匹配适配器:
    最佳匹配适配器使用一个函数来将输入语句与已知语句进行比较。一旦找到与输入语句最接近的匹配,它就使用另一个函数来选择对该语句的已知响应之一。
chatbot = ChatBot(
    "My ChatterBot",
    logic_adapters=[
        {
            "import_path": "chatterbot.logic.BestMatch",
            "statement_comparison_function": chatterbot.comparisons.levenshtein_distance,
            "response_selection_method": chatterbot.response_selection.get_first_response
        }
    ]
)
  • Time Logic Adapter--时间逻辑适配器:
    没啥用,就只能返回当前时间
User: What time is it?
Bot: The current time is 4:45PM.
  • Mathematical Evaluation Adapter--数学评价适配器:
    解析输入,以确定用户是否在提出需要进行数学运算的问题。如果是,则从输入中提取方程并返回计算结果。简单来说,就是实现计算器的功能。
User: What is four plus four?
Bot: (4 + 4) = 8
  • Specific Response Adapter--特定响应适配器:
    如果聊天机器人接收到的输入与为该适配器指定的输入文本匹配,则将返回指定的响应。
from chatterbot import ChatBot

# Create a new instance of a ChatBot
bot = ChatBot(
    'Exact Response Example Bot',
    storage_adapter='chatterbot.storage.SQLStorageAdapter',
    logic_adapters=[
        {
            'import_path': 'chatterbot.logic.BestMatch'
        },
        {
            'import_path': 'chatterbot.logic.SpecificResponseAdapter',
            'input_text': 'Help me!',
            'output_text': 'Ok, here is a link: http://chatterbot.rtfd.org'
        }
    ]
)

# Get a response given the specific input
response = bot.get_response('Help me!')
print(response)

3、存储适配器

  • SQL Storage Adapter--SQL存储适配器:
    支持的任何数据库中存储会话数据。
    所有参数都是可选的,默认使用sqlite数据库。
    它将检查是否有表,如果没有,它将尝试创建所需的表。
from chatterbot import ChatBot

# Uncomment the following lines to enable verbose logging
# import logging
# logging.basicConfig(level=logging.INFO)

# Create a new instance of a ChatBot
bot = ChatBot(
    'SQLMemoryTerminal',
    storage_adapter='chatterbot.storage.SQLStorageAdapter',
    database_uri=None,
    logic_adapters=[
        'chatterbot.logic.MathematicalEvaluation',
        'chatterbot.logic.TimeLogicAdapter',
        'chatterbot.logic.BestMatch'
    ]
)

# Get a few responses from the bot

bot.get_response('What time is it?')

bot.get_response('What is 7 plus 7?')
  • MongoDB Storage Adapter--MongoDB存储适配器:
    允许ChatterBot在MongoDB数据库中存储语句的接口。
from chatterbot import ChatBot

# Uncomment the following lines to enable verbose logging
# import logging
# logging.basicConfig(level=logging.INFO)

# Create a new ChatBot instance
bot = ChatBot(
    'Terminal',
    storage_adapter='chatterbot.storage.MongoDatabaseAdapter',
    logic_adapters=[
        'chatterbot.logic.BestMatch'
    ],
    database_uri='mongodb://localhost:27017/chatterbot-database'
)

print('Type something to begin...')

while True:
    try:
        user_input = input()

        bot_response = bot.get_response(user_input)

        print(bot_response)

    # Press ctrl-c or ctrl-d on the keyboard to exit
    except (KeyboardInterrupt, EOFError, SystemExit):
        break

4、过滤器

  • 过滤器是创建可以传递到ChatterBot的存储适配器的查询的有效方法。过滤器将减少聊天机器人在选择响应时必须处理的语句数量。
chatbot = ChatBot(
    "My ChatterBot",
    filters=[filters.get_recent_repeated_responses]
)

常用配置

  • read_only=True:禁用学习它收到的每个新输入语句,默认会自动学习。
  • get_default_response():当逻辑适配器无法生成任何其他有意义的响应时,将调用此方法。
  • maximum_similarity_threshold:可以设置最大置信度,达到该置信度将不再匹配其他内容,默认0.95
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,627评论 6 517
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 95,180评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 169,346评论 0 362
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,097评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,100评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,696评论 1 312
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,165评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,108评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,646评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,709评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,861评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,527评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,196评论 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,698评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,804评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,287评论 3 379
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,860评论 2 361

推荐阅读更多精彩内容

  • 个人最大的问题,没有长期固定一个主要目标!总是在修补小问题持续没有抓住最主要的问题,总是苍蝇模式到处乱飞不是蜜蜂模...
    挑灯夜战阅读 316评论 0 0
  • 亲爱的天天、安安: 今天是感恩节。 下午,爸爸妈妈参加了安安幼儿园的感恩节活动,看小朋友们表演节目;小朋友们给爸爸...
    猫爸带娃阅读 187评论 0 0
  • 蔷薇花开了,蔷薇花谢了,榴花也含苞待放了,亲爱的你,何时能回来与我共煮茶温酒呢…… 蔷薇花谢榴始芬,绵绵阴...
    游游侠阅读 654评论 5 16
  • 昨天上午办完事,已经是中午了,拐进超市买了一堆东西,要了一个大大的塑料袋装着,鼓鼓囊囊的满满一大包,吃力地提着,顶...
    伊说初心阅读 573评论 8 13
  • 如果命运是一条孤独的河流,谁会是你灵魂的摆渡人? 给大家讲一个故事:15岁的单亲女孩迪伦,从小与母亲生活在一起。但...
    凌西西阅读 928评论 0 15