Langchain/ChatGLM/SSE

介绍

🤖️ 一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

💡 受 GanymedeNil 的项目 document.ai 和 AlexZhangji 创建的 ChatGLM-6B Pull Request 启发,建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用 FastChat 接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型,依托于 langchain 框架支持通过基于 FastAPI 提供的 API 调用服务,或使用基于 Streamlit 的 WebUI 进行操作。

✅ 依托于本项目支持的开源 LLM 与 Embedding 模型,本项目可实现全部使用开源模型离线私有部署。与此同时,本项目也支持 OpenAI GPT API 的调用,并将在后续持续扩充对各类模型及模型 API 的接入。

⛓️ 本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k个 -> 匹配出的文本作为上下文和问题一起添加到 prompt中 -> 提交给 LLM生成回答。

实现原理:

SSE(Server Sent Event),直译为服务器发送事件,也就是服务器主动发送事件,客户端可以获取到服务器发送的事件。

1、SseEmitter类简介

SpringBoot 利用 SseEmitter 来支持SSE,并对SSE规范做了一些封装,使用起来非常简单。我们操作SseEmitter对象,关注消息文本即可。

SseEmitter类的几个方法:

send():发送数据,如果传入的是一个非SseEventBuilder对象,那么传递参数会被封装到 data 中。

complete():表示执行完毕,会断开连接。

onTimeout():连接超时时回调触发。

onCompletion():结束之后的回调触发。

onError():报错时的回调触发。


2.1 创建 SseServer

我们创建一个 SseServer来简单封装一下业务操作SSE的方法。

import org.springframework.web.servlet.mvc.method.annotation.SseEmitter;

/**

* SseServer业务封装类来操作SEE

*/

@Slf4j

public class SseServer {

    /**

    * 当前连接总数

    */

    private static AtomicInteger currentConnectTotal = new AtomicInteger(0);

    /**

    * messageId的 SseEmitter对象映射集

    */

    private static Map<String, SseEmitter> sseEmitterMap = new ConcurrentHashMap<>();

    /**

    * 创建sse连接

    *

    * @param messageId - 消息id(唯一)

    * @return

    */

    public static SseEmitter createConnect(String messageId) {

        /**

        * 设置连接超时时间。0表示不过期,默认是30秒,超过时间未完成会抛出异常

        */

        SseEmitter sseEmitter = new SseEmitter(0L);

        /*

        // 超时时间设置为3s,设置前端的重试时间为1s。重连时,注意总数的统计

        SseEmitter sseEmitter = new SseEmitter(3_000L);

        try {

            sseEmitter.send(

                    SseEmitter.event()

                    .reconnectTime(1000L)

                    //.data("前端重连成功") // 重连成功的提示信息

            );

        } catch (IOException e) {

            log.error("前端重连异常 ==> messageId={}, 异常信息:", messageId, e.getMessage());

            e.printStackTrace();

        }*/

        // 注册回调

        sseEmitter.onCompletion(completionCallBack(messageId));

        sseEmitter.onTimeout(timeOutCallBack(messageId));

        sseEmitter.onError(errorCallBack(messageId));

        sseEmitterMap.put(messageId, sseEmitter);

        //记录一下连接总数。数量+1

        int count = currentConnectTotal.incrementAndGet();

        log.info("创建sse连接成功 ==> 当前连接总数={}, messageId={}", count, messageId);

        return sseEmitter;

    }

    /**

    * 给指定 messageId发消息

    *

    * @param messageId - 消息id(唯一)

    * @param message  - 消息文本

    */

    public static void sendMessage(String messageId, String message) {

        if (sseEmitterMap.containsKey(messageId)) {

            try {

                sseEmitterMap.get(messageId).send(message);

            } catch (IOException e) {

                log.error("发送消息异常 ==> messageId={}, 异常信息:", messageId, e.getMessage());

                e.printStackTrace();

            }

        } else {

            throw new RuntimeException("连接不存在或者超时, messageId=" + messageId);

        }

    }

    /**

    * 给所有 messageId广播发送消息

    *

    * @param message

    */

    public static void batchAllSendMessage(String message) {

        sseEmitterMap.forEach((messageId, sseEmitter) -> {

            try {

                sseEmitter.send(message, MediaType.APPLICATION_JSON);

            } catch (IOException e) {

                log.error("广播发送消息异常 ==> messageId={}, 异常信息:", messageId, e.getMessage());

                removeMessageId(messageId);

            }

        });

    }

    /**

    * 给指定 messageId集合群发消息

    *

    * @param messageIds

    * @param message

    */

    public static void batchSendMessage(List<String> messageIds, String message) {

        if (CollectionUtils.isEmpty(messageIds)) {

            return;

        }

        // 去重

        messageIds = messageIds.stream().distinct().collect(Collectors.toList());

        messageIds.forEach(userId -> sendMessage(userId, message));

    }

    /**

    * 给指定组群发消息(即组播,我们让 messageId满足我们的组命名确定即可)

    *

    * @param groupId

    * @param message

    */

    public static void groupSendMessage(String groupId, String message) {

        if (MapUtils.isEmpty(sseEmitterMap)) {

            return;

        }

        sseEmitterMap.forEach((messageId, sseEmitter) -> {

            try {

                // 这里 groupId作为前缀

                if (messageId.startsWith(groupId)) {

                    sseEmitter.send(message, MediaType.APPLICATION_JSON);

                }

            } catch (IOException e) {

                log.error("组播发送消息异常 ==> groupId={}, 异常信息:", groupId, e.getMessage());

                removeMessageId(messageId);

            }

        });

    }

    /**

    * 移除 MessageId

    *

    * @param messageId

    */

    public static void removeMessageId(String messageId) {

        sseEmitterMap.remove(messageId);

        //数量-1

        currentConnectTotal.getAndDecrement();

        log.info("remove messageId={}", messageId);

    }

    /**

    * 获取所有的 MessageId集合

    *

    * @return

    */

    public static List<String> getMessageIds() {

        return new ArrayList<>(sseEmitterMap.keySet());

    }

    /**

    * 获取当前连接总数

    *

    * @return

    */

    public static int getConnectTotal() {

        return currentConnectTotal.intValue();

    }

    /**

    * 断开SSE连接时的回调

    *

    * @param messageId

    * @return

    */

    private static Runnable completionCallBack(String messageId) {

        return () -> {

            log.info("结束连接 ==> messageId={}", messageId);

            removeMessageId(messageId);

        };

    }

    /**

    * 连接超时时回调触发

    *

    * @param messageId

    * @return

    */

    private static Runnable timeOutCallBack(String messageId) {

        return () -> {

            log.info("连接超时 ==> messageId={}", messageId);

            removeMessageId(messageId);

        };

    }

    /**

    * 连接报错时回调触发。

    *

    * @param messageId

    * @return

    */

    private static Consumer<Throwable> errorCallBack(String messageId) {

        return throwable -> {

            log.error("连接异常 ==> messageId={}", messageId);

            removeMessageId(messageId);

        };

    }

}


@RestController

@CrossOrigin

@RequestMapping("/sse")

public class SseDemoController {

    /**

    * 用户SSE连接

    * 它返回一个SseEmitter实例,这时候连接就已经创建了.

    *

    * @return

    */

    @GetMapping("/userConnect")

    public SseEmitter connect() {

        /**

        * 一般取登录用户账号作为 messageId。分组的话需要约定 messageId的格式。

        * 这里模拟创建一个用户连接

        */

        String userId = "userId-" + RandomUtils.nextInt(1, 10);

        return SseServer.createConnect(userId);

    }

    /**

    * 模拟实例:下载进度条显示。 前端访问下载接口之前,先建立用户SSE连接,然后访问下载接口,服务端推送消息。

    * http://localhost:8080/sse/downLoad/userId-1

    *

    * @throws InterruptedException

    */

    @GetMapping("/downLoad/{userId}")

    public void pushOne(@PathVariable("userId") String userId) throws InterruptedException {

        for (int i = 0; i <= 100; i++) {

            if (i > 50 && i < 70) {

                Thread.sleep(500L);

            } else {

                Thread.sleep(100L);

            }

            System.out.println("sendMessage --> 消息=" + i);

            SseServer.sendMessage(userId, String.valueOf(i));

        }

        System.out.println("下载成功");

    }

    /**

    * 广播发送。http://localhost:8080/sse/pushAllUser

    *

    * @throws InterruptedException

    */

    @GetMapping("/pushAllUser")

    public void pushAllUser() throws InterruptedException {

        for (int i = 0; i <= 100; i++) {

            if (i > 50 && i < 70) {

                Thread.sleep(500L);

            } else {

                Thread.sleep(100L);

            }

            System.out.println("batchAllSendMessage --> 消息=" + i);

            SseServer.batchAllSendMessage(String.valueOf(i));

        }

    }

}



技术选型:

使用 FastChat 提供开源 LLM 模型的 API,以 OpenAI API 接口形式接入,提升 LLM 模型加载效果;

使用 langchain 中已有 Chain 的实现,便于后续接入不同类型 Chain,并将对 Agent 接入开展测试;

使用 FastAPI 提供 API 服务,全部接口可在 FastAPI 自动生成的 docs 中开展测试,且所有对话接口支持通过参数设置流式或非流式输出;

使用 Streamlit 提供 WebUI 服务,可选是否基于 API 服务启动 WebUI,增加会话管理,可以自定义会话主题并切换,且后续可支持不同形式输出内容的显示;

项目中默认 LLM 模型改为 THUDM/chatglm2-6b,默认 Embedding 模型改为 moka-ai/m3e-base,文件加载方式与文段划分方式也有调整,后续将重新实现上下文扩充,并增加可选设置;

项目中扩充了对不同类型向量库的支持,除支持 FAISS 向量库外,还提供 MilvusPGVector 向量库的接入;

项目中搜索引擎对话,除 Bing 搜索外,增加 DuckDuckGo 搜索选项,DuckDuckGo 搜索无需配置 API Key,在可访问国外服务环境下可直接使用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352

推荐阅读更多精彩内容