240 发简信
IP属地:上海
  • 大模型应用的一些tips

    找重要的事件 比如给定一个主题,我们取召回素材,然后把素材给到大模型,在prompt里面让他挑选重要的事件,并总结。 效果上看,一般都会做的比较泛泛。总结的内容可能也包含多个...

  • coze搭建过程中的一些问题

    tool工具的使用 当前只设定一个工作流,回答上市公司的问题,使用kimi模型,在agent 人设上要求所有问题使用工作流工具。 效果一般,agent第一步就是选择工具,比如...

  • 向量召回是不是很容易被误用?

    向量召回的先决条件 你的query 比较明确,越具体越好。 如果是比较泛的问题,比如 xxx公司怎么样? 无论如何都不好召回。 这个时候需要好的改写,将问题具体话,比如 从主...

  • mysql8 迁移目录坑

    步骤 cp /var/lib/mysql 到新的目录 设置 mysql:mysql owner 设置 conf配置,看起来都ok。 service restart 就是起不来...

  • qwen14b 转int8量化

    转化成int8的模型 AutoGPTQ的方式量化:https://github.com/QwenLM/Qwen/issues/464[https://github.com/Q...

  • 120
    AIGC做自媒体成神之路

    工具篇 尝试各类文本生成的工具,从https://www.waytoagi.com/[https://www.waytoagi.com/]开始。 尝试了阿里妈妈的营销文本,选...

  • Autogen的一些思考point

    Autogent:1,适合将各个agent 拆分,组合和调用,主要在规划层面。 实际上做的事情,类似与autogpt调用各个agent,未来可能有非常多的大量agent之后,...

  • RAG 不同方案的记录

    最新的论文或者必看榜单 2023-RAG-非常全面: Retrieval-Augmented Generation for Large Language Models: A ...

  • 用Lucene做有限集合的NER识别

    背景 比如我们有比较确定的几十类实体,并且每一类实体的值都是已知的,也就是在一个有限集合类做NER实体识别。 基于lucene的召回 把实体做成字典,比如 公司名,公司简称 ...

  • LLM 幻觉评测工具

    幻觉评测工具 factool https://github.com/GAIR-NLP/factool/issues[https://github.com/GAIR-NLP/f...

  • 120
    国内大模型API的价格

    参考标准 gpt4 作为目前公开的天花板,gpt4的价格可以作为一个参考 1000token应该是英文,输入token 0.03刀,也就是10K 一万token=0.3刀=2...

  • 120
    chatpdf类应用的新方案

    现有方案 基本都是搜索的路子,将doc 中所有的文本进行向量化,然后query,将query 做成向量,然后用相似性算法去召回段落来回答问题。现有方案的缺点: 缺失了很多文档...

  • 120
    bge embedding模型原理

    持续迭代的嵌入模型 论文: C-Pack: Packaged Resources To Advance General Chinese Embedding 测试效果看,比m3...

  • 120
    大语言模型测试数据集持续更新

    1、中文数据集 AGIEval AGIEval:https://github.com/ruixiangcui/AGIEval[https://github.com/ruixi...

  • 向量召回如何进行模仿

    典型的场景 比如我想模仿一篇报告的风格,比如第一段写 对一个公司的历史进程。 推理或者问答的方式 写公司的进程,可以要写公司创立的时间,经历过哪些阶段,每个阶段有什么重大事件...

  • AIGC 幻觉解决的一些思路

    投票 比如对于同一个生成的文本,生成3次,然后自己写一个prompt,写明评测的要点,然后让gpt 选择一个最好的答案。3次生产的概率中挑选一个最好的,整体质量会有一个提升,...

  • 使用向量召回的一些经验

    你的query是什么,你召回的就是什么? 我们使用的是openai的embedding 模型,对 query 和 目标document 做向量化,然后查找与query 向量距...

个人介绍
金融圈,互联网圈,币圈 ,折腾了一圈