HumanEval: Hand-Written Evaluation Set 一个代码评测基准。 From 《Evaluating Large Language Models...
HumanEval: Hand-Written Evaluation Set 一个代码评测基准。 From 《Evaluating Large Language Models...
有一篇文章概述了先进的prompt工程技术:https://luxiangdong.com/2023/08/08/advprompt/[https://luxiangdong...
Prompt是什么 NLP发展的四个阶段(1)完全有监督机器学习:word本质是特征,主要在做特征工程(2)完全有监督深度学习:开始搞卷积和Attention(3)预训练:预...
OpenAI官方提供的Prompt技巧,给OpenAI的模型提供更清晰有效的指令。翻译 From : https://help.openai.com/en/articles/...
· 标题:OpenChat: Advancing Open-source Language Models with Mixed-Quality Data· 链接: https...
什么是持续集成 代码开发 -> 代码提交 -> 服务器编译、测试、打包 -> 服务器部署(大规模部署用 docker) 上面这套流程中除了前两个,其他的都自动执行,就是CI(...
分位数回归 Quantile Regression 先说一下线性回归 & 多项式回归:假定一个函数 f(x) ,让函数尽可能拟合训练数据,确定函数的未知参数。一般通过最小化M...
vLLM是什么 vllm是一个很快的且方便使用的库,可以用于LLM的推理和服务。 和huggingface无缝集成,可以直接下载加载hugging的模型 比huggingfa...
Executable Code Actions Elicit Better LLM Agentshttps://arxiv.org/pdf/2402.01030.pdf[ht...
Scalable agent alignment via reward modeling: a research direction https://arxiv.org/pd...
这篇文章揭示了ChatGPT Plugins背后的技术路线 来自微软的论文:TaskMatrix.AI: Completing Tasks by Connecting Fou...
仓库链接:https://github.com/allenai/RL4LMs[https://github.com/allenai/RL4LMs]论文链接:https://a...
简介 2022年11月,OpenAI推出了一款AI聊天机器人程序,其强大的问答能力瞬间引爆全网关注度。 组成部分:GPT3.5 + 大型语言模型(LLM) + 强化学习微调训...
推荐系统召回四模型之:全能的FM模型[https://zhuanlan.zhihu.com/p/58160982](1)从多路召回到FM做统一的召回模型,将所有特征划分为(U...
推荐系统经历两个阶段:传统推荐模型和深度学习模型 第一阶段:传统推荐模型(协同过滤,矩阵分解,LR, FM, FFM, GBDT)。 协同过滤体现了最朴素的推荐思想,同类相聚...
华为诺亚方舟实验室开源了一个贝叶斯优化+RL的仓库,里面包括几部分: 贝叶斯研究(1)HEBO:异方差进化贝叶斯优化 HEBO: Heteroscedastic Evolut...