2024-02-24 简讯 : 谷歌Deepmind开源基于Gemini的Gemma


头条


谷歌Deepmind开源基于Gemini的Gemma

https://blog.google/technology/developers/gemma-open-models/
Google 发布了 Gemma 2B 和 7B 参数模型的权重,可通过 HuggingFace 获取。 这些模型是仅解码器的 Transformer,在 2T 和 6T Token 上进行训练。 它们在各种基准测试中都远远优于 Llama 2,并且有基础版本和指令调整版本。

斯坦福 发布 HELM 基准

https://crfm.stanford.edu/2024/02/18/helm-instruct.html
斯坦福大学的语言建模小组发布了一个广泛使用的基准,称为语言模型的整体评估(HELM)。 他们还发布了一个名为 HELM-Instruct 的指令版本。

Reddit 达成一项新的人工智能培训协议来销售用户内容

https://www.theverge.com/2024/2/17/24075670/reddit-ai-training-license-deal-user-content
Reddit 已与一家未具名的大型人工智能公司签订了每年价值约 6000 万美元的许可协议,允许该公司访问其大量用户生成的内容。


研究


Mistral 的 25 多个 LoRA 性能优于 GPT-4

https://predibase.com/blog/lora-land-fine-tuned-open-source-llms-that-outperform-gpt-4
Predibase 发布了 25 个狭窄的特定任务 LoRA,每个 LoRA 在特定任务上的性能均优于 GPT-4。 这些特定于任务的 LoRA 构建在 Mistral 7B 模型上。 这是支持本地模型在精确任务上表现出色的能力的另一个证据。

多模式LLM理解视觉数据的能力 (GitHub Repo)

https://github.com/unimodal4reasoning/chartvlm
ChartX 是一种新工具,用于测试多模态大语言模型 (MLLM) 使用可视化图表进行解释和推理的能力

结合无监督训练和监督微调 (GitHub Repo)

https://github.com/architsharma97/dpo-rlaif
该存储库挑战了训练中监督微调和强化学习相结合的有效性。 使用 GPT-4 等更高级的模型进行初始训练可以优于更复杂的两步方法。


工程


多模态对话数据集

https://ai.meta.com/datasets/mmcsg-dataset/
Meta 发布了 MMCSG 数据集,其中包含通过 Aria 眼镜记录的数千条双边对话,以鼓励对各种社交音频和视觉任务的研究。

MultiLora 推理服务器 (GitHub Repo)

https://github.com/predibase/lorax
Lorax 是一款推理服务器,支持将 LoRA 热插拔到单个基本模型上。 这意味着 RAM 的显着减少,同时支持各种模型调整。

评估游戏中的LLM (GitHub Repo)

https://github.com/jinhaoduan/gtbench
该项目引入了 GTBench,一个用于在各种游戏场景中测试 GPT-4 等 LLM 的平台,以发现其在策略推理方面的优势和劣势。 虽然这些模型在基于概率的游戏中显示出前景,但它们在确定性游戏中举步维艰,并且性能因设计和训练而异。


杂七杂八


多视图扩散++

https://mvdiffusion-plusplus.github.io/
扩散模型,可以生成对象的多个视图,然后将它们拼接在一起形成引人注目的 3D 版本。

为什么AI只会增加工作岗位而不是取代工作岗位的想法是一个谎言

https://donaldclarkplanb.blogspot.com/2024/02/this-is-why-idea-that-ai-will-just.html
人工智能将使部分劳动力实现自动化。 到目前为止,反应是双向的——这种效率是否意味着同样的人可以做更多的事情,还是更少的人做同样的任务? 本文探讨了技术对制造业和农业的影响与我们今天所看到的现代知识工作者的影响之间的比较。

多模式对话 (GitHub Repo)

https://github.com/sunsmarterjie/chatterbox
ChatterBox 是一种视觉语言模型,擅长多模态对话,特别是新建立的多模态多轮引用和基础任务。

苹果开发人工智能工具帮助开发者为应用程序编写代码

https://www.macrumors.com/2024/02/15/apple-xcode-ai-tool-for-coding/
Apple 正在开发 Xcode 的更新版本,其中将包含用于生成代码的 AI 工具。

AdGen AI (Product)

https://www.adgenai.com/
利用 AI 创建 100 多个高性能广告变体。

CrewAI

https://blog.replit.com/crew-ai
CrewAI 提供了一个库,用于构建和编排利用 LangChain 和 Replit 的 AI 代理。 它提供了包含代理、任务、工具和人员的模块化设置,以便轻松集成到各种项目中。 LangSmith 简化了调试,增强了对非确定性 LLM 调用的性能洞察。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容