2024-12-09 简讯 : OpenAI o1 Card


头条


OpenAI o1 Card

https://openai.com/index/openai-o1-system-card/

本报告概述了在发布 OpenAI o1 和 o1-mini 之前开展的安全工作,包括根据 OpenAI 的准备框架进行的外部红队和前沿风险评估。

Perplexity 扩大其出版商计划

https://www.perplexity.ai/hub/blog/perplexity-expands-publisher-program-with-15-new-media-partners

Perplexity 已将十多个国际新闻组织添加到其出版商计划中,提供工具、收益分享和支持,以加强与全球媒体的合作。

DeepMind 的 Genie 2 可以生成看起来像视频游戏的交互式世界

https://techcrunch.com/2024/12/04/deepminds-genie-2-can-generate-interactive-worlds-that-look-like-video-games/

DeepMind 的 Genie 2 是一种先进的 AI 模型,可以根据图像和文本描述生成多样化的交互式 3D 世界。该模型特别擅长模拟物理和 NPC 行为等复杂元素,通过保持场景一致性使其有别于类似模型。Genie 2 定位为研究工具,旨在为交互式体验制作原型并评估 AI 代理。


研究


Paligemma 2

https://arxiv.org/abs/2412.03555

Paligemma 2 是目前市场上最好的 VLM 之一。它使用 SigLIP 和 Gemma。

使用 ASANet 进行土地覆盖制图

https://arxiv.org/abs/2412.02044v1

非对称语义对齐网络 (ASANet) 使用 SAR 和 RGB 图像改进土地覆盖分类。

使用标记合并实现更快的多模态模型

https://arxiv.org/abs/2412.03248v1

研究人员开发了一种无需训练的方法,可以在不牺牲太多性能的情况下提高多模态语言模型 (LLM) 的效率。他们的方法通过智能合并和修剪视觉数据标记,将计算需求减少了多达 7 倍。


工程


GraphCast

https://github.com/google-deepmind/graphcast

DeepMind 已开源其 GraphCast 算法,该算法在 36 小时内的局部天气预报方面表现更好、更快。而且运行时间也只是一小部分。

创造视觉错觉

https://github.com/pixtella/anagram-mtl

该项目通过改进扩散模型处理多个视点的方式,推进了视觉字谜生成(翻转或旋转时外观发生变化的图像)。

自动驾驶汽车的 3D 场景完成

https://github.com/happyw1nd/scorelidar

ScoreLiDAR 是一种新方法,可加快自动驾驶汽车的 3D LiDAR 场景完成速度。


杂七杂八


新的 Fish Audio 模型

https://threadreaderapp.com/thread/1864370933496205728.html

最新的 Fish Audio 1.5 目前在文本转语音排行榜上仅次于 ElevenLabs,排名第二。它支持语音克隆,运行速度很快,尽管输出质量似乎时好时坏。

OpenAI 与 Anduril 合作

https://www.cnbc.com/2024/12/04/openai-partners-with-defense-company-anduril.html

OpenAI 和国防公司 Anduril 合作创建基于国家安全的人工智能。

谷歌病毒式 NotebookLM 背后的关键领导者将离职,创建自己的初创公司

https://techcrunch.com/2024/12/04/key-leaders-behind-googles-viral-notebooklm-are-leaving-to-create-their-own-startup/

谷歌 NotebookLM 的三位关键成员已离职,开始创办一家新的隐形 AI 企业。这家初创公司旨在利用最新的 AI 模型来创建面向消费者、以用户为先的 AI 产品。它仍处于早期阶段,没有明确的重点或宣布的资金。

DeepThought 8B 推理模型

https://huggingface.co/ruliad/deepthought-8b-llama-v0.01-alpha

Ruliad 发布了一款小型推理模型,需要额外的时间来思考问题。

GUI 代理

https://vyokky.github.io/LLM-Brained-GUI-Agents-Survey/

关于大型语言模型大脑 GUI 代理的研究论文和项目集。

Sam Altman 称通用人工智能即将到来

https://www.nytimes.com/video/business/100000009858580/sam-altman-openai-dealbook.html

OpenAI 首席执行官 Sam Altman 在 DealBook 峰会上表示,通用人工智能对日常生活的影响可能没有预期的那么大。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,194评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,058评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,780评论 0 346
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,388评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,430评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,764评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,907评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,679评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,122评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,459评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,605评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,270评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,867评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,734评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,961评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,297评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,472评论 2 348

推荐阅读更多精彩内容