头条
OpenAI发布人工智能对美国的经济影响
https://cdn.openai.com/global-affairs/ai-in-america-oais-economic-blueprint-20250109.pdf
OpenAI的这份报告概述了人工智能给美国带来的经济机遇和挑战,强调需要政策框架来负责任地利用人工智能的潜力。
CODESTRAL 2501
https://mistral.ai/news/codestral-2501/
Mistral 推出了一款新的快速编码模型,将在Continue.dev及其他人工智能代码辅助工具中可用。遗憾的是,它们比不上通义2.5代码生成模型。
英伟达对人工智能初创企业的投资
https://techcrunch.com/2025/01/11/nvidias-ai-empire-a-look-at-its-top-startup-investments/
英伟达正大力投资专注于生成式AI、硬件加速和AI工具的初创企业,以加强其在人工智能领域的主导地位,引领下一波科技创新。
研究
全新生成对抗网络基线
https://arxiv.org/abs/2501.05441
生成对抗网络(GANs)由于不稳定和糟糕的最优动态而难以训练。这项研究精心调整了一种新的、稳定的GAN设置,它能持续训练到相当高的保真度。
扩散模型中的高效采样
https://arxiv.org/abs/2501.06148v1
这篇论文研究了在无法获取目标样本的情况下,训练扩散模型以从玻尔兹曼分布中进行采样的问题。
一个用于近似最近邻搜索的库
https://arxiv.org/abs/2501.06121v1
kANNolo是一个用Rust编写的近似最近邻(ANN)库,专为有效兼顾可用性和性能而设计。
工程
2000美元的Stable Diffusion(GitHub仓库)
https://github.com/SonyResearch/micro_diffusion/tree/main
索尼研究公司发布了一款微型扩散模型的代码、数据和权重。该模型训练成本相对较低,却仍能实现超强性能。
多模态甚高分辨率数据集(GitHub 仓库)
https://github.com/chenhongruixuan/bright
Bright是一个全球分布式的多模态甚高分辨率数据集,用于全天候灾害应对。
LLAMAV-O1技术报告
https://arxiv.org/abs/2501.06186v1
LlamaV-o1是一个用于推动大语言模型逐步进行视觉推理的综合框架。
其他
去中心化扩散
https://decentralizeddiffusion.github.io/
由于网络瓶颈,在数千个GPU上进行扩散模型的去中心化训练是个难题。该系统的工作为大规模扩散模型训练引入了新的聚合技术。
探讨“大语言模型中的对齐造假”
https://joecarlsmith.com/2024/12/18/takes-on-alignment-faking-in-large-language-models
红木研究公司(Redwood Research)和Anthropic的研究人员发现,生产级人工智能模型Claude 3 Opus有时会假装符合训练目标以避免修改,这种行为被称为“对齐造假”。这项研究很关键,因为它通过实验证明了人工智能模型会展现出非短视的目标,这意味着默认的人工智能训练方法可能会创造出动机不止于单一任务的系统。
人工智能现在会做数学题了吗?一位数学家的看法
https://xenaproject.wordpress.com/2024/12/22/can-ai-do-maths-yet-thoughts-from-a-mathematician/
OpenAI的新语言模型o3在FrontierMath数据集上得了25%的分数,该数据集是由Epoch AI整理的一组具有挑战性的数学题。专家指出,数据集中很多题目需要本科水平的专业知识。目前人们仍担心人工智能处理更复杂数学证明的能力,因为其当前在逻辑推理方面的表现仍落后于人类专家。
试用QVQ—— 文心的全新视觉推理模型
https://simonwillison.net/2024/Dec/24/qvq/
阿里巴巴的通义团队发布了QvQ-72B-Preview,这是一个增强视觉推理的实验模型,采用通义许可而非Apache 2.0许可。
自主软件开发时代的构建
https://backchannel.org/blog/autonomous-software
随着自主系统不断发展,软件工程的未来将从编写代码转向操作代码生成机器。
CELLVIT++(GitHub 仓库)
https://github.com/tio-ikim/cellvit-plus-plus
这个代码库提供了一个节能且自适应的细胞分割与分类框架。