头条
Meta 的开放式 AI 硬件愿景
https://engineering.fb.com/2024/10/15/data-infrastructure/metas-open-ai-hardware-vision/
Meta 在 OCP 全球峰会上展示了开放式 AI 硬件设计,包括 Catalina 机架和扩展的 Grand Teton 平台。训练 Llama 3.1 405B 模型需要 16,000 个 NVIDIA H100 GPU,这凸显了 Meta 的可扩展基础设施。开放式 AI 硬件系统是继续推进 AI 能力所必需的。
纽约时报警告人工智能搜索引擎 Perplexity 停止使用其内容
纽约时报已向人工智能初创公司 Perplexity 发出停止令,指控其未经许可使用其内容进行人工智能搜索操作。Perplexity 声称它不会抓取内容进行训练,而是索引网页以显示事实内容。该公司正在与出版商接洽,并旨在通过与《纽约时报》和其他媒体合作来解决这一问题。
Decagon 筹集 6500 万美元 B 轮融资
https://decagon.ai/blog/series-b
Decagon 已筹集 6500 万美元 B 轮融资,以增强其 AI 客户支持代理,这些代理已被 Duolingo 和 Eventbrite 等公司用于有效管理客户互动。其 AI 代理可自动执行重复性任务,使客户支持团队能够专注于更高价值的角色。这笔资金将增强 Decagon 的工程团队,并将其 AI 解决方案扩展到新的市场和垂直领域。
研究
线性化 LLM
https://hazyresearch.stanford.edu/blog/2024-10-14-lolcats-p2
Hazy research 的另一篇精彩文章探讨了如何在不牺牲太多性能的情况下线性化现有语言模型
具有样式一致性的场景文本编辑
https://arxiv.org/abs/2410.10133v1
TextCtrl 是一种新的基于扩散的方法,可通过保持内容准确性和样式保留来改进场景文本编辑。
具有增强 3D 视觉运动技能的人形机器人
https://arxiv.org/abs/2410.10803v1
iDP3 是一种改进的 3D 视觉运动策略,允许人形机器人在各种现实环境中自主操作。
工程
Tabled
https://github.com/VikParuchuri/tabled
用于检测和提取 PDF 表格的先进系统。
增强的图像生成效率
https://hanlab.mit.edu/projects/hart
HART 是一种新的视觉生成模型,可创建高质量的 1024x1024 图像,挑战扩散模型的能力。它通过使用结合离散和连续标记的混合标记器来改进图像重建并降低训练成本。
具有增强注意力机制的新型视觉转换器
https://github.com/maclong01/DeBiFormer
可变形双层路由注意力 (DBRA) 模块是为了改进视觉转换器中的注意力机制而开发的。基于 DBRA 构建的 DeBiFormer 优化了键值对的选择,并提高了注意力图中查询的可解释性。
杂七杂八
全新高质量 AI 视频生成器 Pyramid Flow 发布
Pyramid Flow 是一款全新的开源 AI 视频生成器,它使用金字塔流匹配技术创建高质量视频,从而优化计算效率。它与 Runway Gen-3 Alpha 等专有模型竞争,并在 MIT 许可下提供商业使用,但它要求用户托管自己的版本以实现完整的应用程序集成。尽管存在一些限制,但它的发布凸显了可访问 AI 视频解决方案的趋势。
这家三人机器人初创公司正与设计师 Yves Béhar 合作,将人形机器人带回家
Kind Humanoid 的三人团队正在开发一款名为 Mona 的奇特人形机器人。它专为家庭使用而设计,而不是工业环境。该团队计划明年对最初的十几个原型进行现场测试。Kind 的方法注重创新和效率,而不是筹款,与其他以工业市场为目标的人工智能驱动机器人制造商形成了鲜明对比。
INTELLECT–1:启动首个 10B 参数模型的去中心化训练
https://www.primeintellect.ai/blog/intellect-1
INTELLECT-1 是首个去中心化的 100 亿参数模型。它充分利用了全球对开源 AGI 开发的贡献。OpenDiLoCo 扩展已实现,可用于跨分布式设备训练大型模型,并在带宽效率和容错性方面取得了新的进步。新的 Prime 框架进一步优化了去中心化训练,将 INTELLECT-1 的 100 亿参数训练运行的计算利用率提高到 98%。
特斯拉首次展示自动驾驶“机器人出租车”
https://www.nytimes.com/2024/10/10/business/tesla-robotaxi-elon-musk.html
特斯拉推出了一款自动驾驶出租车原型 Robotaxi,旨在实现完全自动驾驶,尽管专家对这种技术的近期可行性持怀疑态度。
字节跳动解雇数百名 TikTok 员工,转向使用人工智能内容审核
TikTok 正在转向使用人工智能进行内容审核,导致马来西亚裁员,影响不到 500 名员工。
微软人工智能副总裁 Bubeck 将加入 OpenAI
https://finance.yahoo.com/news/microsoft-artificial-intelligence-vp-bubeck-193734013.html
专注于小型语言模型的微软人工智能副总裁 Sebastien Bubeck 将离职加入 OpenAI。