头条
Sikon、索尼和佳能利用新相机技术对抗人工智能造假
https://asia.nikkei.com/Business/Technology/Nikon-Sony-and-Canon-fight-AI-fakes-with-new-camera-tech
尼康、索尼集团和佳能正在开发相机技术,将数字签名嵌入图像中,从而与人工智能生成的赝品区分开来。 尼康的无反光镜相机将为专业人士提供防篡改数字签名,提供日期、时间和位置等详细信息。 索尼计划于 2024 年春季在其无反光镜单反相机中添加一个名为“Verify”的在线工具,以检查图像的数字签名,突出显示任何人工智能或被篡改的内容。 佳能将于 2024 年推出类似的图像和视频技术。这些进步解决了区分真实图像和复杂的人工智能生成的赝品这一日益严峻的挑战。
英特尔将利用外部投资分拆人工智能软件公司
https://finance.yahoo.com/news/intel-spins-ai-software-firm-133626026.html
英特尔正在组建一家名为 Articul8 AI 的新独立公司,专注于人工智能软件,并获得 DigitalBridge Group 和其他投资者的投资。 Articul8源于英特尔与波士顿咨询集团的合作,将拥有一个独立的董事会,并且不会公开交易,将专注于创建具有成本效益、安全的商业人工智能解决方案。
研究
自对弈微调将弱语言模型转换为强语言模型
https://arxiv.org/abs/2401.01335
当前语言模型的一大缺点是需要极其昂贵的人类偏好数据才能使其正常工作。 最近的一个重要研究方向是弄清楚我们是否可以让语言模型在不收集这些数据的情况下进行自我对弈来改进。 SPIN 是一种新方法,仅用 SFT 数据就朝这个方向迈出了一步——它可以显着提高基础模型在各种任务中的性能。
学习用边界注意力寻找边界
https://arxiv.org/abs/2401.00935
寻找图像中的轮廓和边界是一个经典的计算机视觉问题。 然而,当引入噪声、质量变化或分布外的例子时,许多现有方法无法表现良好。 这种新的学习方法在传感器读数上表现非常好,并且只有 207k 个参数。 它采用两阶段训练过程,大大提高了现有技术水平。
通过自我监督适应增强低光照片
https://arxiv.org/abs/2401.00766
这项研究利用包围摄影和新颖的时间调制循环网络 (TMRNet) 来显着提高弱光条件下的照片质量。 通过使用合成数据进行训练并适应现实世界的图像,这种方法优于现有的多图像处理方法。
工程
GPT-fast Mixtral 支持 (GitHub Repo)
https://github.com/pytorch-labs/gpt-fast/pull/71
GPT-fast 是 Pytorch 团队为加速普通模型所做的巨大努力。 它可以在 8 个 GPU 上实现每秒 218 个令牌,令人印象深刻。
TinyGPT-V (GitHub Repo)
https://github.com/DLYuanGod/TinyGPT-V
具有小主干的高效多模态大型语言模型。
使用 Marigold 生成 VR 并排视频 (GitHub Repo)
https://github.com/TheWiselyBearded/sbs-generator
通过使用最先进的深度估计和一些经典视频处理,您现在可以将单眼视频转变为 3D 可视 XR 体验! 该代码已获得麻省理工学院许可,可用于商业用途。
杂七杂八
通过 T2I 模型适配生成文本到音频
https://auffusion.github.io/
Auffusion 系统受文本到图像扩散模型的启发,在文本到音频 (TTA) 生成方面取得了突破。 它擅长从文本创建高质量音频,特别是对于复杂的输入。
纽约时报 vs OpenAI 不仅仅是一场法律战
https://thealgorithmicbridge.substack.com/p/the-nyt-vs-openai-is-not-just-a-legal
《纽约时报》对 OpenAI 的诉讼凸显了技术进步与版权侵权之间根深蒂固的冲突。 虽然一些人认为不受限制的人工智能进步是对人类的福音,但另一些人则强调尊重创造者权利的道义责任,并提倡采取平衡的方法,既重视技术进步,又重视知识产权保护。 这场争论凸显了人工智能时代道德与进步之间的复杂关系。
2023 年我们对人工智能和教育的了解
https://aisupremacy.substack.com/p/what-we-learned-about-ai-and-education
教育正在通过探索人工智能辅助辅导、写作指导和评估的协作方法来适应人工智能的整合。
ColBERT 使用示例(Colab Notebook) (Colab Notebook)
https://colab.research.google.com/github/stanford-futuredata/ColBERT/blob/main/docs/intro2new.ipynb
ColBERT 是一种最先进的检索和生成方法。 它的作者提供了一个笔记本来帮助人们加快速度并尝试该方法。
CPU 上的高效 LLM 推理 (GitHub Repo)
https://github.com/intel/intel-extension-for-transformers
英特尔发布了用于在 CPU 上推理 Transformer 的优化工具包。