AI

优惠 Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集

  • Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集
    AI
  • Meta推出数据集Aria Everyday Activities (AEA) ,这是一个以第一人称视角记录的多模态开放数据集,通过Project Aria眼镜收集。AEA数据集包含了多个佩戴者在五个不同地理位置的室内环境中记录的143个日常活动序列。每个记录都包含了通过Project Aria眼镜收集的多模态传感器数... 阅读全文

    优惠 在深度强化学习中,如何通过修剪网络(pruning)来提高模型的性能

  • 在深度强化学习中,如何通过修剪网络(pruning)来提高模型的性能
    AI
  • 来自Google DeepMind、魁北克人工智能研究所、蒙特利尔大学的研究人员发布论文探讨了在深度强化学习(Deep Reinforcement Learning, DRL)中,如何通过修剪网络(pruning)来提高模型的性能。修剪网络是一种优化技术,它通过移除神经网络中不重要的参数(通常是权重较小的连接),来减少... 阅读全文

    优惠 BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现

  • BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现
    AI
  • 来自香港大学、腾讯AI实验室的研究人员发布论文介绍了一种名为Bi-Modal Behavioral Alignment (BBA) 的方法,它是为了提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现。BBA方法的核心在于它能够更好地利用视觉信息和领域特定语言(DSL)的表示,这两种信息在传统的Chain-... 阅读全文

    优惠 新型解码框架Ouroboros:加速大语言模型(LLMs)的推理过程

  • 新型解码框架Ouroboros:加速大语言模型(LLMs)的推理过程
    AI
  • 这篇论文介绍了一种名为Ouroboros的新型解码框架,它旨在加速大语言模型(LLMs)的推理过程。Ouroboros通过一种称为“推测性解码”的方法,使用一个小型模型快速生成草稿,然后利用大型模型进行验证和修正,以减少时间开销。这种方法不需要对模型进行额外训练,也不会影响生成质量。 GitHub地址:https://... 阅读全文

    优惠 USER-LLM框架:用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据

  • USER-LLM框架:用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据
    AI
  • 来自谷歌的研究人员发布论文介绍了一个名为USER-LLM的框架,它是一个用于改进大语言模型(LLMs)以更好地理解和适应用户交互数据的系统。USER-LLM通过使用用户嵌入(user embeddings)来为LLMs提供上下文信息,这些嵌入是从用户的多样化交互数据中自动学习得到的,能够捕捉用户的偏好和行为模式。 论文... 阅读全文

    优惠 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术

  • 一种新颖的音乐风格转换方法:利用了扩散模型和时间变化的文本反演技术
    AI
  • 来自中国科学院自动化研究所、中国科学院大学人工智能学院、中国科学院计算技术研究所和快手的研究人员提出一种新颖的音乐风格转换方法,它利用了扩散模型和时间变化的文本反演技术。这种方法可以有效地捕捉音乐属性,即使在数据量很少的情况下也能实现。它通过一个创新的时间变化文本反演模块来精确捕捉不同层次的梅尔频谱图特征,并在推理过程... 阅读全文

    优惠 大语言模型(LLMs)在面对对抗性攻击时的脆弱性

  • 大语言模型(LLMs)在面对对抗性攻击时的脆弱性
    AI
  • 来自马里兰大学帕克分校的研究人员发布论文探讨了大语言模型(LLMs)在面对对抗性攻击时的脆弱性。对抗性攻击是指故意设计输入,以诱导模型产生非预期或有害的输出。论文的主要目的是扩展我们对LLMs对抗性攻击的理解,不仅仅是“越狱”(即让模型产生违反其训练目标的输出),而是包括更广泛的攻击类型和目标。 论文地址:https:... 阅读全文

    优惠 Chrome 浏览器插件Window Resizer:网页设计师与开发者的福音,一键模拟多设备屏幕尺寸,提升网页布局调试效率

  • Chrome 浏览器插件Window Resizer:网页设计师与开发者的福音,一键模拟多设备屏幕尺寸,提升网页布局调试效率
    AI
  • Window Resizer 是一款免费的 Google Chrome 浏览器插件,它的核心作用在于帮助用户迅速调整浏览器窗口尺寸以模拟不同设备屏幕大小。这对于网页设计师和开发者尤为实用,特别是在响应式网页设计(RWD)广泛运用的当下,网页布局会根据不同的视口尺寸自动适应。通过Window Resizer,您可以轻松地... 阅读全文

    优惠 浪潮信息发布智能AI助手YuanChat,可在Windows电脑上本地化部署

  • 浪潮信息发布智能AI助手YuanChat,可在Windows电脑上本地化部署
    AI
  • 据浪潮服务器微信公众号发文,昨日,基于Yuan2.0-2B模型的智能AI助手YuanChat发布,其可以在Windows电脑上本地化部署。据介绍,YuanChat是专为源2.0大模型设计的客户端应用,集成了模型推理服务和聊天交互界面,具备代码生成、代码解析、数学计算、逻辑推理、知识问答、文案创作等能力。(官方介绍) G... 阅读全文

    优惠 Gemma:谷歌推出新一代先进开源模型,轻量级高性能,助力AI创新

  • Gemma:谷歌推出新一代先进开源模型,轻量级高性能,助力AI创新
    AI
  • 谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。 以下是谷歌官方介绍全文翻译: 在谷歌,我们深信应当让AI惠及每一个人。长期以来... 阅读全文

    优惠 用于3D形状生成的自回归(Auto-regressive)模型Argus3D

  • 用于3D形状生成的自回归(Auto-regressive)模型Argus3D
    AI
  • 这篇论文介绍了一个名为Argus3D的新型框架,它是一个用于3D形状生成的自回归(Auto-regressive)模型。Argus3D通过改进自回归模型的容量和可扩展性,实现了在3D领域中的高效形状生成。这个模型利用了一个名为Objaverse-Mix的大型3D数据集,该数据集包含了约90万个多样化的物体,这些物体具有... 阅读全文

    优惠 多模态大语言模型FinTral:专门为金融分析设计

  • 多模态大语言模型FinTral:专门为金融分析设计
    AI
  • 来自哥伦比亚大学的研究人员推出多模态大语言模型FinTral,它专门为金融分析设计。FinTral模型能够整合文本、数值、表格和图像数据,通过在金融领域的特定数据集上进行预训练、指令微调和强化学习,使其在处理金融文档和数据时表现出色。FinTral模型还引入了一个名为FinSet的广泛基准测试,用于评估模型在多种金融任... 阅读全文