人工智能

优惠 新基准测试Planetarium:用于评估大语言模型解决规划问题的性能

  • 新基准测试Planetarium:用于评估大语言模型解决规划问题的性能
    AI
  • 布朗大学计算机科学系的研究人员推出新基准测试Planetarium,用于评估大语言模型解决规划问题的性能,特别是将自然语言描述的规划任务转换成结构化的规划语言,例如规划领域定义语言(PDDL),并通过实验展示了现有模型在这一领域的挑战和潜力。例如,你告诉计算机:“我想要把桌子上的两个积木堆叠起来。”计算机需要理解这句话... 阅读全文

    优惠 阿里达摩院推出一站式 AI 视频创作平台 —“寻光”:集成分镜设计、图层可控编辑等功能

  • 阿里达摩院推出一站式 AI 视频创作平台 —“寻光”:集成分镜设计、图层可控编辑等功能
    AI
  • 2024 世界人工智能大会(WAIC 2024)期间,阿里达摩院推出了一站式 AI 视频创作平台 —— 寻光。官方表示,该平台旨在通过 AI 技术使视频创作更简单、高效,其集成了剧本创作、分镜设计、视频素材编辑等关键步骤,创作者可以从构思到成品,在该平台上完成视频创作全过程。 据介绍,寻光包含如下功能: 故事板生成:一... 阅读全文

    优惠 S2TT:将大语言模型应用于语音到文本翻译任务

  • S2TT:将大语言模型应用于语音到文本翻译任务
    AI
  • 台湾大学、香港中文大学和Meta的研究人员发布论文,探讨了如何将大型语言模型(LLMs)应用于语音到文本翻译(Speech-to-Text Translation, S2TT)任务。S2TT是一种技术,它能够将一种语言的语音信号转换成另一种语言的文字,这对于跨语言交流非常重要。例如,一个英语使用者想要理解德语的演讲,S... 阅读全文

    优惠 新型文本到音频生成框架PicoAudio:专注于提供精确的时间戳和频率可控性

  • 新型文本到音频生成框架PicoAudio:专注于提供精确的时间戳和频率可控性
    AI
  • 上海交通大学X-LANCE实验室、上海人工智能实验室和香港中文大学(深圳)的研究人员推出新型文本到音频生成框架PicoAudio,它专注于提供精确的时间戳和频率可控性。简单来说,PicoAudio能够根据文本描述生成音频,并且能够精确控制音频中特定事件的发生时间和频率。 项目主页:https://picoaudio.g... 阅读全文

    优惠 关于表格型机器学习的新基准测试集合TabReD

  • 关于表格型机器学习的新基准测试集合TabReD
    AI
  • Yandex和高等经济大学的研究人员推出推出关于表格型机器学习(Tabular Machine Learning)的一个新的基准测试集合TabReD。表格型机器学习是一种处理表格数据的人工智能技术,这些数据通常包含行和列,类似于电子表格中的组织方式。想象一下,你有一个包含许多客户信息的表格,你想知道哪些客户最有可能购买... 阅读全文

    优惠 ProgressGym技术解决方案:旨在通过学习历史上的道德进步机制,帮助AI系统在未来的现实世界道德决策中取得进步

  • ProgressGym技术解决方案:旨在通过学习历史上的道德进步机制,帮助AI系统在未来的现实世界道德决策中取得进步
    AI
  • 北京大学和康奈尔大学的研究人员推出ProgressGym技术解决方案,它是一个实验框架,旨在通过学习历史上的道德进步机制,帮助AI系统在未来的现实世界道德决策中取得进步。这篇论文的主题是关于如何确保先进的人工智能系统,尤其是大型语言模型(LLMs),与人类社会的道德进步保持一致。这些AI系统对人类用户的价值观有着越来越... 阅读全文

    优惠 新框架DogeRM:通过模型融合的方式,将特定领域的知识整合到通用的奖励模型中

  • 新框架DogeRM:通过模型融合的方式,将特定领域的知识整合到通用的奖励模型中
    AI
  • 台湾大学的研究人员推出新框架DogeRM(Domain knowledge merged Reward Model),它通过模型融合的方式,将特定领域的知识整合到通用的奖励模型中。这项技术是针对强化学习中的人类反馈(RLHF)环节设计的,目的是让大语言模型(LLMs)的行为更符合人类的期望。论文还提到,尽管DogeRM... 阅读全文

    优惠 新型框架ACP:能够自动从高质量的生成数据中学习,这些数据是由语言驱动生成的

  • 新型框架ACP:能够自动从高质量的生成数据中学习,这些数据是由语言驱动生成的
    AI
  • 上海人工智能实验室、同济大学、南洋理工大学、北京大学和上海交通大学推出新型框架“Auto Cherry-Picker”(简称ACP),它能够自动从高质量的生成数据中学习,这些数据是由语言驱动生成的。例如,我们只需要给ACP一个简单的物品列表,比如“苹果、椅子、桌子”,它就能利用大语言模型生成详细的描述,并设计出合理的布... 阅读全文

    优惠 微软推出T-MAC,在边缘设备上高效部署大语言模型

  • 微软推出T-MAC,在边缘设备上高效部署大语言模型
    AI
  • 微软推出T-MAC,在边缘设备上高效部署大语言模型(LLMs)。例如,我们想让智能手机、平板电脑或者家里的智能音箱能够更好地理解我们说的话,并且给出智能的回答,就需要在这些设备上运行一些非常复杂的算法,这些算法就是大型语言模型。但是,这些模型因为非常复杂,所以它们需要很多内存和计算能力,这对于边缘设备来说是个挑战。 论... 阅读全文

    优惠 新型自监督学习模型XEUS:为数千种语言提供鲁棒的语音表示学习

  • 新型自监督学习模型XEUS:为数千种语言提供鲁棒的语音表示学习
    AI
  • 卡内基梅隆大学、上海交通大学和芝加哥丰田技术学院的研究人员推出新型自监督学习(Self-supervised Learning, SSL)模型XEUS(发音类似Zeus,意为“跨语言通用语音编码器”),旨在为数千种语言提供鲁棒的语音表示学习。XEUS模型在超过100万小时的数据上进行了预训练,涵盖了4057种语言,这使... 阅读全文

    优惠 新型基准测试工具MIRAI:专门设计用来评估大语言模型在国际事件预测方面的能力

  • 新型基准测试工具MIRAI:专门设计用来评估大语言模型在国际事件预测方面的能力
    AI
  • 加州大学洛杉矶分校和加州理工学院的研究人员推出新型基准测试工具MIRAI,它专门设计用来评估大语言模型(LLMs)在国际事件预测方面的能力。例如,我们有一个智能系统,它可以通过分析历史数据和新闻文章来预测未来的国际事件,比如国家间的冲突、合作或外交关系的转变。这种预测对于政府决策者来说非常重要,因为它可以帮助他们做出更... 阅读全文

    优惠 新型人工智能模型OmniJARVIS:虚拟世界中的智能助手,能够理解你的指令,帮你在游戏中完成任务

  • 新型人工智能模型OmniJARVIS:虚拟世界中的智能助手,能够理解你的指令,帮你在游戏中完成任务
    AI
  • 北京大学、BIGAI和加州大学洛杉矶分校的研究人员推出新型人工智能模型OmniJARVIS,它是为了在开放世界环境中,比如像《我的世界》这样的沙盒游戏中,让人工智能体按照指令行动而设计的。想象一下,你在游戏中拥有一个智能助手,它可以听懂你的话,理解你的想法,并在游戏中帮你完成各种任务,比如挖矿、建造或探索。 项目主页:... 阅读全文