人工智能

优惠 BetterDepth:用来提升单目深度估计的性能

  • BetterDepth:用来提升单目深度估计的性能
    AI
  • 苏黎世联邦理工学院和迪士尼搜索研究部门的研究人员推出BetterDepth,它是用来提升单目深度估计(Monocular Depth Estimation, MDE)的性能。单目深度估计是一种计算机视觉任务,它的目标是通过分析一张图片来猜测物体距离相机的远近,这有点像我们人眼观察世界时,能够感知物体的深度和距离。 例如... 阅读全文

    优惠 新型开源多智能体数据分析系统LAMBDA

  • 新型开源多智能体数据分析系统LAMBDA
    AI
  • 香港理工大学的研究人员推出新型开源多智能体数据分析系统LAMBDA,LAMBDA的核心思想是利用大语言模型(LLMs)的能力,通过自然语言交互来解决复杂的数据驱动应用中的数据分析挑战。简单来说,LAMBDA就是一个能够理解人类语言并执行数据分析任务的智能系统。 项目主页:https://www.polyu.edu.hk... 阅读全文

    优惠 多智能体模拟平台AgentScope:应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性

  • 多智能体模拟平台AgentScope:应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性
    AI
  • 阿里巴巴和中国人民大学的研究团队推出多智能体模拟平台AgentScope,它是为了应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性。AgentScope平台利用了大语言模型(LLMs)的能力,使得智能体能够理解、生成和与人类语言交互,进而在模拟环境中执行任务。 项目主页:h... 阅读全文

    优惠 课程修正(course-correction):提高大语言模型在生成有害内容时的自我纠正能力

  • 课程修正(course-correction):提高大语言模型在生成有害内容时的自我纠正能力
    AI
  • 清华大学、中南大学、阿里巴巴集团、蚂蚁集团和南洋理工大学的研究人员发布论文,论文的主题是关于如何提高大语言模型(LLMs)在生成有害内容时的自我纠正能力,也就是所谓的“课程修正”(course-correction)。这是指模型在开始生成有害内容后,能够自主地转变方向,避免继续产生不当内容。 GitHub:https:... 阅读全文

    优惠 AMEX数据集:为了提升移动设备上AI代理(也就是智能助手)的能力而设计

  • AMEX数据集:为了提升移动设备上AI代理(也就是智能助手)的能力而设计
    AI
  • 香港中文大学 MMLab、上海交通大学、 上海人工智能实验室和 vivo人工智能实验室的研究人员推出一个名为“Android Multi-annotation EXpo(AMEX)”的数据集,它是为了提升移动设备上AI代理(也就是智能助手)的能力而设计的。这些AI代理能够通过直接与图形用户界面(GUI)交互来完成复杂的... 阅读全文

    优惠 3D汽车重建技术DreamCar:它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型

  • 3D汽车重建技术DreamCar:它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型
    AI
  • DreamCar 是一项创新的3D汽车重建技术,它能够利用少量甚至单张汽车图片,重建出高质量的三维汽车模型。这对于自动驾驶行业的模拟器来说是一个巨大的突破,因为传统上,创建精致的3D汽车模型需要专业的艺术家手工制作,这既耗时又成本高昂。为了使生成模型更加通用,研究团队收集了一个包含超过5,600辆汽车的数据集,命名为C... 阅读全文

    优惠 针对视觉强化学习的通用框架Maniwhere:使训练后的机器人策略能够在多种视觉干扰类型的组合中实现泛化

  • 针对视觉强化学习的通用框架Maniwhere:使训练后的机器人策略能够在多种视觉干扰类型的组合中实现泛化
    AI
  • 清华大学研究院、上海交通大学、香港大学、北京大学、上海启智研究院和上海人工智能实验室的研究人员推出Maniwhere,这是一个针对视觉强化学习的通用框架,使训练后的机器人策略能够在多种视觉干扰类型的组合中实现泛化。具体而言,研究团队引入了一种结合空间变换网络(STN)模块的多视图表示学习方法,用于捕获不同视角之间的共享... 阅读全文

    优惠 多元化“角色”库PERSONA:这些角色具有不同的背景和个性特征

  • 多元化“角色”库PERSONA:这些角色具有不同的背景和个性特征
    AI
  • PERSONA创建了一个多元化的“角色”库,这些角色具有不同的背景和个性特征,通过这些角色,我们可以更全面地测试和改进智能助手,让它能够更好地理解和服务于每一个人。想象一下,我们正在训练一个能够理解和回应不同人群需求的智能助手。这个助手需要能够适应不同的价值观和观点,就像我们人类一样。但是,如果我们只用一种标准或者多数... 阅读全文

    优惠 为人工智能软件开发者设计的开源平台OpenDevin

  • 为人工智能软件开发者设计的开源平台OpenDevin
    AI
  • OpenDevin是一个开放平台,它是为人工智能软件开发者设计的,特别是那些希望构建能够像人类开发者一样与世界互动的通用人工智能代理。这些AI代理可以通过编写代码、与命令行交互以及浏览网络来实现复杂的任务。OpenDevin是一个开发强大且灵活的人工智能代理的平台,这些代理能像人类开发者一样通过编写代码、与命令行交互以... 阅读全文

    优惠 PopPop AI:免费在线AI 音效生成器,输入提示词就能生成音效

  • PopPop AI:免费在线AI 音效生成器,输入提示词就能生成音效
    AI
  • PopPop AI 是一款免费的人工智能音效在线生成器,用户可以通过输入文字描述来快速生成相应的音效素材。这些音效包括鼓掌声、下雨声、车流声等,适用于视频制作、游戏开发或其他需要音效的场合。PopPop AI 的特点是使用简便,不需要注册即可立即使用,并且提供了多种音效范例,用户可以根据需要选择合适的音效。此外,Pop... 阅读全文

    优惠 基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题

  • 基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题
    AI
  • 加州大学伯克利分校的研究人员发布论文,论文的主题是关于如何让计算机更好地回答关于多张图片集合的问题,这在现实世界中非常有用,比如在翻看大量照片、网上搜索特定信息,或者通过卫星图像监控环境变化时。我们可以把这个问题想象成在一堆干草中找到一根针,但更难,因为需要在很多堆干草中找到答案。 论文还提到了他们创建的Visual ... 阅读全文

    优惠 GET-Zero:用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练

  • GET-Zero:用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练
    AI
  • 斯坦福大学的研究人员推出GET-Zero,它是一种用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练。简单来说,GET-Zero通过一种称为Graph Embodiment Transformer(GET)的变换器模型,利用机器人的物理结构(即其关节和链接的图结构)作为学习到的结构偏差,... 阅读全文