推荐类别

栏目分类

优惠 工智能辅助工具Tutor CoPilot:通过提供专家级的指导来帮助教育工作者,特别是那些经验不足的教师或家教,以提高他们的教学质量

  • 工智能辅助工具Tutor CoPilot:通过提供专家级的指导来帮助教育工作者,特别是那些经验不足的教师或家教,以提高他们的教学质量
    AI
  • 斯坦福大学推出了一个名为Tutor CoPilot的系统,它是一个人工智能辅助工具,旨在通过提供专家级的指导来帮助教育工作者,特别是那些经验不足的教师或家教,以提高他们的教学质量。Tutor CoPilot通过分析教学互动的实时数据,给出建议,帮助教师更好地指导学生。 项目主页:https://osf.io/8d6ha... 阅读全文

    优惠 新框架MIGA:提高股票市场预测的准确性而设计

  • 新框架MIGA:提高股票市场预测的准确性而设计
    AI
  • 清华大学和XM资本的研究人员推出新框架MIGA,它是为了提高股票市场预测的准确性而设计的。简单来说,MIGA通过组合多个专家模型(Experts)来预测股票价格的未来走势,并且能够根据不同类型的股票动态选择最合适的专家模型进行预测。例如,你是一名投资者,正在考虑投资某个大型科技公司的股票。你可以使用MIGA来预测这支股... 阅读全文

    优惠 CANVAS:让机器人能够理解人类导航指令并据此行动的框架

  • CANVAS:让机器人能够理解人类导航指令并据此行动的框架
    AI
  • MAUM.AI和延世大学的研究人员推出了一个名为CANVAS的系统,它是一个让机器人能够理解人类导航指令并据此行动的框架。想象一下,如果你告诉机器人“走到大厅另一边的桌子那里”,CANVAS能够让机器人理解这样抽象的指令,并在环境中穿行以到达目的地。它通过模仿人类的行为来学习如何根据视觉和语言指令进行导航。 项目主页:... 阅读全文

    优惠 GenSim2:用于机器人模拟的数据生成系统

  • GenSim2:用于机器人模拟的数据生成系统
    AI
  • 清华大学交叉信息科学研究院、加州大学圣地亚哥分校、上海交通大学、麻省理工学院 CSAIL的研究人员推出了一个名为GenSim2的框架,它是一个用于机器人模拟的数据生成系统。GenSim2利用了多模态和推理能力的大语言模型(LLMs),来自动创建复杂且逼真的模拟任务和场景,特别是那些涉及长时序和复杂物体操作的任务。这些任... 阅读全文

    优惠 基准测试NL-EYE:评估视觉语言模型(VLMs)在图像上进行推理的能力

  • 基准测试NL-EYE:评估视觉语言模型(VLMs)在图像上进行推理的能力
    AI
  • 以色列理工学院和谷歌的研究人员推出一个名为NL-EYE的基准测试,它是为了评估视觉语言模型(VLMs)在图像上进行推理的能力而设计的。例如,一个基于VLM的机器人检测到地板湿了,它是否会警告我们小心滑倒?这就是NL-EYE想要测试的——VLMs是否能够理解图像内容,并据此做出合理的推断。 项目主页:https://ve... 阅读全文

    优惠 在线图片编辑利器Shotzio:轻松美化你的图片,无需安装任何软件

  • 在线图片编辑利器Shotzio:轻松美化你的图片,无需安装任何软件
    工具
  • Shotzio,一个无需下载安装的在线图片编辑器,为你的图片增添魅力。只需拖拽上传,即可轻松应用多种美化效果。 核心功能: 渐层色背景:为你的图片增添渐变背景,让视觉效果更丰富。 图片阴影:增加图片的立体感,使其在页面上更加突出。 圆角设计:让图片边缘更加柔和,提升整体美感。 一键导出: 支持导出为WebP、JPG、P... 阅读全文

    优惠 新型多模态大语言模型VideoLISA:专为视频领域内基于语言指令的推理分割任务而设计

  • 新型多模态大语言模型VideoLISA:专为视频领域内基于语言指令的推理分割任务而设计
    AI
  • 新加坡国立大学和亚马逊的研究人员推出新型多模态大语言模型VideoLISA,它专为视频领域内基于语言指令的推理分割任务而设计。VideoLISA结合了大型语言模型的推理能力和对世界知识的掌握,并借助Segment Anything Model(SAM)生成基于语言指令的视频内的时间一致性分割掩码。例如,你是一名视频编辑... 阅读全文

    优惠 TPI-LLM:为了在资源受限的边缘设备上高效运行大语言模型而设计的推理系统

  • TPI-LLM:为了在资源受限的边缘设备上高效运行大语言模型而设计的推理系统
    AI
  • 穆罕默德·本·扎耶德人工智能大学和电子科技大学的研究人员推出TPI-LLM,这是一个为了在资源受限的边缘设备上高效运行大语言模型(LLMs)而设计的推理系统。随着技术的发展,人们越来越关注将这些强大的模型从云端转移到边缘设备上,以便更好地保护用户数据的隐私,同时减少延迟。 例如,你有一个智能音箱,需要处理用户的语音命令... 阅读全文

    优惠 新型多模态大语言模型LEOPARD:专门为处理包含丰富文本的多图像任务而设计

  • 新型多模态大语言模型LEOPARD:专门为处理包含丰富文本的多图像任务而设计
    AI
  • 圣母大学、腾讯人工智能西雅图实验室的研究人员推出新型多模态大语言模型LEOPARD,它专门为处理包含丰富文本的多图像任务而设计。这类任务在现实世界中非常普遍,比如幻灯片、扫描文档和网页快照等。例如,你是一名学生,需要准备一场关于经济报告的演讲。你手上有一系列包含图表和数据的幻灯片。使用LEOPARD,你可以将这些幻灯片... 阅读全文

    优惠 SonicSim:一个可定制的模拟平台,用于处理移动声源场景中的语音

  • SonicSim:一个可定制的模拟平台,用于处理移动声源场景中的语音
    AI
  • 清华大学和日本国立信息研究所的研究人员推出仿真工具SonicSim,以及一个基于此工具生成的大规模合成数据集SonicSet。SonicSim专门用于模拟移动声源场景下的语音处理任务,如语音分离和增强。例如,你正在开发一个智能会议系统,需要从会议录音中分离出每个发言者的语音。使用SonicSim,你可以创建一个模拟会议... 阅读全文

    优惠 英伟达推出一种用于无标签多教师知识蒸馏的方法PHI-S

  • 英伟达推出一种用于无标签多教师知识蒸馏的方法PHI-S
    AI
  • 英伟达推出一种名为PHI-S(PHI Standardization)的技术,它是一种用于无标签多教师知识蒸馏的方法。知识蒸馏是一种技术,它允许一个“学生”模型去学习并模仿一个或多个“教师”模型的行为,而不需要直接访问训练数据。PHI-S特别关注于如何平衡和标准化来自不同教师模型的特征激活分布,以便学生模型可以更准确地... 阅读全文

    优惠 新型框架OPEN-RAG:增强大语言模型(LLMs)的推理能力

  • 新型框架OPEN-RAG:增强大语言模型(LLMs)的推理能力
    AI
  • 孟加拉国工程技术大学、北德克萨斯大学、加拿大约克大学、Salesforce Research、卡塔尔计算研究所 (QCRI)、Fatima Al-Fihri 博士前奖学金和Cohere For AI Community的研究人员推出新型框架OPEN-RAG,它旨在增强大语言模型(LLMs)的推理能力,特别是当这些模型是... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?