数据集

优惠 数据集RABBITS:大语言模型在生物医学领域应用时的一个特定问题:对药物名称的脆弱性

  • 数据集RABBITS:大语言模型在生物医学领域应用时的一个特定问题:对药物名称的脆弱性
    AI
  • 麻省理工学院、哈佛大学、麻省总医院、波士顿儿童医院、奥胡斯大学、弗吉尼亚大学、马斯特里赫特大学、庞培法布拉大学和贝斯以色列女执事医疗中心的研究人员发布论文,讨论了大语言模型(LLMs)在生物医学领域应用时的一个特定问题:对药物名称的脆弱性。特别是在处理品牌名和通用名之间的替换时,模型的性能可能会显著下降。研究者们创建了... 阅读全文

    优惠 综合数据集GUI Odyssey:训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理

  • 综合数据集GUI Odyssey:训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理
    AI
  • 上海人工智能实验室OpenGVLab、香港大学、南京大学、哈尔滨工业大学和上海交通大学的研究人员推出综合数据集GUI Odyssey,它旨在训练和评估跨应用(Cross-App)图形用户界面(GUI)导航代理。这些代理能够模拟用户与智能手机应用的交互,以自动化完成一些任务,从而提高用户体验。研究团队还推出Odyssey... 阅读全文

    优惠 文本到视频提示词数据集VidProM

  • 文本到视频提示词数据集VidProM
    AI
  • 来自悉尼科技大学和浙江大学的研究人员推出大规模真实用户文本到视频提示数据集VidProM。VidProM是一个强大的资源,它不仅为视频内容创作者提供了丰富的素材,也为研究人员提供了一个宝贵的工具,用于推动文本到视频生成技术的发展。 GitHub:https://github.com/WangWenhao0716/Vid... 阅读全文

    优惠 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集

  • 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集
    AI
  • 来自滑铁卢大学和亚马逊AWS人工智能实验室的研究人员推出MAGID(Multimodal Augmented Generative Images Dialogues)框架,它是一个自动化流程,用于生成合成的多模态(文本和图像)对话数据集。这个框架的目的是为了解决在开发多模态交互系统时,缺乏丰富、多模态(文本、图像)对话... 阅读全文

    优惠 学术干货 | 大语言模型数据集大盘点

  • 学术干货 | 大语言模型数据集大盘点
    AI
  • 华南理工与合合信息团队联合发布了一篇深度解析论文,聚焦大语言模型(LLM)所需的数据集现状与发展趋势。他们从五大关键方面梳理了LLM数据集资源: 1️⃣ 预训练语料库:奠定LLM语言学习基础的大规模文本集合。 2️⃣ 指令微调数据集:专门针对LLM进行任务导向性优化的关键数据源。 3️⃣ 偏好数据集:关乎用户需求、道德... 阅读全文

    优惠 Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集

  • Meta推出多模态开放数据集AEA,通过Project Aria眼镜收集
    AI
  • Meta推出数据集Aria Everyday Activities (AEA) ,这是一个以第一人称视角记录的多模态开放数据集,通过Project Aria眼镜收集。AEA数据集包含了多个佩戴者在五个不同地理位置的室内环境中记录的143个日常活动序列。每个记录都包含了通过Project Aria眼镜收集的多模态传感器数... 阅读全文