人工智能

优惠 如何通过合成图像和文本对来提升视觉-语言模型的训练效率和性能

  • 如何通过合成图像和文本对来提升视觉-语言模型的训练效率和性能
    AI
  • 这篇论文的主题是关于如何通过合成图像和文本对来提升视觉-语言模型(Visual-Language Models,简称VLMs)的训练效率和性能。简单来说,就是利用大型语言模型(Large Language Models,简称LLMs)和图像生成模型来创建虚拟的图像和文本配对,然后用这些合成数据来训练VLMs,从而在不依... 阅读全文

    优惠 Meta推出Branch-Train-MiX(BTX):效的训练大语言模型的方法,旨在让模型在多个专业领域(如编程、数学推理和世界知识等)都具备能力

  • Meta推出Branch-Train-MiX(BTX):效的训练大语言模型的方法,旨在让模型在多个专业领域(如编程、数学推理和世界知识等)都具备能力
    AI
  • Meta推出Branch-Train-MiX(BTX),它是一种高效的训练大语言模型(LLMs)的方法,旨在让模型在多个专业领域(如编程、数学推理和世界知识等)都具备能力。BTX方法从一个基础模型开始,然后将其分支出去,以并行的方式训练各个专家模型,这样做的通信成本较低,吞吐量高。训练完成后,BTX将这些专家模型的前馈... 阅读全文

    优惠 谷歌推出软件库FAX:基于JAX(一个用于高性能机器学习计算的Python库)构建的,旨在支持大规模分布式和联邦计算

  • 谷歌推出软件库FAX:基于JAX(一个用于高性能机器学习计算的Python库)构建的,旨在支持大规模分布式和联邦计算
    AI
  • 这篇论文介绍了一个名为FAX的软件库,它是基于JAX(一个用于高性能机器学习计算的Python库)构建的,旨在支持大规模分布式和联邦计算。FAX特别适用于数据中心和跨设备应用程序,能够在不共享数据的情况下,让多个客户端协作完成机器学习任务,这就是所谓的联邦学习(FL)。 主要功能: FAX的主要功能是提供一个易于编程、... 阅读全文

    优惠 新型动作生成模型Motion Mamba:专注于高效地生成长时间序列的人类动作

  • 新型动作生成模型Motion Mamba:专注于高效地生成长时间序列的人类动作
    AI
  • 这篇论文介绍了一个名为Motion Mamba的新型动作生成模型,它专注于高效地生成长时间序列的人类动作。Motion Mamba是一个强大的工具,它通过结合先进的状态空间模型和扩散模型,为长时间序列的人类动作生成提供了一个高效且高质量的解决方案。想象一下,你正在为一个视频游戏设计角色动作,或者为一个动画电影创建复杂的... 阅读全文

    优惠 韩国科学技术院推出多模态模型MoAI

  • 韩国科学技术院推出多模态模型MoAI
    AI
  • 韩国科学技术院推出新型大型语言和视觉模型MoAI(Mixture of All Intelligence),MoAI是一个强大的多模态模型,它通过结合先进的语言处理和视觉识别技术,提供了一种新的交互方式,使得机器能够更好地理解和响应人类的指令和问题。想象一下,你有一个超级智能的助手,它不仅能理解你说的话,还能看懂图片中... 阅读全文

    优惠 用于移动操作机器人的先进技术:GeFF系统

  • 用于移动操作机器人的先进技术:GeFF系统
    AI
  • 加州大学圣地亚哥分校、卡耐基梅隆大学、 麻省理工学院和 IAIFI的研究团队推出GeFF(Generalizable Feature Fields)系统,它是一种用于移动操作机器人的先进技术。想象一下,你有一个机器人助手,它可以在你的指导下,比如“去拿一瓶饮料”,然后在一个充满各种物品的房间里找到并拿起一瓶饮料。这就是... 阅读全文

    优惠 用于时间序列预测的先进工具Chronos框架

  • 用于时间序列预测的先进工具Chronos框架
    AI
  • 来自亚马逊网络服务、 加州大学圣地亚哥分校、弗莱堡大学、亚马逊供应链优化技术的研究团队推出Chronos框架,它是一个用于时间序列预测的先进工具。时间序列预测是一种分析技术,可以帮助我们根据历史数据来预测未来的数据点。想象一下,如果你是一家电力公司的分析师,你需要预测明天、下周甚至下个月的电力需求,以便合理地安排发电和... 阅读全文

    优惠 Cohere推出350亿参数可扩展生成模型Command-R

  • Cohere推出350亿参数可扩展生成模型Command-R
    AI
  • 加拿大AI企业Cohere宣布推出Command-R,一款面向大规模生产工作负载的可扩展生成模型。Command-R具备以下特点: ✅ 高准确性:结合RAG(检索增强生成)和工具使用,实现高度精确的输出。 ✅ 高效性能:低延迟、高吞吐量,满足企业级需求。 ✅ 长上下文支持:长达128k的上下文长度,适应复杂任务。 ✅ ... 阅读全文

    优惠 OpenAI开源Transformer结构分析工具Transformer Debugger(TDB)

  • OpenAI开源Transformer结构分析工具Transformer Debugger(TDB)
    AI
  • 被马斯克喷了很久的OpenAI,在今天开源了一个自己内部一直用于分析Transformer内部结构的工具Transformer Debugger(TDB),该工具结合了自动可解释性和稀疏自动编码器,允许开发者快速探索模型而无需编写代码。 Transformer Debugger(TDB)是由OpenAI的Superal... 阅读全文

    优惠 基于SD相关模型的在线AI绘画网站Rendernet

  • 基于SD相关模型的在线AI绘画网站Rendernet
    AI
  • Rendernet是一个基于SD相关模型的在线AI绘画网站,登录后会送10点免费额度,支持生图、Lora和ControlNet,可帮助您创建具有一致角色的视觉效果,同时提供对其姿势、构图和风格的详细控制。... 阅读全文

    优惠 新型的模型窃取攻击,它能够从未公开的黑盒生产语言模型(例如OpenAI的ChatGPT或Google的PaLM-2)中提取精确、非平凡的信息

  • 新型的模型窃取攻击,它能够从未公开的黑盒生产语言模型(例如OpenAI的ChatGPT或Google的PaLM-2)中提取精确、非平凡的信息
    AI
  • 谷歌发布论文介绍一种新型的模型窃取攻击,它能够从未公开的黑盒生产语言模型(例如OpenAI的ChatGPT或Google的PaLM-2)中提取精确、非平凡的信息。具体来说,攻击者可以通过典型的API访问,恢复变换模型的嵌入投影层(直到对称性)。这项技术首次证实了这些黑盒模型具有1024和2048的隐藏维度。总的来说,这... 阅读全文

    优惠 文本到视频提示词数据集VidProM

  • 文本到视频提示词数据集VidProM
    AI
  • 来自悉尼科技大学和浙江大学的研究人员推出大规模真实用户文本到视频提示数据集VidProM。VidProM是一个强大的资源,它不仅为视频内容创作者提供了丰富的素材,也为研究人员提供了一个宝贵的工具,用于推动文本到视频生成技术的发展。 GitHub:https://github.com/WangWenhao0716/Vid... 阅读全文