AI

优惠 在线创意动画制作工具Fable,加入了AI功能Prism

  • 在线创意动画制作工具Fable,加入了AI功能Prism
    AI
  • Fable是一个在线创意动画制作工具,近期官方加入了AI功能Prism,在 Prism 中,创作者首次能够与生成式 AI 实时合作,共同设计和制作动画。Prism 建立在 Fable 强大且直观的设计和动画引擎之上,让你能够通过专为视觉工作设计的视觉界面指导生成。而 Prism 的“AI 镜头”则能让你快速尝试不同的风... 阅读全文

    优惠 基于Stable Diffusion的在线AI绘画网站Gencraft

  • 基于Stable Diffusion的在线AI绘画网站Gencraft
    AI
  • Gencraft是一个基于Stable Diffusion的在线AI绘画网站,可注册也可使用谷歌账号登录,免费用户每天有5张免费额度,可以生成1024x1024解析度的图片,大家可以试试。... 阅读全文

    优惠 3DGStream:用于实时流式传输真实感自由视角视频

  • 3DGStream:用于实时流式传输真实感自由视角视频
    AI
  • 来自浙江大学的研究人员发布论文介绍了一个名为3DGStream的方法,它是一种用于实时流式传输真实感自由视角视频(Free-Viewpoint Videos, FVVs)的技术。这种方法特别适用于动态场景,比如人们在房间内移动或者物体在场景中变化的情况。3DGStream的目标是能够在不需要完整视频序列的离线训练的情况... 阅读全文

    优惠 Google DeepMind推出机器人学习框架RT-H:通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务

  • Google DeepMind推出机器人学习框架RT-H:通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务
    AI
  • Google DeepMind推出机器人学习框架RT-H(Robot Transformer with Action Hierarchies)的机器人学习框架。RT-H的目标是通过自然语言来构建动作层级结构,以便更有效地学习和执行复杂的任务。这个框架利用了语言的表达能力,将复杂任务分解成更细粒度的动作,从而帮助机器人更... 阅读全文

    优惠 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型

  • 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型
    AI
  • 这篇论文介绍了一个名为DenseMamba的新型网络架构,它是针对大语言模型(LLMs)的一种高效状态空间模型(SSM)。大型语言模型,如GPT-3和BERT,通常依赖于Transformer架构,这种架构在处理长文本时计算和内存需求非常高。DenseMamba旨在解决这个问题,通过改进SSM来降低计算复杂度,同时保持... 阅读全文

    优惠 Design2Code:多模态大语言模型在前端开发中的应用

  • Design2Code:多模态大语言模型在前端开发中的应用
    AI
  • 来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出Design2Code项目,它探索了多模态大语言模型(LLM)在前端开发中的应用。这项任务的目标是将视觉设计直接转化为代码实现,从而改变了前端开发的工作流程。想象一下,如果你有一个网站的设计草图,你希望有一个工具能够自动为你生成实现这个设计的网站代... 阅读全文

    优惠 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题

  • 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题
    AI
  • 这篇论文介绍了一个名为Wukong的新型推荐系统架构。Wukong的目标是解决现有推荐模型在处理大规模数据集时的效率和质量问题。在推荐系统中,我们通常希望模型能够理解用户的行为和偏好,从而推荐用户可能感兴趣的内容,比如电影、商品或者新闻。简而言之,Wukong就像是一个智能的推荐助手,它能够理解和学习用户的行为模式,然... 阅读全文

    优惠 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行

  • 量化方法EasyQuant:减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行
    AI
  • 腾讯发布论文探讨关于大型语言模型(LLMs)的量化方法,特别是针对那些拥有数十亿甚至更多参数的模型。简单来说,模型量化是一种减小模型大小和计算成本的技术,使模型能够在资源有限的设备上运行,例如手机或嵌入式设备。 想象一下,你有一个超级大的食谱书,里面有上亿种不同的菜式,但你只需要其中的一部分。如果你能把这本书压缩,只保... 阅读全文

    优惠 MathScale:提高大语言模型在解决数学问题方面的能力

  • MathScale:提高大语言模型在解决数学问题方面的能力
    AI
  • 来自香港中文大学、微软亚洲研究院、深圳研究院 大数据研究所的研究人员推出MathScale,它旨在提高大语言模型(LLMs)在解决数学问题方面的能力。尽管LLMs在解决问题方面表现出色,但在处理数学问题时仍然存在不足。MathScale通过使用前沿的LLMs(如GPT-3.5)来创建高质量的数学推理数据集,从而解决了这... 阅读全文

    优惠 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能

  • 经过改进的多模态大语言模型LLaVA-HR:专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能
    AI
  • LLaVA-HR(LLaVA High-Resolution)是一个经过改进的多模态大语言模型(MLLM),它专门设计来处理高分辨率图像,以提高在视觉和语言任务上的性能。这个模型是基于LLaVA-1.5的架构,通过引入Mixture-of-Resolution Adaptation (MRA) 技术,使得模型能够更有效... 阅读全文

    优惠 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集

  • 自动化流程框架MAGID:生成合成的多模态(文本和图像)对话数据集
    AI
  • 来自滑铁卢大学和亚马逊AWS人工智能实验室的研究人员推出MAGID(Multimodal Augmented Generative Images Dialogues)框架,它是一个自动化流程,用于生成合成的多模态(文本和图像)对话数据集。这个框架的目的是为了解决在开发多模态交互系统时,缺乏丰富、多模态(文本、图像)对话... 阅读全文

    优惠 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音

  • 文本到语音(TTS)合成系统NaturalSpeech 3:生成自然、高质量且具有零样本(zero-shot)能力的语音
    AI
  • 来自微软亚洲研究院、中国科学技术大学、香港中文大学(深圳)、浙江大学、东京大学、北京大学的研究人员推出文本到语音(TTS)合成系统NaturalSpeech 3。这个系统的目标是生成自然、高质量且具有零样本(zero-shot)能力的语音。所谓零样本能力,意味着即使在没有特定说话人的训练数据的情况下,系统也能够模仿他们... 阅读全文