人工智能

优惠 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT

  • 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT
    AI
  • DiscordBot-EdgeGPT是一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目。... 阅读全文

    优惠 DegreeGuru:打造专属AI RAG聊天机器人,让数据为你所用

  • DegreeGuru:打造专属AI RAG聊天机器人,让数据为你所用
    AI
  • DegreeGuru是一个独特的开源项目,旨在帮助你利用任何自定义数据创建自己的AI RAG聊天机器人。这个项目不仅功能强大,而且操作简便,让你轻松实现个性化聊天机器人的梦想。 GitHub:https://github.com/upstash/degree-guru Demo:https://degreeguru.v... 阅读全文

    优惠 Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲

  • Suno发布文生音乐模型v3:可在几秒钟内创建完整的两分钟歌曲
    AI
  • AI音乐生成创企Suno发布文生音乐模型v3,该模型可在几秒钟内创建完整的两分钟歌曲。该工具可以通过其免费的独立网站访问,也可以通过启用Suno的第三方插件Microsoft Copilot访问。 Suno官方介绍: 在Suno,我们致力于打造一个每个人都能轻松创作音乐的未来。不论何时何地,只需几句简短的话语,你就可以... 阅读全文

    优惠 阿里通义千问免费开放1000万字长文档处理功能

  • 阿里通义千问免费开放1000万字长文档处理功能
    AI
  • 阿里通义千问今日升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。  ... 阅读全文

    优惠 大语言模型微调框架Unsloth:简化了语言模型的微调流程,提升模型性能

  • 大语言模型微调框架Unsloth:简化了语言模型的微调流程,提升模型性能
    AI
  • Unsloth是一款引人注目的创新框架,它简化了语言模型的微调流程,并提供了一种直接有效的方法来提升模型性能。该框架与诸如Mistral、Llama 2.0和Gemma等广受欢迎的开源大语言模型(LLM)完美融合,为自然语言处理领域的研究者和实践者提供了一套功能全面的工具集,以满足他们的各种需求。 官网:https:/... 阅读全文

    优惠 实时渲染和编辑复杂三维场景的创新方法Gaussian Frosting

  • 实时渲染和编辑复杂三维场景的创新方法Gaussian Frosting
    AI
  • 这篇论文介绍了一种名为“Gaussian Frosting”的新技术,这是一种用于实时渲染和编辑复杂三维场景的创新方法。想象一下,你有一个由许多小高斯函数(类似云朵形状的数学对象)组成的三维模型,这些高斯函数可以捕捉到场景中的细微细节,比如猫的毛发或草地上的草。Gaussian Frosting技术就是在这些高斯函数的... 阅读全文

    优惠 全新的视觉数学问题解决基准测试MATHVERSE:评估多模态大语言模型在解决涉及图表的视觉数学问题时的表现

  • 全新的视觉数学问题解决基准测试MATHVERSE:评估多模态大语言模型在解决涉及图表的视觉数学问题时的表现
    AI
  • 来自香港中文大学、上海人工智能实验室和加州大学洛杉矶分校的研究人员推出MATHVERSE,这是一个全新的视觉数学问题解决基准测试,专门设计来评估多模态大型语言模型(MLLMs)在解决涉及图表的视觉数学问题时的表现。简单来说,MATHVERSE就像是一个针对数学问题的“视力测试”,但它不仅仅是看模型是否能“看懂”图表,还... 阅读全文

    优惠 如何在生成性语言模型中为用户提供算法追索的机制

  • 如何在生成性语言模型中为用户提供算法追索的机制
    AI
  • 这篇论文探讨了如何在生成性语言模型(Generative Language Models,简称GLMs)中为用户提供算法追索(algorithmic recourse)的机制。所谓算法追索,指的是用户能够对模型的预测或输出进行改变的能力。在GLMs中,这通常涉及到对生成的文本进行毒性过滤,以确保输出内容不会冒犯或伤害用... 阅读全文

    优惠 多模态大语言模型Cobra:提高现有MLLM在处理视觉信息时的效率

  • 多模态大语言模型Cobra:提高现有MLLM在处理视觉信息时的效率
    AI
  • 谷歌发布论文介绍了一个名为Cobra的新型多模态大语言模型(MLLM)。Cobra的设计理念是为了提高现有MLLM在处理视觉信息时的效率。传统的MLLM通常基于Transformer网络结构,这种结构虽然强大,但计算复杂度是二次方的,这意味着处理大量数据时效率较低。Cobra通过整合高效的Mamba语言模型到视觉模态中... 阅读全文

    优惠 个性化视觉语言模型MyVLM:让预训练的VLM能够理解和处理用户特定的概念

  • 个性化视觉语言模型MyVLM:让预训练的VLM能够理解和处理用户特定的概念
    AI
  • 来自特拉维夫大学和SNAP的研究人员推出MyVLM,这是一种个性化视觉语言模型(Vision-Language Model,简称VLM)。MyVLM的目标是让预训练的VLM能够理解和处理用户特定的概念,例如识别图片中的特定人物或物品,并在生成文本描述时包含这些个性化信息。例如,如果你有一张包含你朋友的照片,并想知道你的... 阅读全文

    优惠 Adobe推出新型高保真立体声音码器MusicHiFi

  • Adobe推出新型高保真立体声音码器MusicHiFi
    AI
  • Adobe推出一个名为MusicHiFi的新型高保真立体声音码器(vocoder)。声音码器是一种可以将音乐的图像表示(例如梅尔频谱图)转换为音频波形的技术。现有的大多数声音码器通常只能生成较低分辨率的单声道音频(例如16-24 kHz),这限制了它们的效果。MusicHiFi通过使用一系列生成对抗网络(GANs)来改... 阅读全文

    优惠 Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等

  • Alignment Studio:帮助开发者将大语言模型调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等
    AI
  • 这篇论文介绍了一个名为“Alignment Studio”的系统,它旨在帮助开发者将大型语言模型(LLMs)调整到符合特定上下文规范,例如企业的价值观、社会规范、法律法规等。这个系统特别适用于那些需要根据特定情境调整AI行为的场景,而不是仅仅依赖于模型提供商的通用调整。 介绍和举例说明: 想象一下,你是一家国际公司的I... 阅读全文