AI

优惠 “零样本(Zero-Shot)”泛化:多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力

  • “零样本(Zero-Shot)”泛化:多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力
    AI
  • 来自图宾根大学、剑桥大学、牛津大学和谷歌 Deepmind的研究人员发布论文探讨多模态模型在没有经过特定训练的情况下,对新概念的识别和图像生成能力,这种现象被称为“零样本”泛化。研究者们想知道这些模型在预训练数据集中接触到的概念频率如何影响它们在下游任务中的表现。这项研究揭示了多模态模型在处理不常见概念时的局限性,并提... 阅读全文

    优惠 拥有20亿参数的中文大语言模型“Chinese Tiny LLM(CT-LLM)”:为了更好地理解和处理中文而特别设计

  • 拥有20亿参数的中文大语言模型“Chinese Tiny LLM(CT-LLM)”:为了更好地理解和处理中文而特别设计
    AI
  • 来自多模态艺术投影研究共同体、复旦大学、北京大学、上海交通大学、香港科技大学、滑铁卢大学、快手公司和矢量研究所的研究人员推出中文大语言模型“Chinese Tiny LLM”(CT-LLM),这是一个拥有20亿参数的语言模型,这个模型是为了更好地理解和处理中文而特别设计的,它在训练过程中主要使用了中文文本数据,同时也包... 阅读全文

    优惠 CantTalkAboutThis:如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性

  • CantTalkAboutThis:如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性
    AI
  • 英伟达发布CantTalkAboutThis,如何让大语言模型(比如聊天机器人)在对话中保持话题的连贯性和相关性。总的来说,这项工作提出了一种新的方法来提高语言模型在对话中保持话题相关性的能力,这对于开发能够有效、安全地与用户互动的聊天机器人和虚拟助手至关重要。 例如,你在和一个在线客服聊天,想要解决一个特定的问题,比... 阅读全文

    优惠 如何利用大语言模型来提升人们的社交技能

  • 如何利用大语言模型来提升人们的社交技能
    AI
  • 来自斯坦福大学和乔治亚理工学院发布论文探讨如何利用大语言模型(LLMs)来提升人们的社交技能。社交技能,比如解决冲突的能力,对于我们在工作和生活中有效沟通和成功至关重要。但是,大多数人很难找到练习这些技能的环境。论文提出了一个解决方案,通过一个名为“AI伙伴”和“AI导师”的框架,结合体验式学习和实时反馈,来帮助人们提... 阅读全文

    优惠 三维场景重建“鲁棒高斯点渲染(3DGS)”:从手持设备拍摄的照片中重建出高质量的三维场景成为可能

  • 三维场景重建“鲁棒高斯点渲染(3DGS)”:从手持设备拍摄的照片中重建出高质量的三维场景成为可能
    AI
  • Meta发布新技术“鲁棒高斯点渲染”(Robust Gaussian Splatting,简称3DGS),这是一种用于三维场景重建的方法。想象一下,你有一系列从不同角度拍摄的照片,你想通过这些照片来重建一个三维模型。3DGS技术就是帮助我们从这些二维图像中恢复出三维信息的一种工具。总的来说,这项技术通过提高对实际拍摄数... 阅读全文

    优惠 通义千问开源320亿参数模型Qwen1.5-32B

  • 通义千问开源320亿参数模型Qwen1.5-32B
    AI
  • 阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,例如相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。迄今通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。基础能力方面,通义千问320亿参数模型在MMLU、GSM8K... 阅读全文

    优惠 谷歌推出Gemma 1.1版本,提高多轮对话质量

  • 谷歌推出Gemma 1.1版本,提高多轮对话质量
    AI
  • 谷歌于4月6日推出了开源模型Gemma的新版本Gemma 1.1,包括7B和2B两个版本。Gemma 1.1使用新的RLHF方法进行训练,在质量、编码能力、真实性、指令遵循和多轮对话质量方面取得了显着的进步。谷歌还修复了多轮对话中的一个错误,并确保模型响应并不总是以“Sure”开头。... 阅读全文

    优惠 开源的UI设计工具OpenUI,基于大语言模型

  • 开源的UI设计工具OpenUI,基于大语言模型
    AI
  • 构建UI组件,对于许多开发者来说,可能是一个既耗时又耗力的过程。但有了OpenUI,这一切都将变得轻松有趣、迅速且灵活! 在W&B,我们积极利用OpenUI来测试和原型设计下一代工具。这些工具将基于LLM,帮助我们构建出功能强大的应用程序,为用户带来更好的体验。 OpenUI的独特之处在于,它允许您充分发挥自己... 阅读全文

    优惠 低代码平台Langflow:用于构建从基础到复杂的AI应用

  • 低代码平台Langflow:用于构建从基础到复杂的AI应用
    AI
  • Langflow是一种简单而高效的方式,用于构建从基础到复杂的AI应用。它作为一个低代码平台,让您能够轻松地将AI集成到日常工作中。Langflow采用动态图的设计,每个节点都是一个可执行的单元。其模块化和交互式的特点,促进了快速实验和原型制作,从而极大地拓展了创意的边界。... 阅读全文

    优惠 基于深度文档理解构建的开源 RAG引擎RAGFlow

  • 基于深度文档理解构建的开源 RAG引擎RAGFlow
    AI
  • RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。 🌟 主要功能 🍭 "Qual... 阅读全文

    优惠 gpt-author:结合了GPT-4、Stable Diffusion和Anthropic API调用,从而生成了一部独具匠心的奇幻小说

  • gpt-author:结合了GPT-4、Stable Diffusion和Anthropic API调用,从而生成了一部独具匠心的奇幻小说
    AI
  • gpt-author这个项目巧妙地结合了GPT-4、Stable Diffusion和Anthropic API调用,从而生成了一部独具匠心的奇幻小说。用户只需输入一个初始提示和期望的章节数,AI便能迅速创作出一部完整的小说,并以EPUB格式输出,完美兼容电子书阅读器。更令人惊喜的是,仅需4美元的成本,AI便能在几分钟... 阅读全文

    优惠 Open-Sora-Plan v1.0.0正式推出,大幅度提高了视频生成质量和文本控制能力

  • Open-Sora-Plan v1.0.0正式推出,大幅度提高了视频生成质量和文本控制能力
    AI
  • 由北大-兔展AIGC联合实验室共同发起Open-Sora计划,目标是复现OpenAI的Sora模型。该计划通过结合视频VQ-VAE、Denoising Diffusion Transformer和条件编码器等关键技术组件,以实现Sora模型的核心功能。目前已经推出Open-Sora-Plan v1.0.0模型,大幅度提... 阅读全文