大语言模型

优惠 对大语言模型和多模态大语言模型进行所谓的“越狱攻击”(jailbreak attacks)的安全性评估

  • 对大语言模型和多模态大语言模型进行所谓的“越狱攻击”(jailbreak attacks)的安全性评估
    AI
  • 这篇论文的主题是关于对大型语言模型(LLMs)和多模态大型语言模型(MLLMs)进行所谓的“越狱攻击”(jailbreak attacks)的安全性评估。想象一下,你有一个非常听话的机器人,你告诉它做什么它就会做什么,但是这个机器人有一些内置的安全规则,防止它做出有害的行为。然而,有些人可能会尝试欺骗这个机器人,让它做... 阅读全文

    优惠 网络浏览自动化工具AutoWebGLM:通过学习和模仿人类的浏览行为,能够在互联网上高效地完成各种复杂的任务

  • 网络浏览自动化工具AutoWebGLM:通过学习和模仿人类的浏览行为,能够在互联网上高效地完成各种复杂的任务
    AI
  • 智谱AI和清华大学的研究人员推出智能网络导航代理AutoWebGLM,这是一个强大的网络浏览自动化工具,它通过学习和模仿人类的浏览行为,能够在互联网上高效地完成各种复杂的任务。想象一下,有一个虚拟助手,它能够像人类一样在互联网上浏览网页,帮助我们完成各种任务,比如搜索信息、购物、阅读新闻等。AutoWebGLM就是这样... 阅读全文

    优惠 在神经压缩文本上训练大语言模型(LLMs)的方法

  • 在神经压缩文本上训练大语言模型(LLMs)的方法
    AI
  • 谷歌DeepMind和Anthropic发布论文探讨了直接在神经压缩文本上训练大语言模型(LLMs)的方法。想象一下,你有一个能读懂和生成文本的智能系统,但现在我们想让这个系统更加高效,不仅能处理更多信息,还能更快地学习和生成文本。为了实现这一点,研究者们尝试了一种新的方法,即在文本被压缩成更小的体积后,直接在这个压缩... 阅读全文

    优惠 交互式工具LVLM-Interpret:旨在帮助人们更好地理解和解释大型视觉-语言模型(LVLM)的内部工作机制

  • 交互式工具LVLM-Interpret:旨在帮助人们更好地理解和解释大型视觉-语言模型(LVLM)的内部工作机制
    AI
  • 来自英特尔实验室和微软亚洲的研究人员推出交互式工具LVLM-Interpret,它旨在帮助人们更好地理解和解释大型视觉-语言模型(LVLM)的内部工作机制。想象一下,你正在使用一个能够同时处理图像和文本的智能系统,你可能想知道这个系统是如何得出特定答案的。LVLM-Interpret就是用来揭示这些模型背后的逻辑和决策... 阅读全文

    优惠 专门设计用于视频理解!多模态大语言模型MiniGPT4-Video

  • 专门设计用于视频理解!多模态大语言模型MiniGPT4-Video
    AI
  • 来自阿卜杜拉国王科技大学和哈佛大学推出多模态大语言模型MiniGPT4-Video,它专门设计用于视频理解,它通过结合视觉和文本数据,能够有效地理解和回应视频中的信息,为视频内容的智能分析和交互提供了新的可能性。想象一下,你在看一个视频,想要一个智能系统不仅能理解视频中的图像内容,还能理解视频中的文字对话。MiniGP... 阅读全文

    优惠 Cohere推出大语言模型Command R+:专为企业级工作负载设计,优化了高级检索增强生成(RAG)功能

  • Cohere推出大语言模型Command R+:专为企业级工作负载设计,优化了高级检索增强生成(RAG)功能
    AI
  • Cohere推出了大型语言模型Command R+。专为企业级工作负载设计,优化了高级检索增强生成(RAG)功能,以减少错误生成,并支持10种关键语言的多语言覆盖。 以下是官方介绍全文翻译: Command R+是一款经过RAG优化的尖端模型,专门设计用于处理企业级工作负载,并首先在Microsoft Azure平台上... 阅读全文

    优惠 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths(MoD)”

  • 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths(MoD)”
    AI
  • 谷歌推出新型的基于Transformer的语言模型“Mixture-of-Depths”(MoD),它能够动态地在模型的不同层之间分配计算资源。传统的变换器模型在处理输入序列时,对每个标记(token)都均匀地分配计算资源。然而,并非所有的标记都需要相同的计算量来准确预测结果。MoD模型通过学习动态地决定哪些标记需要更... 阅读全文

    优惠 新型框架THINK-AND-EXECUTE:旨在提高大语言模型在算法推理任务上的表现

  • 新型框架THINK-AND-EXECUTE:旨在提高大语言模型在算法推理任务上的表现
    AI
  • 来自韩国的研究人员推出新型框架THINK-AND-EXECUTE,旨在提高大语言模型(LLMs)在算法推理任务上的表现。算法推理是指理解问题背后的复杂模式,并将其分解为一系列推理步骤以找到解决方案的能力。这种能力对于语言模型来说是一个挑战,因为它们需要将复杂的推理模式转化为一系列详细的步骤。总的来说,THINK-AND... 阅读全文

    优惠 智谱AI推出ChatGLM-Math:提升大语言模型在解决数学问题方面的能力

  • 智谱AI推出ChatGLM-Math:提升大语言模型在解决数学问题方面的能力
    AI
  • 智谱AI推出ChatGLM-Math,提升大语言模型(LLMs)在解决数学问题方面的能力。想象一下,你有一个超级聪明的机器人助手,它可以和人类一样理解和使用语言,但是当你给它一些数学题目时,它却常常束手无策或者给出错误的答案。这篇论文就是想解决这个问题,让机器人助手不仅能聊天,还能帮你解决数学题。这项研究的目标是让语言... 阅读全文

    优惠 元象首个MoE大模型XVERSE-MoE-A4.2B开源:4.2B激活参数,效果堪比13B模型

  • 元象首个MoE大模型XVERSE-MoE-A4.2B开源:4.2B激活参数,效果堪比13B模型
    AI
  • 元象发布XVERSE-MoE-A4.2B大模型 ,采用业界最前沿的混合专家模型架构,激活参数4.2B,效果即可达到13B模型水准。据介绍,XVERSE-MoE-A4.2B实现了极致压缩,相比XVERSE-13B-2仅用30%计算量,并减少50%训练时间。在多个权威评测中,元象MoE效果大幅超越Gemma-7B、Mist... 阅读全文

    优惠 langchain-extract:使用大语言模型(LLMs)从文本和文件中提取信息

  • langchain-extract:使用大语言模型(LLMs)从文本和文件中提取信息
    AI
  • langchain-extract 是一个简单的网络服务器,它允许您使用大型语言模型(LLMs)从文本和文件中提取信息。该服务器基于 FastAPI、LangChain 和 Postgresql 构建。后端设计紧密遵循提取用例的文档,并提供了一个参考应用实现,帮助用户利用 LLMs 进行数据提取操作。这个仓库旨在作为构... 阅读全文

    优惠 开源的OpenAI API 非官方 Go 客户端Go OpenAI

  • 开源的OpenAI API 非官方 Go 客户端Go OpenAI
    AI
  • Go OpenAI是一个开源的OpenAI API 非官方 Go 客户端,目前支持: ChatGPT GPT-3, GPT-4 DALL·E 2 Whisper... 阅读全文