大语言模型

优惠 通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量

  • 通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量
    AI
  • 清华大学计算机科学与技术系的研究人员发布论文,论文的主题是探讨如何通过对比性微调(contrastive fine-tuning)来提升小型语言模型的文本嵌入(text embeddings)质量。文本嵌入是一种将文本转换为向量表示的技术,这些向量能够捕捉文本的语义信息,使得机器能够更好地理解自然语言。 GitHub:... 阅读全文

    优惠 新型音乐理解模型FUTGA:通过时间增强的生成增强技术,提升了对音乐细节的理解和描述能力

  • 新型音乐理解模型FUTGA:通过时间增强的生成增强技术,提升了对音乐细节的理解和描述能力
    AI
  • 加州大学圣地亚哥分校和加州大学洛杉矶分校的研究人员推出新型音乐理解模型FUTGA,它通过时间增强的生成增强技术,提升了对音乐细节的理解和描述能力。这项技术对于音乐行业来说非常重要,因为它可以帮助自动生成音乐描述、改进音乐检索和生成等应用。例如,你正在制作一个视频,需要一段与视频主题相匹配的背景音乐。使用FUTGA,你可... 阅读全文

    优惠 计算机视觉模型VSSD:通过改进状态空间模型(SSMs)来提高处理长序列数据的能力,同时保持了对全局信息的接收能力

  • 计算机视觉模型VSSD:通过改进状态空间模型(SSMs)来提高处理长序列数据的能力,同时保持了对全局信息的接收能力
    AI
  • 香港城市大学、天津大学和悉尼大学的研究人员推出新型的计算机视觉模型VSSD,它通过改进状态空间模型(SSMs)来提高处理长序列数据的能力,同时保持了对全局信息的接收能力。这项技术为计算机视觉领域提供了一种新的高效方法,特别是在需要处理大量视觉数据和长序列信息的场景中。 例如,你有一个包含城市街景的图像数据集,需要自动地... 阅读全文

    优惠 自动化的视频字幕生成框架Wolf

  • 自动化的视频字幕生成框架Wolf
    AI
  • 英伟达、加州大学伯克利分校、麻省理工学院、德州奥斯汀分校、多伦多大学和斯坦福大学的研究人员推出一个用于视频字幕生成的世界摘要框架Wolf,Wolf是一个自动化的视频字幕生成框架,它采用了一种专家混合的方法,利用视觉语言模型(VLMs)的互补优势,通过结合图像和视频模型,捕获不同级别的信息,并高效地进行摘要。这项技术为视... 阅读全文

    优惠 用于评估交互式编程智能体的基准测试环境AppWorld

  • 用于评估交互式编程智能体的基准测试环境AppWorld
    AI
  • 石溪大学、艾伦人工智能研究所和萨尔大学的研究人员推出一个名为AppWorld的框架,这是一个用于评估交互式编程智能体的基准测试环境。AppWorld框架包括一个AppWorld Engine和一个AppWorld Benchmark。这项技术为开发能够处理复杂任务的智能体提供了一个强大的测试平台,推动了交互式编程智能体... 阅读全文

    优惠 苹果推出全面基准测试MMAU:评估大语言模型作为智能代理在多个领域的能力

  • 苹果推出全面基准测试MMAU:评估大语言模型作为智能代理在多个领域的能力
    AI
  • 苹果推出全面基准测试MMAU(Massive Multitask Agent Understanding),它用于评估大语言模型(LLMs)作为智能代理在多个领域的能力。MMAU通过一系列精心设计的任务,来测试和分析这些模型在理解、推理、规划、解决问题和自我修正等关键能力上的表现。 例如,我们想测试一个语言模型在解决数... 阅读全文

    优惠 开源AI 搜索引擎框架MindSearch (思·索):模仿人类的思维方式来执行网络信息搜索和整合任务

  • 开源AI 搜索引擎框架MindSearch (思·索):模仿人类的思维方式来执行网络信息搜索和整合任务
    AI
  • MindSearch (思·索)是一个开源的 AI 搜索引擎框架,具有与 Perplexity.ai Pro 相同的性能。您可以轻松部署它来构建您自己的搜索引擎,可以使用闭源 LLM(如 GPT、Claude)或开源 LLM(如 InternLM2.5-7b-chat)。其拥有以下特性: 🤔 任何想知道的问题:Mind... 阅读全文

    优惠 专为东南亚语言量身定制的新型大语言模型系列SeaLLMs

  • 专为东南亚语言量身定制的新型大语言模型系列SeaLLMs
    AI
  • 阿里巴巴推出新型大型语言模型系列SeaLLMs(Southeast Asian Large Language Models),它们专为东南亚语言量身定制,以解决现有语言模型在处理资源较少和区域性语言时的偏见和不足。总的来说,SeaLLMs是一组先进的语言模型,它们能够理解和生成东南亚语言的文本,为这些语言的使用者提供了... 阅读全文

    优惠 NCF-SciBERT:追踪学术论文来源的推荐系统模型,自动化地识别给定学术论文中的关键参考文献

  • NCF-SciBERT:追踪学术论文来源的推荐系统模型,自动化地识别给定学术论文中的关键参考文献
    AI
  • 中国石油大学的研究人员推出一种用于追踪学术论文来源的推荐系统模型,名为“文本驱动的神经协同过滤模型”(Text-Driven Neural Collaborative Filtering Model),简称NCF-SciBERT。这个模型的目的是自动化地识别给定学术论文中的关键参考文献,这对于理解学术领域的知识结构和学... 阅读全文

    优惠 新型开源多智能体数据分析系统LAMBDA

  • 新型开源多智能体数据分析系统LAMBDA
    AI
  • 香港理工大学的研究人员推出新型开源多智能体数据分析系统LAMBDA,LAMBDA的核心思想是利用大语言模型(LLMs)的能力,通过自然语言交互来解决复杂的数据驱动应用中的数据分析挑战。简单来说,LAMBDA就是一个能够理解人类语言并执行数据分析任务的智能系统。 项目主页:https://www.polyu.edu.hk... 阅读全文

    优惠 多智能体模拟平台AgentScope:应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性

  • 多智能体模拟平台AgentScope:应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性
    AI
  • 阿里巴巴和中国人民大学的研究团队推出多智能体模拟平台AgentScope,它是为了应对大规模智能体模拟中的一些挑战而设计的,比如可扩展性、效率、智能体多样性以及管理过程的复杂性。AgentScope平台利用了大语言模型(LLMs)的能力,使得智能体能够理解、生成和与人类语言交互,进而在模拟环境中执行任务。 项目主页:h... 阅读全文

    优惠 课程修正(course-correction):提高大语言模型在生成有害内容时的自我纠正能力

  • 课程修正(course-correction):提高大语言模型在生成有害内容时的自我纠正能力
    AI
  • 清华大学、中南大学、阿里巴巴集团、蚂蚁集团和南洋理工大学的研究人员发布论文,论文的主题是关于如何提高大语言模型(LLMs)在生成有害内容时的自我纠正能力,也就是所谓的“课程修正”(course-correction)。这是指模型在开始生成有害内容后,能够自主地转变方向,避免继续产生不当内容。 GitHub:https:... 阅读全文