推荐类别

栏目分类

优惠 百度发布智能代码助手”文心快码”,助力开发者提升效率

  • 百度发布智能代码助手”文心快码”,助力开发者提升效率
    AI
  • 在今日的百度WAVE SUMMIT深度学习开发者大会上,百度推出了其智能代码助手——文心快码(Baidu Comate)。这一工具基于百度的文心大模型,结合了百度多年积累的编程数据和开源数据,旨在通过"帮你想、帮你写、帮你改"的方式,提升编程效率和质量。 产品优势: 更懂研发知识:加速开发速度。 更懂研发全流程:加快业... 阅读全文

    优惠 知乎推出AI搜索产品“知乎直答”,支持提问、搜索等功能

  • 知乎推出AI搜索产品“知乎直答”,支持提问、搜索等功能
    AI
  • 知乎,中国领先的问答社区,今天宣布正式发布其全新的AI产品——“知乎直答”。这标志着知乎在AI搜索领域的功能正式产品化,并拥有了自己的独立域名和服务入口。用户现在可以通过「zhida.ai」域名在PC端体验这一服务。 “知乎直答”利用知乎平台丰富的真实问答数据,通过AI技术为用户提供两种答案生成方式:“简略”和“深入”... 阅读全文

    优惠 动态激活组合Dyn:用于在生成过程中动态调整一个或多个属性的引导强度

  • 动态激活组合Dyn:用于在生成过程中动态调整一个或多个属性的引导强度
    AI
  • 米兰比可卡大学和格罗宁根大学的研究人员推出Dyn(动态激活组合,Dynamic Activation Composition),用于在生成过程中动态调整一个或多个属性的引导强度。如何有效地控制和引导大型语言模型(LLMs)的生成过程,以确保输出符合特定的属性要求,同时保持语言的流畅性。通过这种方式,Dyn方法能够在确保... 阅读全文

    优惠 跨模态基准测试SIUO:训练和评估AI模型,使其能够正确处理这种复杂的跨模态安全问题

  • 跨模态基准测试SIUO:训练和评估AI模型,使其能够正确处理这种复杂的跨模态安全问题
    AI
  • 复旦大学和新加坡国立大学的研究人员推出跨模态基准测试SIUO,如何确保当人工智能(尤其是具有视觉和语言能力的大模型,即LVLMs)在处理跨模态(例如图像和文本)输入时,其输出是安全和符合道德的。随着人工智能在人类生活中越来越普及,这项研究的重要性日益凸显。 项目主页:https://sinwang20.github.i... 阅读全文

    优惠 新技术GRASS:用于训练大语言模型的高效优化方法

  • 新技术GRASS:用于训练大语言模型的高效优化方法
    AI
  • 卡内基梅隆大学的研究团队推出新技术GRASS(GRAdient Structured Sparsification),它是一种用于训练大语言模型(LLMs)的高效优化方法。GRASS的核心在于利用结构化稀疏梯度来减少训练过程中所需的内存和计算资源,从而提高训练大型语言模型的效率和可扩展性。论文还提到了GRASS的一些实... 阅读全文

    优惠 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力

  • 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力
    AI
  • 韩国科学技术研究院和首尔国立大学推出实时对话模拟器DialSim,它专门用来评估对话代理(也就是我们通常所说的聊天机器人或者智能助手)在长期对话中的理解和应对能力。想象一下,如果你的智能助手不仅能够流畅地回答你的问题,还能够记住之前的对话内容,并在多天甚至更长时间的对话中保持话题的连贯性,那么这个助手的智能程度就相当高... 阅读全文

    优惠 新型文本句子分割模型SAT:将一大块文本分解成单独的句子

  • 新型文本句子分割模型SAT:将一大块文本分解成单独的句子
    AI
  • 这篇论文介绍了一个名为“Segment Any Text (SAT)”的新型文本句子分割模型。句子分割是自然语言处理(NLP)中的一个基础任务,目的是将一大块文本分解成单独的句子。这项技术对于很多应用来说都非常关键,比如机器翻译、文本摘要、情感分析等。SAT模型在多个数据集上进行了评估,包括不同语言和领域的文本,表现出... 阅读全文

    优惠 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计

  • 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计
    AI
  • Salesforce AI Research推出APIGen系统,它是一个自动化的数据生成管道,专门为生成可验证、多样化的函数调用数据集而设计。这个系统的目标是提高函数调用代理模型(一种人工智能模型)的性能,这些模型能够根据自然语言指令执行API(应用程序编程接口)调用。使用APIGen生成的数据集训练的模型,在Ber... 阅读全文

    优惠 新型多模态大语言模型MG-LLaVA

  • 新型多模态大语言模型MG-LLaVA
    AI
  • 上海交通大学、上海人工智能实验室和南洋理工大学的研究人员推出新型多模态大语言模型MG-LLaVA,它在视觉理解任务上取得了显著的进步。例如,你有一个能够“看”图片和“读”文字的智能助手,但以前的这种助手只能处理低分辨率的图片,这限制了它们理解细节的能力。MG-LLaVA通过增加多粒度视觉处理能力,比如低分辨率、高分辨率... 阅读全文

    优惠 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题

  • 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题
    AI
  • 香港大学 、中国科学院信息与通信技术研究所、香港中文大学深圳分校、清华大学、爱丁堡大学、英伟达和香港科技大学的研究人员推出新方法MIGU(基于幅度的梯度更新,用于持续学习),旨在解决语言模型(LMs)在持续学习(Continual Learning, CL)中面临的灾难性遗忘问题。灾难性遗忘是指模型在学习新知识时会遗忘... 阅读全文

    优惠 YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型

  • YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型
    AI
  • 德克萨斯大学奥斯汀分校和马萨诸塞大学阿默斯特分校的研究人员推出创新方法YOUDREAM,它能够根据文本描述生成高质量、解剖学上可控且一致的3D动物模型。YOUDREAM是一个强大的工具,它结合了文本描述、3D姿态控制和先进的神经网络技术,为3D内容创造提供了一个既灵活又准确的解决方案。 项目主页:https://you... 阅读全文

    优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb

  • Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
    AI
  • Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?