AI

优惠 VastGaussian:用于大型场景的高质量重建和实时渲染

  • VastGaussian:用于大型场景的高质量重建和实时渲染
    AI
  • 来自清华大学、华为诺亚方舟实验室、中国科学院的研究人员推出VastGaussian,它用于大型场景的高质量重建和实时渲染。想象一下,你想要创建一个虚拟城市或者重现一个历史遗迹,并且希望这个虚拟场景能够以照片般真实的质量实时显示。VastGaussian就是为了解决这样的挑战而设计的。 项目主页:https://vast... 阅读全文

    优惠 大语言模型在微调(finetuning)过程中的缩放特性

  • 大语言模型在微调(finetuning)过程中的缩放特性
    AI
  • 谷歌研究人员发布论文探讨了大语言模型(LLMs)在微调(finetuning)过程中的缩放特性,特别是在不同因素(如模型大小、预训练数据量、微调参数量和微调数据量)的影响下,微调性能如何变化。研究团队通过系统实验,分析了这些因素对微调效果的影响,并提出了一种新的缩放定律来描述这些关系。 论文地址:https://arx... 阅读全文

    优惠 DCA:帮助大语言模型(LLMs)处理和生成更长文本内容,而不需要额外的训练

  • DCA:帮助大语言模型(LLMs)处理和生成更长文本内容,而不需要额外的训练
    AI
  • 这篇论文介绍了一种名为Dual Chunk Attention(DCA)的新方法,它旨在帮助大语言模型(LLMs)处理和生成更长文本内容,而不需要额外的训练。想象一下,你有一个能够聊天的机器人,但这个机器人在处理很长的对话或者阅读大型PDF文件时就会遇到困难。DCA就是为了解决这个问题而设计的。 论文地址:https:... 阅读全文

    优惠 数据集和基准测试OmniACT:评估虚拟代理在执行计算机任务方面的能力

  • 数据集和基准测试OmniACT:评估虚拟代理在执行计算机任务方面的能力
    AI
  • 这篇论文介绍了一个名为OmniACT的数据集和基准测试,旨在评估虚拟代理在执行计算机任务方面的能力。这些任务包括在桌面和网页应用中执行各种操作,如查看股票价格变化、在租房网站上查找房源、查看特定日期的天气等。OmniACT的目标是生成可执行的程序脚本,以自动化这些任务。 论文地址:https://arxiv.org/a... 阅读全文

    优惠 微软发布论文全面解读OpenAI新模型Sora

  • 微软发布论文全面解读OpenAI新模型Sora
    AI
  • 来自微软和理海大学的研究人员发布论文,基于已经发布的内容和他们自己的逆向工程,全面回顾了 Sora 的背景、相关技术、新兴应用、当前的局限性和未来的机遇。首先,追踪了Sora的开发历程,并深入研究了构建这个“世界模拟器”所使用的基础技术。接着,详细阐述了Sora在多个行业中的应用场景和潜在影响,涵盖电影制作、教育、营销... 阅读全文

    优惠 新型数据集LOCOMO:评估大语言模型(LLMs)在处理非常长期的对话中的记忆能力

  • 新型数据集LOCOMO:评估大语言模型(LLMs)在处理非常长期的对话中的记忆能力
    AI
  • 北卡罗来纳大学教堂山分校、南加州大学、Snap的研究人员推出新型数据集LOCOMO,它专注于评估大语言模型(LLMs)在处理非常长期的对话中的记忆能力。在现有的研究中,对话模型通常只评估在不超过五个聊天会话的上下文中的模型响应。然而,LOCOMO数据集通过模拟真实世界的在线互动,收集了包含多达35个会话、平均每个对话有... 阅读全文

    优惠 如何优化语言模型(LMs)的学习过程,目的是减少达到高性能所需的训练步骤

  • 如何优化语言模型(LMs)的学习过程,目的是减少达到高性能所需的训练步骤
    AI
  • 来自微软的研究人员发布论文探讨了如何优化语言模型(LMs)的学习过程,目的是减少达到高性能所需的训练步骤。研究者们提出了一种理论,用于最佳化LMs的学习,这涉及到最大化数据压缩比,即在“LM训练作为无损压缩”的观点下进行优化。 论文地址:https://arxiv.org/abs/2402.17759 主要功能和特点:... 阅读全文

    优惠 新型大语言模型BitNet b1.58

  • 新型大语言模型BitNet b1.58
    AI
  • 这篇论文介绍了一种新型的大语言模型(LLM),称为BitNet b1.58。这种模型的核心特点是使用了1.58位的参数(或权重),这意味着每个参数只有三种可能的值:-1、0和1。这种设计不仅在保持模型性能的同时显著降低了计算成本,还在内存、延迟、吞吐量和能源消耗方面带来了显著的效益。 论文地址:https://arxi... 阅读全文

    优惠 看图说话!在线工具AI Describe Picture,精准地识别图片中的各种元素

  • 看图说话!在线工具AI Describe Picture,精准地识别图片中的各种元素
    AI
  • AI Describe Picture能够精准地识别图片中的各种元素,支持对图片内容进行深入提问,让图片“说话”。 功能亮点: 用户体验优化:提供直观的上传流程、交云端互动聊天和便捷的社交分享功能,确保无缝的用户体验。 多场景文本提取:应对不同场景的文本提取需求,无论是扫描文档、社交媒体图表还是实物照片,都能轻松应对。... 阅读全文

    优惠 AnimeGenius推出了“Image to Prompt”工具:用 AI 识别图片、轻松生成文字提示词

  • AnimeGenius推出了“Image to Prompt”工具:用 AI 识别图片、轻松生成文字提示词
    AI
  • 在AI绘图的实际操作中,中文使用者时常面临一个难题——由于不擅长用英文描述具体的图像要求,往往难以产出符合期望的图片。针对这一痛点,AnimeGenius推出了“Image to Prompt”工具。用户只需上传图片,该工具便会运用AI技术对图片内容进行深度分析与解读,继而转化成精确的英文标签和提示词,助力用户在其他A... 阅读全文

    优惠 视频作为一种新兴的“语言”,在现实世界决策制定中的应用潜力

  • 视频作为一种新兴的“语言”,在现实世界决策制定中的应用潜力
    AI
  • 这篇论文探讨了视频作为一种新兴的“语言”,在现实世界决策制定中的应用潜力。作者们认为,尽管文本数据在互联网上非常丰富,并且已经在大规模自监督学习中发挥了重要作用,但视频数据同样蕴含着关于物理世界的重要信息,这些信息往往难以用语言来表达。视频不仅包含了丰富的视觉和空间信息,还能捕捉物理动态、行为动作等,这些都是文本难以完... 阅读全文

    优惠 开发者打造苹果专属大模型运行工具Chat with MLX

  • 开发者打造苹果专属大模型运行工具Chat with MLX
    AI
  • 开发者受到英伟达Chat with RTX启发,专为苹果Silicon系列处理器的电脑打造了一款本地大模型运行工具Chat with MLX,此工具自动下载本地模型,并且可以同本地文件进行交互,支持多种语言,包括英语、西班牙语、中文和越南语。该项目的一个关键特点是易于集成,用户可以轻松集成任何HuggingFace和M... 阅读全文