人工智能

优惠 Tactile-Informed 3DGS:结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成

  • Tactile-Informed 3DGS:结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成
    AI
  • 来自布里斯托大学、谷歌和英伟达的研究人员推出Tactile-Informed 3DGS,它结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成。这项技术特别适用于处理具有光泽和反射性的表面,因为传统的3D重建方法在处理这类表面时往往会遇到困难。例如,想象一个考古学家正在研究一件古老的金属制品,他们... 阅读全文

    优惠 A21推出新型大型语言模型Jamba:结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术

  • A21推出新型大型语言模型Jamba:结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术
    AI
  • A21推出新型大型语言模型Jamba,它基于一种创新的混合架构,结合了Transformer和Mamba(一种状态空间模型)以及专家混合(Mixture-of-Experts,MoE)技术。Jamba的设计旨在充分利用这三种技术的优势,以提高性能、提升吞吐量,并保持较低的内存占用。例如,想象一个场景,用户需要一个AI助... 阅读全文

    优惠 谷歌推出新型文本嵌入模型Gecko:从大语言模型(LLMs)中提取知识,以提高文本检索的性能

  • 谷歌推出新型文本嵌入模型Gecko:从大语言模型(LLMs)中提取知识,以提高文本检索的性能
    AI
  • Google DeepMind推出新型文本嵌入模型Gecko,它的设计目的是从大语言模型(LLMs)中提取知识,以提高文本检索的性能。文本嵌入模型可以将文本数据转换为密集的向量形式,这样语义上相似的文本在嵌入空间中就会彼此靠近。这种模型广泛应用于文档检索、句子相似性比较、分类和聚类等任务。例如,假设用户在搜索引擎中输入... 阅读全文

    优惠 华为推出新型高效大语言模型DiJiang:减少传统Transformer模型在处理长序列数据时所需的计算资源

  • 华为推出新型高效大语言模型DiJiang:减少传统Transformer模型在处理长序列数据时所需的计算资源
    AI
  • 华为推出新型高效大语言模型DiJiang,DiJiang的核心目标是减少传统Transformer模型在处理长序列数据时所需的计算资源。Transformer模型在自然语言处理(NLP)领域取得了巨大成功,但其注意力机制(attention mechanism)需要大量的计算资源,尤其是在处理大量参数的大型语言模型时。... 阅读全文

    优惠 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据

  • 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据
    AI
  • 这篇论文介绍了一种名为MambaMixer的新型深度学习架构,它专门设计用于高效处理长序列数据。MambaMixer的核心特点是它能够在数据中选择性地混合(mix)和过滤(filter)信息,无论是在时间序列还是图像数据中。这种选择性的能力是通过所谓的“双选择机制”实现的,即同时在数据的“tokens”(类似于序列中的... 阅读全文

    优惠 OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型

  • OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型
    AI
  • OPPO发布推出Transformer-Lite,探讨如何在智能手机上高效部署大语言模型(LLM)。大语言模型是一种人工智能技术,广泛应用于智能助手、文本摘要、翻译和多模态任务等。然而,由于这些模型通常需要大量的计算能力和内存带宽,因此在移动设备上直接部署这些模型会面临一些挑战,比如速度慢和用户体验差。例如,想象一下你... 阅读全文

    优惠 关于语言模型如何记忆和复述其训练数据中的整段文本

  • 关于语言模型如何记忆和复述其训练数据中的整段文本
    AI
  • 谷歌发布论文的主题是关于语言模型如何记忆和复述其训练数据中的整段文本。具体来说,研究者们探索了语言模型在处理和记忆长文本段落时的内部机制和权重分布。他们发现,尽管记忆过程涉及模型的多个层级和组件,但记忆段落的梯度(即模型在学习过程中调整权重的依据)在较低层级中更为显著。例如,如果我们有一个聊天机器人,我们可能不希望它直... 阅读全文

    优惠 阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务

  • 阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务
    AI
  • 阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务,OmniParser是阿里读光项目的一部分,目标让AI在阅读、思考和创造上超越人类。想象一下,你有一个扫描的文档或者一张包含文字的图片,你想要从中提取出有用的信息,比如某个表格的数据或者文档中的关键信息。OMNIPARSER... 阅读全文

    优惠 致力于复刻全球首位AI软件工程师Devin的开源项目OpenDevin

  • 致力于复刻全球首位AI软件工程师Devin的开源项目OpenDevin
    AI
  • OpenDevin是一个致力于复刻全球首位AI软件工程师Devin的开源项目,一位能够执行复杂工程任务并积极参与软件开发项目、与用户协同工作的自主AI软件工程师。本项目将借助开源社区的力量,力求复制Devin的功能,并在其基础上进行增强与创新。... 阅读全文

    优惠 数据框架LlamaIndex:专为基于LLM(大型语言模型)的应用程序而设计

  • 数据框架LlamaIndex:专为基于LLM(大型语言模型)的应用程序而设计
    AI
  • LlamaIndex是一个数据框架,专为基于LLM(大型语言模型)的应用程序而设计,这些应用程序可以通过上下文增强技术提升性能。这种采用检索增强生成(Retrieval-Augmented Generation)技术的LLM系统被称为RAG系统。LlamaIndex提供了必要的抽象方法,使得用户能够更轻松地摄取、组织并... 阅读全文

    优惠 受Perplexity启发的开源AI搜索引擎llm-answer-engine

  • 受Perplexity启发的开源AI搜索引擎llm-answer-engine
    AI
  • llm-answer-engine是一个受Perplexity启发的开源项目,使用Next.js、Groq、Mixtral、Langchain、OpenAI、Brave以及Serper等技术构建一个搜索引擎。该项目旨在基于用户查询,高效地提供相关的来源、答案、图像、视频以及后续问题。  ... 阅读全文

    优惠 全自动人工智能代理codel

  • 全自动人工智能代理codel
    AI
  • codel是一款能够使用终端、浏览器和编辑器执行复杂任务和项目的全自动人工智能代理。 特性: 🔓 安全可靠。所有操作都在沙箱化的Docker环境中运行。 🤖 高度自主。自动检测下一步操作并执行。 🔍 内置浏览器。如有需要,可从网络获取最新信息(如教程、文档等)。 📙 内置文本编辑器。直接在浏览器中查看所有修改过的文件。... 阅读全文