AI
优惠 Tactile-Informed 3DGS:结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成
8个月前 (04-01)AI
来自布里斯托大学、谷歌和英伟达的研究人员推出Tactile-Informed 3DGS,它结合了视觉数据和触觉传感信息,用于重建复杂表面的3D模型并进行新视角的合成。这项技术特别适用于处理具有光泽和反射性的表面,因为传统的3D重建方法在处理这类表面时往往会遇到困难。例如,想象一个考古学家正在研究一件古老的金属制品,他们... 阅读全文
优惠 新型深度学习架构MambaMixer,专门设计用于高效处理长序列数据
标签:MambaMixer
AI
8个月前 (04-01)AI
这篇论文介绍了一种名为MambaMixer的新型深度学习架构,它专门设计用于高效处理长序列数据。MambaMixer的核心特点是它能够在数据中选择性地混合(mix)和过滤(filter)信息,无论是在时间序列还是图像数据中。这种选择性的能力是通过所谓的“双选择机制”实现的,即同时在数据的“tokens”(类似于序列中的... 阅读全文
优惠 OPPO发布推出Transformer-Lite:如何在智能手机上高效部署大语言模型
8个月前 (04-01)AI
OPPO发布推出Transformer-Lite,探讨如何在智能手机上高效部署大语言模型(LLM)。大语言模型是一种人工智能技术,广泛应用于智能助手、文本摘要、翻译和多模态任务等。然而,由于这些模型通常需要大量的计算能力和内存带宽,因此在移动设备上直接部署这些模型会面临一些挑战,比如速度慢和用户体验差。例如,想象一下你... 阅读全文
优惠 阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务
标签:OMNIPARSER
AI
8个月前 (03-31)AI
阿里推出视觉识别统一框架OMNIPARSER,它能够处理文本识别、关键信息提取和表格识别等任务,OmniParser是阿里读光项目的一部分,目标让AI在阅读、思考和创造上超越人类。想象一下,你有一个扫描的文档或者一张包含文字的图片,你想要从中提取出有用的信息,比如某个表格的数据或者文档中的关键信息。OMNIPARSER... 阅读全文