大语言模型
优惠 Beyond Scaling Laws:探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态
6个月前 (05-20)AI
华为发布论文探讨Transformer模型在语言处理任务中的表现,特别是它们在记忆训练样本时的性能动态。论文提出了一个理论框架,用于解释基于Transformer的语言模型的记忆力过程和性能表现。研究的核心问题是,为什么增加Transformer模型的大小并不总是导致性能提升,以及这些模型是如何通过记忆训练样本来提高泛... 阅读全文
优惠 华为诺亚方舟实验室推出轻量级视频理解网络SqueezeTime:专为移动设备上的视频理解任务设计
标签:SqueezeTime
AI
6个月前 (05-20)AI
华为诺亚方舟实验室推出一种新型的轻量级视频理解网络SqueezeTime,专为移动设备上的视频理解任务设计。在移动设备上进行视频分析面临着计算能力和内存的严格限制,而传统的视频理解方法,如3D卷积网络,通常需要大量的计算和内存资源,不适合在移动设备上运行。总的来说,SqueezeTime为移动设备上的视频理解提供了一种... 阅读全文
优惠 小多科技推出新型多模态视觉语言模型Xmodel-VLM
标签:Xmodel-VLM小多科技
AI
6个月前 (05-20)AI
小多科技推出新型多模态视觉语言模型Xmodel-VLM,这个模型的主要目标是为了在消费级GPU服务器上高效部署,解决大规模多模态系统由于高昂的服务成本而难以广泛采用的关键行业问题。例如,我们有一个智能助手,它可以看图片,理解文字,然后用自然语言和我们交流。这个助手就像是电影里的“贾维斯”(J.A.R.V.I.S.),但... 阅读全文
优惠 Many-Shot ICL:多模态基础模型在多示例情境学习中的性能
标签:Many-Shot ICL
AI
6个月前 (05-20)AI
斯坦福大学的研究团队发布论文探索多模态基础模型在多示例情境学习(Many-Shot In-Context Learning,简称Many-Shot ICL)中的性能。多模态基础模型是指能够处理和理解多种类型数据(如文本、图像等)的大型AI模型。而多示例情境学习是指在模型的输入上下文中提供多个示例,以便模型能够在没有额外... 阅读全文
优惠 screenshot-to-code:利用AI将屏幕截图、设计原型及Figma设计稿转化为干净、实用的代码
6个月前 (05-20)AI
screenshot-to-code是一款简易工具,利用AI将屏幕截图、设计原型及Figma设计稿转化为干净、实用的代码。现已支持GPT-4O模型! 支持的技术栈包括: HTML + Tailwind React + Tailwind Vue + Tailwind Bootstrap Ionic + Tailwind ... 阅读全文