推荐类别

栏目分类

优惠 阿里巴巴推出新型文本阅读模型Platypus:能够从各种形式的图像中读取文本,无论是自然场景还是文档

  • 阿里巴巴推出新型文本阅读模型Platypus:能够从各种形式的图像中读取文本,无论是自然场景还是文档
    AI
  • 阿里巴巴推出新型文本阅读模型Platypus,它能够从各种形式的图像中读取文本,无论是自然场景还是文档。这个模型的设计理念是结合专家模型(specialist models)的高精度和通用模型(generalist models)的广泛适用性,以提高文本识别的准确性和效率。例如,你是一名历史学家,正在研究古老的文献。使... 阅读全文

    优惠 交互式3D布局控制方法“Build-A-Scene(BAS)”

  • 交互式3D布局控制方法“Build-A-Scene(BAS)”
    AI
  • 沙特阿拉伯国王科技大学的研究人员推出交互式3D布局控制方法“Build-A-Scene”(简称BAS),用于基于扩散模型的图像生成。简单来说,这个方法允许用户通过提供一个3D布局来控制图像中物体的类型、位置和方向,然后系统会根据这些信息生成一张图片。例如,一个室内设计师想要快速预览不同沙发和灯具的摆放效果。使用BAS,... 阅读全文

    优惠 新型AI游戏引擎GameNGen:完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量

  • 新型AI游戏引擎GameNGen:完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量
    AI
  • 特拉维夫大学和谷歌的研究人员推出新型游戏引擎GameNGen,它完全由神经网络模型驱动,能够实现与复杂环境的实时交互,并且能够在长时间内保持高质量。简单来说,GameNGen就像是一个智能的虚拟世界构建者,它可以在极快的速度下模拟出像经典游戏《DOOM》这样的复杂场景。 项目主页:https://gamengen.gi... 阅读全文

    优惠 MagicMan:用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作

  • MagicMan:用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作
    AI
  • 清华大学深圳国际研究生院、腾讯人工智能实验室、香港科技大学、斯坦福大学和香港中文大学的研究人员推出MagicMan,它是一种用于生成人类新视角图像的模型,能够在3D空间中意识到人类的形态和动作。MagicMan通过使用一个预训练的2D扩散模型和3D人体模型(SMPL-X)来生成高质量、多视角的人类图像,这些图像非常适合... 阅读全文

    优惠 新型多模态大语言模型LLaVaOLMoBitNet1B:首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型

  • 新型多模态大语言模型LLaVaOLMoBitNet1B:首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型
    AI
  • 英特尔实验室推出新型多模态大语言模型LLaVaOLMoBitNet1B,它是首个能够处理图像和文本输入并产生连贯文本响应的三元(Ternary)多模态大型语言模型。这种模型通过使用三元权重量化技术,旨在实现在较小的计算成本上提供高效的人工智能服务。例如,你是一名社交媒体内容分析师,需要自动生成图片的描述或回答关于图片的... 阅读全文

    优惠 量化新技术MobileQuant:解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题

  • 量化新技术MobileQuant:解决在移动设备上部署大语言模型时面临的内存、能源和计算成本问题
    AI
  • 三星剑桥人工智能中心推出量化新技术MobileQuant,它旨在解决在移动设备上部署大语言模型(LLMs)时面临的内存、能源和计算成本问题。大型语言模型虽然在多种应用中表现出色,但要在手机等边缘设备上使用它们却存在许多挑战。MobileQuant通过减少表示权重和激活所需的位数来降低这些成本,使得LLMs能够在移动设备... 阅读全文

    优惠 新型服务框架NanoFlow:通过利用设备内部的并行性,显著提高大语言模型的推理吞吐量

  • 新型服务框架NanoFlow:通过利用设备内部的并行性,显著提高大语言模型的推理吞吐量
    AI
  • 华盛顿大学的研究人员推出新型服务框架NanoFlow,它旨在通过利用设备内部的并行性,显著提高大语言模型(LLMs)的推理吞吐量。在当今数字化时代,大型语言模型被广泛应用于聊天机器人、搜索引擎和办公软件等领域,对计算资源的需求日益增长。NanoFlow通过在单个设备内并行使用计算、内存和网络资源,优化了模型的推理过程。... 阅读全文

    优惠 新型AI系统MLMove:能够模仿专业《CS:GO》玩家的移动方式

  • 新型AI系统MLMove:能够模仿专业《CS:GO》玩家的移动方式
    AI
  • 新型AI系统MLMove,它能够模仿专业《反恐精英:全球攻势》(CS:GO)玩家的移动方式。想象一下,你在游戏中,需要与队友协调行动,比如一起进攻或防守某个区域,MLMove就像是一个虚拟的队友,能够学习并展现出专业玩家的移动策略。 项目主页:https://davidbdurst.com/mlmove GitHub:... 阅读全文

    优惠 评估平台K-Sort Arena:专门用来测试和比较生成模型的性能

  • 评估平台K-Sort Arena:专门用来测试和比较生成模型的性能
    AI
  • 中国科学院自动化研究所和加州大学伯克利分校的研究人员推出评估平台K-Sort Arena,它专门用来测试和比较生成模型的性能。你可以把生成模型想象成一位艺术家,它可以根据给定的文字描述创作出图片或视频。但就像评价艺术品一样,我们需要一种方法来评估这些艺术家的作品质量,这就是K-Sort Arena发挥作用的地方。 项目... 阅读全文

    优惠 开源字幕时间轴调整工具subtitle-ass-shifter

  • 开源字幕时间轴调整工具subtitle-ass-shifter
    工具
  • subtitle-ass-shifter是一个开源的SubStation Alpha(简称ASS)字幕时间轴调整工具。它允许用户通过简单的命令行界面来移动和调整ASS字幕文件的时间轴,以适应视频中的时间变化。该工具适用于需要对字幕进行精确时间调整的场景,例如电影、电视剧的字幕制作或视频编辑过程中的字幕同步调整。 功能特... 阅读全文

    优惠 喜加一 GOG平台限时免费领取模拟经营类游戏《海岛大亨4》 0元

  • GOG平台限时免费领取模拟经营类游戏《海岛大亨4》
    GOG
  • GOG平台限时免费领取模拟经营类游戏《海岛大亨4 (Tropico 4 )》,本作由Haemimont Games 开发,Kalypso Media 发行,以城市建设为主。就像该系列的第一作与第三作,玩家将扮演一个“香蕉共和国”海岛上的独裁者。《海岛大亨4》2011年发售的海岛大亨系列的作品,这款游戏目前还没有中文,但... 阅读全文

    优惠 新方法HiRED:提高高分辨率视觉-语言模型(VLMs)在资源受限环境中的推理效率

  • 新方法HiRED:提高高分辨率视觉-语言模型(VLMs)在资源受限环境中的推理效率
    AI
  • 弗吉尼亚理工大学、贝尔法斯特女王大学和都柏林大学学院的研究人员推出新方法HiRED(High-Resolution Early Dropping),它旨在提高高分辨率视觉-语言模型(VLMs)在资源受限环境中的推理效率。这些模型广泛应用于多模态任务中,如图像和文本的联合理解,但在处理高分辨率图像时,它们会产生大量的视觉... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?