人工智能

优惠 MaskLID:用于识别在一段话中混合使用的不同语言

  • MaskLID:用于识别在一段话中混合使用的不同语言
    AI
  • 慕尼黑大学和慕尼黑机器学习中心、索邦大学和法国国家科学研究院的研究人员推出MaskLID,它用于识别在一段话中混合使用的不同语言,也就是所谓的“代码切换”(Code-Switching,简称CS)。代码切换是指在一段话中交替使用两种或更多语言的现象,这在多语言社区中非常普遍,比如一个人在说话或写作时可能会在一段话中混入... 阅读全文

    优惠 轻量级大语言模型GEB-1.3B:为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计

  • 轻量级大语言模型GEB-1.3B:为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计
    AI
  • GEB推出新型轻量级大语言模型GEB-1.3B,这个模型是为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计的。GEB-1.3B特别优化了在普通CPU上的运行效率,使其能够部署在更易于访问的设备上,如笔记本电脑和智能手机。例如,你需要一个能够快速回应用户指令并提供准确信息的智能助手,GEB-1.3B... 阅读全文

    优惠 GaussianSR:将低分辨率的输入视图转换成高分辨率的新视图

  • GaussianSR:将低分辨率的输入视图转换成高分辨率的新视图
    AI
  • 中国科学技术大学和微软亚洲研究院的研究人员推出GaussianSR,它能够将低分辨率的输入视图转换成高分辨率的新视图。这项技术在计算机视觉和图形学领域尤为重要,因为它可以用于生成高质量的视觉效果,例如在虚拟现实、增强现实或3D电影制作中。例如,你是一位电影制作人,需要将一些旧的低分辨率电影片段升级为高分辨率以适应现代大... 阅读全文

    优惠 新型基准测试BABILong:专门用来评估大语言模型处理超长文本上下文的能力

  • 新型基准测试BABILong:专门用来评估大语言模型处理超长文本上下文的能力
    AI
  • 新型基准测试BABILong,它专门用来评估大语言模型(LLMs)处理超长文本上下文的能力。想象一下,你有一款智能助手,它需要阅读一篇非常长的文档,然后根据文档内容回答一些非常具体的问题。但是,文档中只有一小部分信息是真正需要用来回答问题的,其余的都是干扰信息。BABILong就是用来测试智能助手是否能够准确地从海量文... 阅读全文

    优惠 Physics3D:通过视频扩散模型学习三维物体(3D objects)的各种物理属性

  • Physics3D:通过视频扩散模型学习三维物体(3D objects)的各种物理属性
    AI
  • 清华大学和斯坦福大学的研究人员推出新型方法Physics3D,它能够通过视频扩散模型学习三维物体(3D objects)的各种物理属性。简单来说,就是利用计算机模拟来预测和再现真实世界中物体的物理行为,比如一个球掉落在软垫上会如何弹跳,或者一块布料在风中如何飘动。例如,我们想在电脑游戏中创建一个场景,其中包含柔软的布料... 阅读全文

    优惠 新型大型多模态模型SliME:能够处理和理解高分辨率的图像和文本信息

  • 新型大型多模态模型SliME:能够处理和理解高分辨率的图像和文本信息
    AI
  • 中国科学院自动化研究所多模态人工智能系统国家重点实验室、中国科学院大学人工智能学院、松鼠AI、阿里巴巴集团和Meta AI的研究人员推出新型大型多模态模型SliME,这些模型能够处理和理解高分辨率的图像和文本信息。例如,你有一个智能助手,它不仅能读懂你给它的任何图片,还能理解图片中的细节,并回答你关于图片内容的问题。 ... 阅读全文

    优惠 新型视觉变换器家族Hibou:专门用于病理学领域

  • 新型视觉变换器家族Hibou:专门用于病理学领域
    AI
  • HistAI推出新型视觉变换器(Vision Transformers,简称ViTs)家族Hibou,它们专门用于病理学领域。病理学是研究疾病组织的科学,通过显微镜检查来诊断各种疾病,尤其是癌症。传统的病理学方法既耗时又容易出错,而数字病理学通过将玻片扫描成高分辨率的数字图像,让计算机算法进行分析,从而彻底改变了这一领... 阅读全文

    优惠 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错

  • 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错
    AI
  • 爱丁堡大学、 罗马大学、巴里理工大学、伦敦大学学院、特伦托大学、 AssemblyAI和 英国卫生安全局的研究人员对一个流行的大型多任务语言理解(MMLU)基准测试进行深入分析和纠错,MMLU是用来评估大型语言模型(LLMs)在多种语言任务上的表现,比如历史、数学、计算机科学等领域。但论文作者发现,尽管MMLU被广泛使... 阅读全文

    优惠 ECO:让大语言模型“忘记”它们所学到的某些知识

  • ECO:让大语言模型“忘记”它们所学到的某些知识
    AI
  • 加州大学圣克鲁斯分校发布论文,论文的主题是关于如何让大语言模型(LLMs)“忘记”它们所学到的某些知识。例如,我们有一个聊天机器人,它通过学习大量的文本数据变得很聪明。但有一天,我们发现它学会了一些不应该被分享的秘密,比如某个人的个人信息。使用ECO方法,我们可以训练一个分类器来识别包含这个人信息的输入,然后在这些输入... 阅读全文

    优惠 新型生成模型MD4:专注于离散数据的生成,比如文本和像素级别的图像数据

  • 新型生成模型MD4:专注于离散数据的生成,比如文本和像素级别的图像数据
    AI
  • Google DeepMind推出一种新型的生成模型——被称为“Simplified and Generalized Masked Diffusion”(简化和通用化的掩蔽扩散,简称MD4)的模型。这个模型专注于离散数据的生成,比如文本和像素级别的图像数据。了MD4模型在OpenWebText数据集上的表现超过了之前的... 阅读全文

    优惠 视觉字幕恢复VCR:挑战现有的视觉-语言模型,以准确恢复图像中部分被遮挡的文本

  • 视觉字幕恢复VCR:挑战现有的视觉-语言模型,以准确恢复图像中部分被遮挡的文本
    AI
  • 魁北克 Mila 人工智能研究所、ServiceNow Research、蒙特利尔大学、宾夕法尼亚大学、滑铁卢大学和香港科技大学的研究人员推出新任务Visual Caption Restoration(VCR,视觉字幕恢复),它挑战现有的视觉-语言模型,以准确恢复图像中部分被遮挡的文本。这项任务的灵感来自于观察到图像中... 阅读全文

    优惠 字节跳动推出增强语言模型Mistral-C2F:增强小规模语言模型在对话和分析推理方面的能力

  • 字节跳动推出增强语言模型Mistral-C2F:增强小规模语言模型在对话和分析推理方面的能力
    AI
  • 字节跳动推出一种新型的大语言模型(LLM)——Mistral-C2F,它是为了增强小规模语言模型在对话和分析推理方面的能力的。想象一下,如果你有一个智能助手,它可以帮你写邮件、回答问题,甚至帮你分析复杂问题,但有时候它给出的回答可能不够深入或者不够个性化。Mistral-C2F模型就是为了解决这些问题而设计的。 例如,... 阅读全文