AI

优惠 FLUTE:专门为使用查找表量化(LUT-quantized)的大语言模型设计

  • FLUTE:专门为使用查找表量化(LUT-quantized)的大语言模型设计
    AI
  • 麻省理工学院、普罗夫迪夫数学高中和卡内基梅隆大学的研究人员推出FLUTE,FLUTE是一个灵活的查找表引擎,专门为使用查找表量化(LUT-quantized)的LLMs设计。简单来说,量化就是一种数据压缩技术,可以减少模型大小,加快运算速度,但同时也可能影响模型的精度。 GitHub:https://github.co... 阅读全文

    优惠 研究编码基准测试SciCode:评估和提高语言模型在解决真实科学问题方面的能力

  • 研究编码基准测试SciCode:评估和提高语言模型在解决真实科学问题方面的能力
    AI
  • SciCode是一个研究编码基准测试,这是一个由科学家们策划的挑战性编程任务集合。SciCode的目的是评估和提高语言模型(LMs)在解决真实科学问题方面的能力。这些问题涵盖了自然科学的多个领域,包括数学、物理、化学、生物学和材料科学。论文还提到了Claude3.5-Sonnet模型在SciCode中的表现,它在最现实... 阅读全文

    优惠 谷歌推出新型稀疏自编码器JumpReLU SAEs:用于提高语言模型激活的重建保真度

  • 谷歌推出新型稀疏自编码器JumpReLU SAEs:用于提高语言模型激活的重建保真度
    AI
  • 谷歌推出新型稀疏自编码器(Sparse Autoencoders, SAEs),称为JumpReLU SAEs,它用于提高语言模型(Language Model, LM)激活的重建保真度。简单来说,这种技术可以帮助我们从大量文本数据中提取出关键信息,并且以一种非常节省资源的方式表示这些信息。论文还提到了一些限制和未来的... 阅读全文

    优惠 新型视觉文本生成方法SceneVTG:能够在野外环境(即非受控的自然环境)中生成高质量的文本图像

  • 新型视觉文本生成方法SceneVTG:能够在野外环境(即非受控的自然环境)中生成高质量的文本图像
    AI
  • 阿里巴巴和华中科技大学的研究人员推出一种新型视觉文本生成方法,称为SceneVTG(Scene Visual Text Generator),它能够在野外环境(即非受控的自然环境)中生成高质量的文本图像。这项技术特别关注于生成的文本图像需要满足三个关键标准:真实性(Fidelity)、合理性(Reasonability... 阅读全文

    优惠 新型视觉文档理解方法VisFocus:无需OCR技术,能够直接从图像中理解文档内容

  • 新型视觉文档理解方法VisFocus:无需OCR技术,能够直接从图像中理解文档内容
    AI
  • 以色列赖希曼大学和亚马逊AWS AI 实验室的研究人员推出新型视觉文档理解方法VisFocus,它是一种无需光学字符识别(OCR)的技术,能够直接从图像中理解文档内容。这种方法特别适用于处理包含大量文本的密集文档,比如PDF文件或图像。 例如,你有一张包含许多文本的PDF文档的图像,并想知道文档中提到的某个特定信息(比... 阅读全文

    优惠 StabilityAI发布全新开源模型Stable Audio Open的技术报告

  • StabilityAI发布全新开源模型Stable Audio Open的技术报告
    AI
  • StabilityAI在上个月公开新型文本到音频的生成模型Stable Audio Open后,终于在本月公开了技术报告,Stable Audio Open的特别之处在于,它是开放的,意味着任何人都可以使用和研究它,而且它是用Creative Commons(创意共享)许可的音频数据训练的,这保证了数据的合法性和透明性... 阅读全文

    优惠 快手推出新型高效视觉-语言模型EVLM

  • 快手推出新型高效视觉-语言模型EVLM
    AI
  • 快手推出一种新型高效视觉-语言模型EVLM,它是为了更好地理解视觉信息并将其与语言模型结合起来而设计的。EVLM在多模态基准测试中的竞争力表现,以及在图像字幕和视频字幕任务中的优秀性能。这表明EVLM不仅在理论上设计得很先进,而且在实际应用中也能提供很好的效果。 例如,你给EVLM一张图片,图片上有一个家庭在海滩上,父... 阅读全文

    优惠 开源项目SCALE:让 CUDA 应用无需修改运行在 AMD GPU 上

  • 开源项目SCALE:让 CUDA 应用无需修改运行在 AMD GPU 上
    AI
  • SCALE是一个由初创企业Spectral Compute公司开发的GPGPU工具链,它允许CUDA程序在AMD显卡上本地编译运行。SCALE的开发历经七年,旨在提供一种与英伟达CUDA完全兼容的解决方案,使得用户不必维护多个代码库或牺牲性能来支持多个GPU供应商。SCALE项目提供了一种创新的解决方案,允许CUDA程... 阅读全文

    优惠 阿里巴巴旗下通义实验室语音团队推出声音理解和生成基础模型FunAudioLLM模型家族

  • 阿里巴巴旗下通义实验室语音团队推出声音理解和生成基础模型FunAudioLLM模型家族
    AI
  • 阿里巴巴旗下通义实验室语音团队推出声音理解和生成基础模型FunAudioLLM模型家族,专为优化人类与大语言模型(LLMs)间的自然语音交互而设计。该体系的核心亮点是两大创新模型:SenseVoice,擅长处理多语种语音识别、情绪识别及音频事件探测;以及CosyVoice,能灵活生成自然语音,实现对多种语言、音色、讲述... 阅读全文

    优惠 微软推出基于知识图谱的检索增强生成(RAG)开源项目GraphRAG

  • 微软推出基于知识图谱的检索增强生成(RAG)开源项目GraphRAG
    AI
  • GraphRAG是由微软推出的一个基于知识图谱的检索增强生成(RAG)技术项目,旨在通过构建知识图谱来增强大语言模型(LLM)在处理复杂查询时的性能。该项目已在GitHub上开源,并迅速获得了广泛的关注和积极的评价。GraphRAG的设计理念是将非结构化的文本数据转换为结构化的图谱形式,使得模型能够更深入地挖掘数据间的... 阅读全文

    优惠 GS Quant:用于量化金融的 Python 工具包

  • GS Quant:用于量化金融的 Python 工具包
    AI
  • GS Quant 是高盛集团(Goldman Sachs)开发的一个用于量化金融的 Python 工具包,旨在加速量化交易策略和风险管理解决方案的开发。它基于高盛内部使用的风险转移平台,结合了超过 25 年的全球市场经验,为量化开发者(quants)提供了一个强大的工具,以支持交易策略的开发和衍生产品的分析。 GitH... 阅读全文

    优惠 AGENTPOISON:针对大语言模型代理的红队攻击手段

  • AGENTPOISON:针对大语言模型代理的红队攻击手段
    AI
  • 芝加哥大学、伊利诺伊大学香槟分校、威斯康星大学麦迪逊分校和加州大学伯克利分校的研究人员推出AGENTPOISON,它是一种针对大语言模型(LLM)代理的红队攻击手段。这些代理通常在各种应用中表现出色,比如自动驾驶、医疗咨询和知识问答等。这些代理依赖于记忆模块或检索增强生成(RAG)机制,通过检索知识库中的过去知识和类似... 阅读全文