阿里巴巴

优惠 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发

  • 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”:促进多模态数据和生成模型的协同开发
    AI
  • 阿里巴巴推出新型工具套件“Data-Juicer Sandbox”,它旨在促进多模态数据和生成模型的协同开发。多模态数据指的是包含文本、图像、视频和音频等多种类型的数据。生成模型则是指能够基于输入数据生成新内容的人工智能模型,例如根据文本描述生成图像或视频。 例如,你是一位厨师,需要准备一道复杂的菜肴,你需要各种食材(... 阅读全文

    优惠 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio

  • 阿里巴巴集团Qwen团队推出大型音频-语言模型Qwen2-Audio
    AI
  • 阿里巴巴集团Qwen团队最新研发的大型音频-语言模型Qwen2-Audio。这个模型能够处理各种音频信号输入,并根据语音指令进行音频分析或直接文本回应。简单来说,Qwen2-Audio就像一个超级听力助手,不仅能听懂你说的话,还能根据你的声音指令做出反应。例如,你有一个智能助手,它不仅能听懂你说的话,还能分析你播放的音... 阅读全文

    优惠 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力

  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型遵循指令的能力
    AI
  • 阿里巴巴 Qwen 团队推出AUTOIF方法,提升大语言模型(LLMs)遵循指令的能力。想象一下,你有一个非常聪明的助手,它可以阅读和理解你给出的任何指令,然后用自然语言做出回应。但是,如果我们想让这个助手更好地理解和执行复杂的指令,就需要一些特别的方法来训练它。AUTOIF方法通过自我生成的执行反馈来增强LLMs的指... 阅读全文

    优惠 阿里巴巴推出通信驱动方法C4:通过优化并行训练中的通信和故障处理,提高了大规模AI训练的效率和稳定性

  • 阿里巴巴推出通信驱动方法C4:通过优化并行训练中的通信和故障处理,提高了大规模AI训练的效率和稳定性
    AI
  • 阿里巴巴推出一个名为C4的通信驱动方法,用于提升大规模并行训练的效率。在大语言模型(LLMs)的训练过程中,为了处理庞大的数据和计算需求,通常需要使用成千上万的GPU进行并行训练。然而,现有的并行训练技术存在一些问题,比如硬件故障导致的训练中断,以及GPU在等待参数同步时造成的等待时间延长。C4就是为了解决这些问题而设... 阅读全文

    优惠 阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型

  • 阿里巴巴开源Qwen2系列模型,包含5个尺寸的预训练和指令微调模型
    AI
  • 阿里在4月份发布最后一个Qwen1.5模型后,在昨晚正式开源了Qwen2系列模型。这一次,阿里为大家带来了: 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B; 在中文英语的基础上,训练数据中增加了27种语言相关的高质... 阅读全文

    优惠 阿里巴巴普惠体 3.0 正式发布:支持新国标 GB18030-2022,简体中文・7 字重

  • 阿里巴巴普惠体 3.0 正式发布:支持新国标 GB18030-2022,简体中文・7 字重
    工具
  • 今天,阿里巴巴的免费商用字体普惠体在官网上线了3.0版本。据悉,此次的新版本适配了新国标GB18030-2022,扩容开发生僻字字库,其中覆盖绝大部分人名、地名、方言、古籍中的生僻字。这将有效提升普惠体的适用范围,并在一定程度上解决生僻字在电子设备上存在的显示问题。 据了解,阿里巴巴普惠体是第一款由中国企业发布的全场景... 阅读全文