AI
优惠 SoM-LLaVA:提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力
7个月前 (04-27)AI
加州大学圣地亚哥分校、微软公司、加州大学圣巴巴拉分校的研究人员推出list items one by one,这是一种提高多模态大语言模型视觉理解能力的新方法,它通过在图像上添加带标签的标记(tags)来增强模型将视觉对象与文本标记关联的能力。例如,我们有一张包含笔记本电脑、椅子、显示器和台灯的办公室照片。使用SoM提... 阅读全文
优惠 阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B
标签:Qwen1.5-110B
AI
7个月前 (04-27)AI
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 Alpaca... 阅读全文
优惠 OpenAI的搜索产品 Sonic – SNC(SearchGPT)已经进入评估阶段
7个月前 (04-26)AI
今年2月份就有爆料说OpenAI 要推出网络搜索服务,挑战谷歌霸权。而今天又有爆料,说OpenAI的搜索产品 Sonic - SNC(SearchGPT)已经进入评估阶段,新增多项功能: 1️⃣图像搜索 2️⃣多样小工具(天气、计算器、体育、财经及时间差计算) 3️⃣可进行后续提问 此次评估采用了多个模型,包括 GPT... 阅读全文
优惠 新型零样本(Zero-Shot)语音合成系统FlashSpeech
标签:FlashSpeech
AI
7个月前 (04-24)AI
来自香港科技大学、MSRA、萨里大学、内蒙古大学、北京邮电大学和新加坡国立大学的研究人员推出新型零样本(Zero-Shot)语音合成系统FlashSpeech,零样本语音合成是指在没有特定说话人数据训练的情况下,能够模仿该说话人的声音来生成语音的技术。这项技术可以应用于多种场景,比如为电影角色配音、创建个性化的虚拟助手... 阅读全文
优惠 Transformer语言模型能够表示n-gram语言模型
7个月前 (04-24)AI
苏黎世联邦理工学院的研究人员发布论探讨和证明Transformer语言模型能够表示n-gram语言模型。n-gram语言模型是一种基于统计的语言模型,它根据前面的n-1个词来预测下一个词的概率。Transformer语言模型是一种基于深度学习的先进语言模型,广泛应用于自然语言处理任务中。例如,我们有一个4-gram语言... 阅读全文