大语言模型
优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
5个月前 (06-29)AI
Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文
优惠 Math-LLaVA:提升大语言模型在处理多模态数学问题上的能力
标签:Math-LLaVA
AI
5个月前 (06-29)AI
中国电子科技大学、新加坡科技设计大学、同济大学和新加坡国立大学的研究人员推出Math-LLaVA,提升大语言模型(LLMs)在处理多模态数学问题上的能力。多模态数学问题是指那些需要结合图像和文本信息来解决的数学问题,比如根据图表数据计算趋势或者解决几何问题。例如,设有一个图表展示了某地区过去五年的人口增长趋势,Math... 阅读全文
优惠 nexa4ai推出新型AI规划代理Octo-planner:为了在边缘设备上实现高效决策和问题解决而设计
标签:Octo-planner
AI
5个月前 (06-29)AI
nexa4ai推出新型AI规划代理Octo-planner,它是为了在边缘设备上实现高效决策和问题解决而设计的。你可以将Octo-planner想象成一个智能助手,它可以在你的智能手机或其他设备上运行,帮助完成复杂的任务。例如,你要计划一次旅行,需要订机票、酒店,还要制定行程。这些任务可能很繁琐,需要考虑很多细节。现在... 阅读全文
优惠 自动化框架WILDTEAMING:专门用来挖掘和测试大语言模型的安全性漏洞
5个月前 (06-29)AI
华盛顿大学、艾伦人工智能研究所、首尔国立大学和卡内基梅隆大学推出自动化框架WILDTEAMING,它专门用来挖掘和测试大语言模型(LLMs)的安全性漏洞。简单来说,WILDTEAMING能够自动从真实的用户-聊天机器人交互中发现新的“越狱”(jailbreak)策略,这些策略是用户用来绕过语言模型的安全防护的技巧。然后... 阅读全文