大语言模型
优惠 多模态模型OmniFusion:结合了大语言模型和视觉模态的适配器,以提高人工智能系统处理和理解文本和图像数据的能力
10个月前 (04-10)AI
这篇论文介绍了一个名为OmniFusion的多模态模型,它结合了大型语言模型(LLM)和视觉模态的适配器,以提高人工智能系统处理和理解文本和图像数据的能力。OmniFusion模型在多个视觉-语言基准测试中表现出色,尤其是在视觉问题回答(VQA)任务上,与现有的开源解决方案相比,它能够提供更详细的答案。 GitHub:... 阅读全文
优惠 Mistral推出开源大模型Mixtral 8x22b
10个月前 (04-10)AI
在谷歌和OpenAI接连放大招后,Mistral也不甘寂寞,直接释出了开源大模型Mixtral 8x22b,此模型 281.24 GB大小,需要4 张英伟达 A100 或H100显卡,才可以安全高效地运行模型。(PS:Mistral又是直接放磁力链接让大家下载) 磁力链接: magnet:?xt=urn:btih:92... 阅读全文
优惠 OpenAI推出GPT-4-Turbo 正式版:视觉能力,并支持高达128k的上下文
10个月前 (04-10)AI
OpenAI发布了备受期待的GPT-4-Turbo正式版,该版本已在ChatGPT中正式提供,并同时集成到OpenAI API中。GPT-4-Turbo具有视觉能力,并支持高达128k的上下文,为用户提供了更丰富的交互体验。 主要更新亮点: 全面开放:用户现在可以通过“gpt-4-turbo”来使用此模型,最新版本为“... 阅读全文
优惠 谷歌在180多个国家/地区推出Gemini 1.5 Pro API:具有原生音频理解、系统指令、JSON 模式等新功能
10个月前 (04-10)AI
谷歌在今天宣布将在180多个国家/地区推出Gemini 1.5 Pro 的API,首次提供原生音频(语音)理解能力以及全新的File API,使得文件处理更加便捷。此外,还推出了系统指令和JSON模式等新功能,赋予开发者对模型输出的更多控制权。最后,谷歌发布了性能卓越的下一代文本嵌入模型,超越了同类产品的表现。 以下是... 阅读全文
优惠 Stream of Search (SoS):大语言模型如何在解决问题时进行搜索和推理
10个月前 (04-08)AI
斯坦福大学的研究人员推出Stream of Search (SoS),它教会语言模型如何在解决问题时进行搜索和推理。通常,大语言模型在训练时只接触到正确的解决方案,而不会看到错误或者寻找解决方案的过程。这就像是只学习到了如何走到目的地,而没有学习如何在路上迷路和找回方向。SoS方法通过将搜索过程表示为一系列的文本信息(... 阅读全文