Phind公司推出新旗舰模型Phind-405B,为编程和探索提供极速搜索

| 分类: AI情报 | 热度: 4 ℃

Phind公司近日推出了基于Meta Llama 3.1 405B的新旗舰模型Phind-405B,旨在为编程和技术问题提供快速搜索解决方案。Phind-405B在HumanEval评测中达到了92%的得分,与Claude 3.5 Sonnet表现相当。

  • 地址:https://www.phind.com

Phind-405B的主要特点:

  • 技术领先:基于Meta Llama 3.1 405B,专为编程和技术任务设计。
  • 处理能力:能够处理高达128K Tokens的上下文,初始提供32K Tokens的窗口。
  • 用户开放:现已对所有Phind Pro用户开放。

在现实世界的应用中,Phind-405B尤其在设计和实现Web应用程序方面表现出色。例如,它能够为Paul Graham的Founder Mode创建登陆页面,通过多次搜索研究并提供多种设计方案。

技术细节:

Phind-405B的训练使用了DeepSpeed和MS-AMP库,在256个H100 GPU上以FP8混合精度进行。与BF16精度训练相比,FP8混合精度训练在不降低性能的同时,内存使用量减少了40%。

Phind Instant模型:

为了解决AI驱动搜索相比传统搜索引擎的延迟问题,Phind推出了Phind Instant模型。该模型在与Phind-405B相似的数据集上训练,能够以每秒350 Tokens的速度运行,基于Meta Llama 3.1 8B,并在定制的NVIDIA TensorRT-LLM推理服务器上提供极速体验。

搜索体验优化:

Phind通过模型运行时的改进,实现了在用户输入完成前开始获取网络结果,每次搜索可节省高达800毫秒的延迟。此外,Phind还升级了用于确定检索文本中最相关部分的嵌入模型,新模型比之前的大15倍,同时通过16路并行计算减少了延迟。

Phind的目标:

Phind致力于帮助开发者快速实验和实现新想法。公司正在开发新的应用级功能,由今天宣布的模型提供支持。同时,Phind也成为解决技术查询的优秀答案引擎,满足用户的好奇心和探索需求。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论