当前位置：首页 > 优惠 >大语言模型>文章详情

韩国科学技术研究院推出新方法TroL：提升大型语言和视觉模型（LLVMs）的效率和性能

推荐人：暴走AI| 商城: AI | 10个月前 (06-19)| 分类：大语言模型 | 热度：171 ℃

已关闭评论

韩国科学技术研究院推出新方法TroL：提升大型语言和视觉模型（LLVMs）的效率和性能

韩国科学技术研究院推出新方法TroL（Traversal of Layers，即层次遍历），它用于提升大型语言和视觉模型（LLVMs）的效率和性能。TroL的核心思想是通过在模型中重复使用层（即“层次遍历”），来模拟人类在回答问题时回顾和重新审视信息的过程，从而在不增加额外计算负担的情况下提高模型的理解和生成能力。论文还展示了TroL在多个标准基准测试中的性能，证明了它在不同模型尺寸（1.8B、3.8B和7B参数）下都能有效地提升性能，并且在某些情况下，与使用额外模块的封闭源代码LLVMs相比也具有竞争力。

GitHub：https://github.com/ByungKwanLee/TroL
模型地址：https://huggingface.co/collections/BK-Lee/trol-6671374e78e410e0f8cb5ef8
Demo：https://huggingface.co/spaces/BK-Lee/TroL

例如，你在玩一个视频游戏，游戏中的角色需要在复杂的环境里找到出路。通常，角色可能只看一次环境就做决定，但有时候，为了找到最佳路径，角色需要停下来，再次观察周围的环境。TroL就像给游戏角色增加了一个“深思熟虑”的功能，让它可以多次观察环境，然后做出更好的决策。

韩国科学技术研究院推出新方法TroL：提升大型语言和视觉模型（LLVMs）的效率和性能