当前位置：首页 > 优惠 >大语言模型>文章详情

多模态大语言模型评估框架MultiTrust

推荐人：暴走AI| 商城: AI | 9个月前 (07-22)| 分类：大语言模型 | 热度：186 ℃

已关闭评论

清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说，就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。

例如，一个多模态模型在识别一张包含个人信息的图片时，它不仅要能识别出图片中的内容，还要能够判断这些信息是否属于个人隐私，并在需要时拒绝提供这些信息，以保护用户的隐私安全。这就是MLLMs在隐私保护方面的一个应用实例。通过这样的评估，研究者可以更好地理解模型的强项和弱点，并为未来的改进提供指导。

全面性评估：论文提出了一个名为MultiTrust的评估框架，它是首个全面评估MLLMs可信度的标准，覆盖了真实性、安全性、鲁棒性、公平性和隐私保护五个主要方面。
多任务和数据集：通过32个不同的任务和自建的数据集，对MLLMs进行了深入的测试和分析。
多模态风险和跨模态影响：不仅关注了MLLMs在多模态输入下的潜在风险，还考虑了不同模态之间可能产生的交互影响。