有一半
-
你正在做的大模型评测,可能有一半都是无用功(都是.用功.有一半)
多模态ai模型评估:冗余测试的系统性分析 近期,上海AI Lab、上海交大和浙江大学的研究团队发现,当前流行的多模态大模型基准测试存在大量冗余。该团队对20多个...
wufei123 发布于 2025-03-22 阅读(16)
多模态ai模型评估:冗余测试的系统性分析 近期,上海AI Lab、上海交大和浙江大学的研究团队发现,当前流行的多模态大模型基准测试存在大量冗余。该团队对20多个...