AI模型评测

实测对比各类 AI 模型,客观评测性能与效果

共 6 个工具

AGI-Eval:上海交通大学等顶尖高校联合打造的大模型评测社区与权威第三方评测平台

AGI-Eval:上海交通大学等顶尖高校联合打造的大模型评测社区与权威第三方评测平台

AI模型评测 免费
OpenCompass:上海人工智能实验室打造的开源大模型全方位评测体系与司南开放平台

OpenCompass:上海人工智能实验室打造的开源大模型全方位评测体系与司南开放平台

AI模型评测 免费
FlagEval:智源研究院打造的国际权威大模型评测体系与天秤开放平台

FlagEval:智源研究院打造的国际权威大模型评测体系与天秤开放平台

AI模型评测 免费
MMLU:大语言模型多任务语言理解能力的国际权威评测基准

MMLU:大语言模型多任务语言理解能力的国际权威评测基准

AI模型评测 国外 免费
HELM:斯坦福大学领衔的大语言模型全面评估框架与高影响力行业标准

HELM:斯坦福大学领衔的大语言模型全面评估框架与高影响力行业标准

AI模型评测 国外 免费
CMMLU:权威中文大语言模型知识理解能力评测基准与67学科全覆盖测试集

CMMLU:权威中文大语言模型知识理解能力评测基准与67学科全覆盖测试集

AI模型评测 免费