C-Eval
中文基础模型评估套件
C-Eval 是一个全面的中文基础模型评估套件。由
上海交通大学
、
清华大学
和
爱丁堡大学
研究人员在2023年5月份联合推出,它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测
大模型
中文理解能力。
定义
C-Eval 是一个全面的中文基础模型评估套件。由
上海交通大学
、
清华大学
和
爱丁堡大学
研究人员在2023年5月份联合推出。
原理
C-Eval 包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测
大模型
中文理解能力。
参考资料
C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models
.arxiv.
最新修订时间:2024-05-21 15:06
条目作者
小编
资深百科编辑
目录
概述
定义
原理
参考资料
Copyright©2024
闽ICP备2024072939号-1