什么是"CMMLU"?
CMMLU是一个综合性的中文评估基准,用于评估语言模型在中文语境下的知识和推理能力。
"CMMLU"有哪些功能?
CMMLU涵盖了从基础学科到高级专业水平的67个主题,包括自然科学、人文科学、社会科学和中国特定主题。它提供了五次测试和零次测试两种评估方式。
应用场景:
CMMLU可用于评估中文语言模型的性能和能力,帮助研究人员和开发者了解模型在不同任务和领域中的表现。
数据统计
相关导航
暂无评论...
CMMLU是一个综合性的中文评估基准,用于评估语言模型在中文语境下的知识和推理能力。
CMMLU涵盖了从基础学科到高级专业水平的67个主题,包括自然科学、人文科学、社会科学和中国特定主题。它提供了五次测试和零次测试两种评估方式。
CMMLU可用于评估中文语言模型的性能和能力,帮助研究人员和开发者了解模型在不同任务和领域中的表现。