正文

CMMLU 中文评估基准深度解析:大模型知识储备与推理能力测试