正文

CMMLU 2025 最新中文评估基准解析:67 学科 1.1 万题测试大模型知识推理能力