From ce0b944c653f24b129f4f3b9d988afacfe0e631a Mon Sep 17 00:00:00 2001 From: Rollrollyuan Date: Fri, 21 Jul 2023 15:39:45 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E5=85=A8=E7=90=83=E5=A4=A7=E6=A8=A1?= =?UTF-8?q?=E5=9E=8B=E4=BA=A7=E5=93=81=E5=BA=93.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...\250\241\345\236\213\344\272\247\345\223\201\345\272\223.md" | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git "a/\345\205\250\347\220\203\345\244\247\346\250\241\345\236\213\344\272\247\345\223\201\345\272\223.md" "b/\345\205\250\347\220\203\345\244\247\346\250\241\345\236\213\344\272\247\345\223\201\345\272\223.md" index 6d0821f..150608d 100644 --- "a/\345\205\250\347\220\203\345\244\247\346\250\241\345\236\213\344\272\247\345\223\201\345\272\223.md" +++ "b/\345\205\250\347\220\203\345\244\247\346\250\241\345\236\213\344\272\247\345\223\201\345\272\223.md" @@ -287,7 +287,7 @@ |KoLA| 清华大学团队| 基于维基百科和近90天的新闻与小说作为数据集,从知识记忆、知识理解、知识应用、知识创建四个维度,设计了119个任务| https://kola.xlore.cn| |PandaLM| 西湖大学、北京大学等研究者| PandaLM的自动化打分模型基于三位专业标注员对不同大模型的输出进行独立打分,并构建了包含 50 个领域、1000 个样本的多样化测试集| https://github.com/WeOpenML/PandaLM| |GAOKAO| 上海人工智能实验室OpenLMLab| 收集了2010-2022年全国高考卷的题目,其中包括1781道客观题和1030道主观题,评测分为两部分,自动化评测的客观题部分和依赖于专家打分的主观题部分,构成了最终评分|https://github.com/OpenLMLab/GAOKAO-Bench| -|Xiezhi|獬豸|复旦大学肖仰华教授团队|由249587道多项选择题组成,涵盖516个不同学科和四个难度级别| https://github.com/MikeGu721/XiezhiBenchmark| +|Xiezhi獬豸|复旦大学肖仰华教授团队|由249587道多项选择题组成,涵盖516个不同学科和四个难度级别| https://github.com/MikeGu721/XiezhiBenchmark| ## 致谢名单 -- GitLab