refactor directories

66ed92cb · feilong · f3367375 · 66ed92cb · 66ed92cb · 66ed92cb
Showing with 19 addition and 1 deletion

README.md README.md +19 -1

backup/AIGC数据评估.xlsx backup/AIGC数据评估.xlsx +0 -0

backup/llm-codeing.json backup/llm-codeing.json +0 -0

main.py main.py +0 -0

requirements.txt requirements.txt +0 -0

未找到文件。
--- a/README.md
+++ b/README.md
 # llm-coding-eval
 大模型写代码能力评测
+## 目录说明
+* backup/
+  * 最早版本的评测，测试例子来自真实的用户查询
+  * 评测体系来自基本的分类
+* eval_set/
+  * 体系化设计的评测用例
+  * 从简单到复杂的编程粒度设计
+* llm_set/
+  * 大模型配置列表，配置每一种大模型的元数据
+* src/
+  * 评测源代码
+* mian.py 程序入口
+## 同类评测项目
+1. 斯坦福大学的评测：AlpacaEval Logo Leaderboard <https://tatsu-lab.github.io/alpaca_eval/>
--- a/AIGC数据评估.xlsx
+++ b/AIGC数据评估.xlsx
--- a/data/llm-codeing.json
+++ b/data/llm-codeing.json
--- a/main.py
+++ b/main.py
--- a/requirements.txt
+++ b/requirements.txt