Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
CSDN 技术社区
llm-coding-eval
提交
66ed92cb
L
llm-coding-eval
项目概览
CSDN 技术社区
/
llm-coding-eval
通知
19
Star
3
Fork
1
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
1
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
L
llm-coding-eval
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
1
合并请求
1
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
66ed92cb
编写于
6月 21, 2023
作者:
F
feilong
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
refactor directories
上级
f3367375
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
19 addition
and
1 deletion
+19
-1
README.md
README.md
+19
-1
backup/AIGC数据评估.xlsx
backup/AIGC数据评估.xlsx
+0
-0
backup/llm-codeing.json
backup/llm-codeing.json
+0
-0
main.py
main.py
+0
-0
requirements.txt
requirements.txt
+0
-0
未找到文件。
README.md
浏览文件 @
66ed92cb
# llm-coding-eval
大模型写代码能力评测
\ No newline at end of file
大模型写代码能力评测
## 目录说明
*
backup/
*
最早版本的评测,测试例子来自真实的用户查询
*
评测体系来自基本的分类
*
eval_set/
*
体系化设计的评测用例
*
从简单到复杂的编程粒度设计
*
llm_set/
*
大模型配置列表,配置每一种大模型的元数据
*
src/
*
评测源代码
*
mian.py 程序入口
## 同类评测项目
1.
斯坦福大学的评测:AlpacaEval Logo Leaderboard
<https://tatsu-lab.github.io/alpaca_eval/>
AIGC数据评估.xlsx
→
backup/
AIGC数据评估.xlsx
浏览文件 @
66ed92cb
文件已移动
data
/llm-codeing.json
→
backup
/llm-codeing.json
浏览文件 @
66ed92cb
文件已移动
main.py
0 → 100644
浏览文件 @
66ed92cb
requirements.txt
0 → 100644
浏览文件 @
66ed92cb
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录