# skill_tree_ai AI 技能树 ## 初始化技能树 技能树合成和id生成脚本目前用 Python 脚本统一处理 ```bash pip install -r requirement.txt ``` ## 目录结构说明 data目录下包含 难度节点/章节点/知识节点 3级目录结构 * 技能树`骨架文件`: * 位置:`data/tree.json` * 说明:该文件是执行 `python main.py` 生成的,请勿人工编辑 * 技能树`根节点`配置文件: * 位置:`data/config.json` * 说明:可编辑配置关键词等字段,其中 `node_id` 字段是生成的,请勿编辑 * 技能树`难度节点`: * 位置:`data/xxx`,例如: `data/1.AI初阶` * 说明: * 每个技能树有 3 个等级,目录前的序号是**必要**的,用来保持文件夹目录的顺序 * 每个目录下有一个 `config.json` 可配置关键词信息,其中 `node_id` 字段是生成的,请勿编辑 * 技能树`章节点`: * 位置:`data/xxx/xxx`,例如:`data/1.AI初阶/1.预备知识` * 说明: * 每个技能树的每个难度等级有 n 个章节,目录前的序号是**必要**的,用来保持文件夹目录的顺序 * 每个目录下有一个 `config.json` 可配置关键词信息,其中 `node_id` 字段是生成的,请勿编辑 * 技能树`知识节点`: * 位置:`data/xxx/xxx`,例如:`data/1.AI初阶/1.预备知识/1.AI简介` * 说明: * 每个技能树的每章有 n 个知识节点,目录前的序号是必要的,用来保持文件夹目录的顺序 * 每个目录下有一个 `config.json` * 其中 `node_id` 字段是生成的,请勿编辑 * 其中 `keywords` 可配置关键字字段 * 其中 `children` 可配置该`知识节点`下的子树结构信息,参考后面描述 * 其中 `export` 可配置该`知识节点`下的导出习题信息,参考后面描述 ## `知识节点` 子树信息结构 例如 `data/1.AI初阶/1.预备知识/1.AI简介/config.json` 里配置对该知识节点子树信息结构,用来增加技能树社区服务在该知识节点上的深度数据匹配: ```json { // ... "children": [ { "AI简史": { "keywords": [ "AI起源", "人工智能简史" ], "children": [] } } ], } ``` ## `知识节点` 的导出习题编辑 例如 `data/1.AI初阶/1.预备知识/1.AI简介/config.json` 里配置对该知识节点导出的习题 ```json { // ... "export": [ "helloworld.json", // ... ] } ``` 在 `export` 字段中,我们列出习题定义的`json`文件列表 ,下面我们了解如何编写习题。 ## `知识节点` 的导出习题选项配置编辑 目前我们支持使用 markdown 语法直接编辑习题和各选项。 如前文内容,我们在知识节点下增加习题 `helloworld`的定义文件,即在`data/1.AI初阶/1.预备知识/1.AI简介` 目录增加一个`helloworld.json`文件: ```json { "type": "code_options", "author": "幻灰龙", "source": "helloworld.md", "notebook_enable": true } ``` 其中 * `type` 字段目前都固定是 `code_options`, * `notebook_enable` 字段决定这个习题是否生成对应的 `notebook` * `source` 字段代表习题编辑的 `markdwon` 文件。 现在我们新建一个 `helloworld.md` 并编辑为: ````markdown # Hello World HelloWorld, 请阅读如下代码: ```python import numpy as np def test(): X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) y = np.dot(X, np.array([1, 2])) + 3 // TODO(选择选项中的代码填充此处) y_predict = reg.predict(np.array([[3, 5]])) print(y_predict) if __name__ == '__main__': test() ``` 若将以下选项中的代码分别填充到上述代码中**TODO**处,哪个选项不是线性模型? ## template ```java import numpy as np def test(): X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]]) y = np.dot(X, np.array([1, 2])) + 3 // 下面的 code 占位符会被替换成答案和选项代码 $code y_predict = reg.predict(np.array([[3, 5]])) print(y_predict) if __name__ == '__main__': test() ``` ## 答案 ```python from sklearn import svm reg = svm.SVC(kernel='rbf').fit(X, y) ``` ## 选项 ### 使用 LinearRegression ```python from sklearn.linear_model import LinearRegression reg = LinearRegression().fit(X, y) ``` ### 使用岭回归 ```python from sklearn.linear_model import Ridge reg = Ridge(alpha=0.1) ``` ### 使用拉索算法 ```python from sklearn.linear_model import Lasso reg = Lasso(alpha=0.1).fit(X, y) ``` ```` 这是一个最基本的习题MarkDown结构,说明如下: * 一级标题是`习题标题` * 一级标题紧接着的段落是`习题描述` * `## template` 是用于和答案、选项结合合成`NoteBook`代码用的模版 * `## 答案` 是习题选项中符合题目描述的答案项 * `## 选项` 下包含几个混淆用的选项 * 每个选项带有一个三级标题,例如`### 使用 LinearRegression`, * 最终生成的习题中不包含选项的三级标题,所以这个标题可以用来标注一些编辑信息 ## 可选的习题源代码项目 编辑习题中,为了测试方便,可以直接在3级知识节点目录下创建对应的习题代码子目录 ## 技能树合成 在根目录下执行 `python main.py` 会合成技能树文件,合成的技能树文件: `data/tree.json` * 合成过程中,会自动检查每个目录下 `config.json` 里的 `node_id` 是否存在,不存在则生成 * 合成过程中,会自动检查每个知识点目录下 `config.json` 里的 `export` 里导出的习题配置,检查是否存在`exercise_id` 字段,如果不存在则生成