1. 23 8月, 2023 1 次提交
  2. 21 8月, 2023 2 次提交
    • A
      [NewIR]Split PaddleDialect and KernelDialect and Implement Layered Compailation (#56442) · ca8f9552
      Aurelius84 提交于
      * [NewIR]Split PaddleDialect and KernelDialect and Implement Layered Compailation
      
      * remove ir_core DEPS
      
      * fix header files
      
      * fix conflict
      
      * ignore test_assert UT
      
      * fix code style
      
      * fix UT
      ca8f9552
    • F
      [CINN] Optimize parallel compiler and support dumping more compilation information (#55590) · 2d345148
      Fisher 提交于
      graph_compiler_util.h/cc:
      整合GraphCompiler与ParallelCompiler共同持有的数据结构CompilationStage、CompilationStatus、CompilationContext、CompilationResult
      Parallel Compiler:
      整合数据结构至CompilationContext
      支持分阶段编译,通过指定CompilationContext::Stage
      添加编译状态信息,包括状态CompilationResult::Status和信息CompilationResult::message
      一个Task对应一个fusion_group,每一阶段编译完成后,将编译结果放入CompilationResult数组的对应下标中,删去原Task中内部的局部变量,省去了MergeResult
      Graph Compiler:
      丰富CompilationResult,提供编译各阶段的中间结果
      整合数据结构至CompilationContext
      添加编译状态信息,包括状态CompilationResult::Status和信息CompilationResult::message
      启用单测
      其他:相关单测、前端接口、paddle2cinn适配CompilationContext
      2d345148
  3. 18 8月, 2023 1 次提交
    • C
      [IR] Register cinn_dialect & Generate AddOp (#56357) · 5c6d0e26
      chen2016013 提交于
      * Register cinn_dialect & Generate AddOp
      
      * codestyle fix
      
      * codestyle fix02
      
      * 合并cinn_ops.parsed.yaml和cinn_backward_ops.parsed.yaml;
      将add算子注册进CinnDialect
      
      * 通过宏定义注册算子
      
      * bug-fix
      
      * bug-fix
      
      * bug-fix
      
      * bug-fix
      
      * skip conflict include
      
      * resolve conflict
      5c6d0e26
  4. 17 8月, 2023 1 次提交
  5. 16 8月, 2023 1 次提交
  6. 15 8月, 2023 1 次提交
  7. 10 8月, 2023 1 次提交
  8. 09 8月, 2023 2 次提交
  9. 04 8月, 2023 1 次提交
    • F
      [CINN] Dump more compilation result and optimize parallel compiler flags (#55935) · 39b59603
      Fisher 提交于
      1. `Parallel Compiler`:
          - 合并`FLAGS_cinn_parallel_compile_size`和`FLAGS_cinn_parallel_compile_thread`,通过`FLAGS_cinn_parallel_compile_thread`即可指定编译时使用的线程数,所有的`fusion_groups`将会平均分配到可用的线程上
          - 增强编译完成后返回的信息,除`instruction`外,将`lowered_function`、`source_code`、`source_ptx`返回,供上层进一步使用
      2. Debug信息:
          - 新增`FLAGS_ cinn_dump_group_lowered_func`、`FLAGS_cinn_dump_group_source_code`、`FLAGS_ cinn_dump_group_ptx`、`FLAGS_ cinn_dump_group_instruction`,可分别按`fusion_groups`储存编译的每个阶段中的中间代码
          - 重新整理`graph_visualization`,所有的可视化图、单测代码均能正确分组储存
      3. Bug修复:
          - 修复`MakeDirectory`不能正确创建文件夹的问题
      4. 其他:
          - 清除了一些无用代码
      39b59603
  10. 02 8月, 2023 1 次提交
  11. 28 7月, 2023 1 次提交
  12. 27 7月, 2023 2 次提交
  13. 26 7月, 2023 3 次提交
  14. 25 7月, 2023 1 次提交
  15. 24 7月, 2023 1 次提交
  16. 21 7月, 2023 1 次提交
  17. 20 7月, 2023 3 次提交
  18. 19 7月, 2023 1 次提交
  19. 18 7月, 2023 3 次提交
  20. 17 7月, 2023 3 次提交
  21. 14 7月, 2023 1 次提交
  22. 13 7月, 2023 3 次提交
  23. 12 7月, 2023 2 次提交
  24. 06 7月, 2023 1 次提交
  25. 04 7月, 2023 2 次提交