1. 04 8月, 2023 1 次提交
    • F
      [CINN] Dump more compilation result and optimize parallel compiler flags (#55935) · 39b59603
      Fisher 提交于
      1. `Parallel Compiler`:
          - 合并`FLAGS_cinn_parallel_compile_size`和`FLAGS_cinn_parallel_compile_thread`,通过`FLAGS_cinn_parallel_compile_thread`即可指定编译时使用的线程数,所有的`fusion_groups`将会平均分配到可用的线程上
          - 增强编译完成后返回的信息,除`instruction`外,将`lowered_function`、`source_code`、`source_ptx`返回,供上层进一步使用
      2. Debug信息:
          - 新增`FLAGS_ cinn_dump_group_lowered_func`、`FLAGS_cinn_dump_group_source_code`、`FLAGS_ cinn_dump_group_ptx`、`FLAGS_ cinn_dump_group_instruction`,可分别按`fusion_groups`储存编译的每个阶段中的中间代码
          - 重新整理`graph_visualization`,所有的可视化图、单测代码均能正确分组储存
      3. Bug修复:
          - 修复`MakeDirectory`不能正确创建文件夹的问题
      4. 其他:
          - 清除了一些无用代码
      39b59603
  2. 02 8月, 2023 1 次提交
  3. 28 7月, 2023 1 次提交
  4. 27 7月, 2023 2 次提交
  5. 26 7月, 2023 3 次提交
  6. 25 7月, 2023 1 次提交
  7. 24 7月, 2023 1 次提交
  8. 21 7月, 2023 1 次提交
  9. 20 7月, 2023 3 次提交
  10. 19 7月, 2023 1 次提交
  11. 18 7月, 2023 3 次提交
  12. 17 7月, 2023 3 次提交
  13. 14 7月, 2023 1 次提交
  14. 13 7月, 2023 3 次提交
  15. 12 7月, 2023 2 次提交
  16. 06 7月, 2023 1 次提交
  17. 04 7月, 2023 2 次提交
  18. 03 7月, 2023 3 次提交
  19. 02 7月, 2023 2 次提交
  20. 01 7月, 2023 2 次提交
  21. 30 6月, 2023 1 次提交
  22. 29 6月, 2023 2 次提交