README.md

    概述

    背景介绍

    OS 厂商为了扩大自己产品的兼容性范围,常常寻求与硬件厂商的合作,进行兼容性测试。OS 厂商制定一个测试标准,并提供测试用例,硬件厂商进行实际的测试。测试通过后,OS 厂商和硬件厂商将共同在对应的官网发布兼容性信息。

    验证目的就是保证 OS 与硬件平台的兼容性,验证仅限于基本功能验证,不包括性能测试等其它测试。

    openEuler硬件兼容性验证测试框架有如下特点:

    1. 为满足可信要求,必须使用openEuler操作系统,不能随意重编/插入内核模块。
    2. 通过扫描机制自适应发现硬件列表,来确定要运行的测试用例集合。
    3. 面向对象抽象各种硬件类型以及测试用例类,用于扩展开发。

    原理简介

    框架概览

    .
    ├── hwcompatible 框架主功能
    │   ├── compatibility.py  框架核心功能
    │   ├── client.py         上传测试结果到服务端
    │   ├── command.py        bash命令执行封装
    │   ├── commandUI.py      命令行交互工具
    │   ├── device.py         扫描设备信息
    │   ├── document.py       收集配置信息
    │   ├── env.py            全局变量,主要是各个配置文件或目录的路径
    │   ├── job.py            测试任务管理
    │   ├── log.py            日志模块
    │   ├── reboot.py         重启类任务专用,便于机器重启后仍能继续执行测试
    │   ├── sysinfo.py        收集系统信息
    │   └── test.py           测试套模板
    ├── scripts   工具脚本
    │   ├── oech                  框架命令行工具
    │   ├── oech-server.service   框架服务端 service 文件,用于启动 web 服务器
    │   ├── oech.service          框架客户端 service 文件,用于接管 reboot 用例
    │   └── kernelrelease.json    规范可用于认证的系统和内核版本
    ├── server   服务端
    │   ├── oech-server-pre.sh    服务预执行脚本
    │   ├── results/              测试结果存放目录
    │   ├── server.py             服务端主程序
    │   ├── static/               图片存放目录
    │   ├── templates/            网页模板存放目录
    │   ├── uwsgi.conf            nginx 服务配置
    │   └── uwsgi.ini             uwsgi 服务配置
    └── tests   测试套

    测试流程

    test-flow

    使用流程

    用户使用流程

    user-flow

    组网图

    test-network

    安装测试框架

    前提条件

    安装了 openEuler 20.03 (LTS) 或更高版本。

    获取安装包

    https://gitee.com/src-openeuler/oec-hardware/releases

    安装过程

    客户端

    1. 配置 openEuler 官方 repo 中对应版本的 everything 源,使用 dnf 安装客户端 oec-hardware。

      dnf install oec-hardware-XXX.rpm

    服务端

    1. 配置 openEuler 官方 repo 中对应版本的 everything 源,使用 dnf 安装服务端 oec-hardware-server。

      dnf install oec-hardware-server-XXX.rpm
    2. 服务端 web 展示页面需要的部分组件系统本身不提供,需要使用 pip3 安装(请自行配置可用 pip 源)。

      pip3 install Flask Flask-bootstrap uwsgi
    3. 启动服务。本服务默认使用 8080 端口,同时搭配 nginx(默认端口 80)提供 web 服务,请保证这些端口未被占用。

      systemctl start oech-server.service
      systemctl start nginx.service
    4. 关闭防火墙和 SElinux。

      systemctl stop firewalld
      iptables -F
      setenforce 0

    验证安装正确性

    客户端输入 oech 命令,可正常运行,则表示安装成功。如果安装有任何问题,可反馈至该邮箱:oecompatibility@openeuler.org

    使用指导

    前提条件

    • /usr/share/oech/kernelrelease.json 文件中列出了当前支持的所有系统版本,使用uname -a 命令确认当前系统内核版本是否属于框架支持的版本。

    • 框架默认会扫描所有网卡,对网卡进行测试前,请自行筛选被测网卡,并给它配上能 ping 通服务端的 ip;如果客户端是对 InfiniBand 网卡进行测试,服务端也必须有一个 InfiniBand 网卡并提前配好 ip 。

    使用步骤

    1. 在客户端启动测试框架。在客户端启动 oech,其中 IDURL 可以按需填写,ID 建议填写 gitee 上的 issue ID,Server 必须填写为客户端可以直接访问的服务器域名或 ip,用于展示测试报告和作网络测试的服务端。

      # oech
      The openEuler Hardware Compatibility Test Suite
      Please provide your Compatibility Test ID:
      Please provide your Product URL:
      Please provide the Compatibility Test Server (Hostname or Ipaddr):
    2. 进入测试套选择界面。在用例选择界面,框架将自动扫描硬件并选取当前环境可供测试的测试套,输入 edit 可以进入测试套选择界面。

      These tests are recommended to complete the compatibility test:
      No. Run-Now?  Status  Class         Device
      1     yes     NotRun  acpi
      2     yes     NotRun  clock
      3     yes     NotRun  cpufreq
      4     yes     NotRun  disk
      5     yes     NotRun  ethernet      enp3s0
      6     yes     NotRun  ethernet      enp4s0
      7     yes     NotRun  ethernet      enp5s0
      8     yes     NotRun  kdump
      9     yes     NotRun  memory
      10    yes     NotRun  perf
      11    yes     NotRun  system
      12    yes     NotRun  usb
      13    yes     NotRun  watchdog
      Ready to begin testing? (run|edit|quit)
    3. 选择测试套。all|none 分别用于 全选|全取消(必测项 system 不可取消);数字编号可选择测试套,每次只能选择一个数字,按回车符之后 no 变为 yes,表示已选择该测试套。

      Select tests to run:
      No. Run-Now?  Status  Class         Device
      1     no      NotRun  acpi
      2     no      NotRun  clock
      3     no      NotRun  cpufreq
      4     no      NotRun  disk
      5     yes     NotRun  ethernet      enp3s0
      6     no      NotRun  ethernet      enp4s0
      7     no      NotRun  ethernet      enp5s0
      8     no      NotRun  kdump
      9     no      NotRun  memory
      10    no      NotRun  perf
      11    yes     NotRun  system
      12    no      NotRun  usb
      13    no      NotRun  watchdog
      Selection (<number>|all|none|quit|run):
    4. 开始测试。选择完成后输入 run 开始测试。

    5. 上传测试结果。测试完成后可以上传测试结果到服务器,便于结果展示和日志分析。如果上传失败,请检查网络配置,然后重新上传测试结果。

      ...
      -------------  Summary  -------------
      ethernet-enp3s0                  PASS
      system                           FAIL
      Log saved to /usr/share/oech/logs/oech-20200228210118-TnvUJxFb50.tar succ.
      Do you want to submit last result? (y|n) y
      Uploading...
      Successfully uploaded result to server X.X.X.X.

    查看结果

    如何查看

    1. 浏览器打开服务端 IP 地址,点击导航栏 Results 界面,找到对应的测试 id 进入。

      results

    2. 进入单个任务页可以看到具体的测试结果展示,包括环境信息和执行结果等。

      • Submit 表示将结果上传到欧拉官方认证服务器(当前尚未开放)。

      • Devices 查看所有测试设备信息。

      • Runtime 查看测试运行日志。

      • Attachment 下载测试附件。

        result-qemu

    结果说明&建议

    Result 列展示测试结果,结果有两种:PASS 或者 FAIL。如果结果为FAIL,可以直接点击结果来查看执行日志,根据报错对照用例代码进行排查。

    附录:测试项说明

    已有测试项

    1. system

      • 检查本工具是否被修改。
      • 检查 OS 版本和 kernel 版本是否匹配。
      • 检查内核是否被修改/感染。
      • 检查 selinux 是否正常启用。
      • 使用 dmidecode 工具读取硬件信息。
    2. cpufreq

      • 测试 cpu 在不同调频策略下运行频率是否同预期。
      • 测试 cpu 在不同频率下完全同规格计算量所需时间是否与频率值反相关。
    3. clock

      • 测试时间矢量性,不会倒回。
      • 测试 RTC 硬件时钟基本稳定性。
    4. memory

      • 使用 memtester 工具进行内存读写测试。
      • mmap 全部系统可用内存,触发 swap,进行 120s 读写测试。
      • 测试 hugetlb。
      • 内存热插拔测试。
    5. network

      • 使用 ethtool 获取网卡信息和 ifconfig 对网卡进行 down/up 测试。
      • 使用 qperf 测试以太网卡tcp/udp延迟和带宽,以及 http 上传、下载速率。
      • 使用 perftest 测试 InfiniBand 或 RoCE 网卡延迟和带宽。
      • 注意 进行网络带宽测试时,请提前确认服务端网卡速率不小于客户端,并保证测试网络无其他流量干扰。
    6. disk

      使用 fio 工具进行裸盘/文件系统的顺序/随机读写测试。

    7. kdump

      触发 kdump,测试能否正常生成 vmcore 文件并解析。

    8. watchdog

      触发 watchdog,测试系统是否可以正常复位。

    9. perf

      测试 perf 工具是否能正常使用。

    10. cdrom

      使用 mkisofs 和 cdrecord 对光驱进行刻录和读取测试。

    11. ipmi

      使用 ipmitool 查询 IPMI 信息。

    12. nvme

      使用 nvme-cli 工具对盘进行格式化、读写、查询测试。

    13. usb

      插拔 usb 设备,测试 usb 接口能否正常识别。

    14. acpi

      利用 acpidump 工具读取数据。

    新增测试项

    1. tests/ 添加自己的测试模板,实现自己的测试类继承框架 Test

    2. 重要成员变量或函数。

      • 函数 test - 必选,测试主流程。

      • 函数 setup - 测试开始前环境准备,主要用于初始化被测设备相关信息,可以参考 network 测试。

      • 函数 teardown - 测试完成后环境清理,主要用于确保无论测试成功失败都能正确恢复环境,可以参考 network 测试。

      • 变量 requirements - 以数组形式存放测试依赖的 rpm 包名,测试开始前框架自动安装。

      • 变量 rebootrebootup - 若 reboot = True 表示该测试套/测试用例会重启系统,且在重启后继续执行 rebootup 指定的函数,可以参考 kdump 测试。

    项目简介

    Use for check hardware compatibility with openEuler

    发行版本

    当前项目没有发行版本

    贡献者 10

    开发语言

    • Python 82.9 %
    • Makefile 7.7 %
    • C 5.3 %
    • HTML 3.9 %
    • Shell 0.3 %