提交 · 9b856defbe355f886f99777e667506841bd267a8 · openeuler / Kernel

31 7月, 2020 2 次提交

drm/amdgpu: enable GFXOFF for navy_flounder · 74b35959

由 Jiansong Chen 提交于 7月 30, 2020

Enable GFXOFF for navy_flounder.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NLikun Gao <Likun.Gao@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

74b35959

drm/amdgpu: update GC golden setting for navy_flounder · defa4896

由 Jiansong Chen 提交于 7月 29, 2020

Update GC golden setting for navy_flounder.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

defa4896

28 7月, 2020 1 次提交

drm/amdgpu: fix system hang issue during GPU reset · df9c8d1a

由 Dennis Li 提交于 7月 08, 2020

when GPU hang, driver has multi-paths to enter amdgpu_device_gpu_recover,
the atomic adev->in_gpu_reset and hive->in_reset are used to avoid
re-entering GPU recovery.

During GPU reset and resume, it is unsafe that other threads access GPU,
which maybe cause GPU reset failed. Therefore the new rw_semaphore
adev->reset_sem is introduced, which protect GPU from being accessed by
external threads during recovery.

v2:
1. add rwlock for some ioctls, debugfs and file-close function.
2. change to use dqm->is_resetting and dqm_lock for protection in kfd
driver.
3. remove try_lock and change adev->in_gpu_reset as atomic, to avoid
re-enter GPU recovery for the same GPU hang.

v3:
1. change back to use adev->reset_sem to protect kfd callback
functions, because dqm_lock couldn't protect all codes, for example:
free_mqd must be called outside of dqm_lock;

[ 1230.176199] Hardware name: Supermicro SYS-7049GP-TRT/X11DPG-QT, BIOS 3.1 05/23/2019
[ 1230.177221] Call Trace:
[ 1230.178249]  dump_stack+0x98/0xd5
[ 1230.179443]  amdgpu_virt_kiq_reg_write_reg_wait+0x181/0x190 [amdgpu]
[ 1230.180673]  gmc_v9_0_flush_gpu_tlb+0xcc/0x310 [amdgpu]
[ 1230.181882]  amdgpu_gart_unbind+0xa9/0xe0 [amdgpu]
[ 1230.183098]  amdgpu_ttm_backend_unbind+0x46/0x180 [amdgpu]
[ 1230.184239]  ? ttm_bo_put+0x171/0x5f0 [ttm]
[ 1230.185394]  ttm_tt_unbind+0x21/0x40 [ttm]
[ 1230.186558]  ttm_tt_destroy.part.12+0x12/0x60 [ttm]
[ 1230.187707]  ttm_tt_destroy+0x13/0x20 [ttm]
[ 1230.188832]  ttm_bo_cleanup_memtype_use+0x36/0x80 [ttm]
[ 1230.189979]  ttm_bo_put+0x1be/0x5f0 [ttm]
[ 1230.191230]  amdgpu_bo_unref+0x1e/0x30 [amdgpu]
[ 1230.192522]  amdgpu_amdkfd_free_gtt_mem+0xaf/0x140 [amdgpu]
[ 1230.193833]  free_mqd+0x25/0x40 [amdgpu]
[ 1230.195143]  destroy_queue_cpsch+0x1a7/0x270 [amdgpu]
[ 1230.196475]  pqm_destroy_queue+0x105/0x260 [amdgpu]
[ 1230.197819]  kfd_ioctl_destroy_queue+0x37/0x70 [amdgpu]
[ 1230.199154]  kfd_ioctl+0x277/0x500 [amdgpu]
[ 1230.200458]  ? kfd_ioctl_get_clock_counters+0x60/0x60 [amdgpu]
[ 1230.201656]  ? tomoyo_file_ioctl+0x19/0x20
[ 1230.202831]  ksys_ioctl+0x98/0xb0
[ 1230.204004]  __x64_sys_ioctl+0x1a/0x20
[ 1230.205174]  do_syscall_64+0x5f/0x250
[ 1230.206339]  entry_SYSCALL_64_after_hwframe+0x49/0xbe

2. remove try_lock and introduce atomic hive->in_reset, to avoid
re-enter GPU recovery.

v4:
1. remove an unnecessary whitespace change in kfd_chardev.c
2. remove comment codes in amdgpu_device.c
3. add more detailed comment in commit message
4. define a wrap function amdgpu_in_reset

v5:
1. Fix some style issues.
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Suggested-by: NAndrey Grodzovsky <andrey.grodzovsky@amd.com>
Suggested-by: NChristian König <christian.koenig@amd.com>
Suggested-by: NFelix Kuehling <Felix.Kuehling@amd.com>
Suggested-by: NLijo Lazar <Lijo.Lazar@amd.com>
Suggested-by: NLuben Tukov <luben.tuikov@amd.com>
Signed-off-by: NDennis Li <Dennis.Li@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

df9c8d1a

23 7月, 2020 1 次提交

drm/amdgpu: update golden setting for sienna_cichlid · 8f3b800a

由 Likun Gao 提交于 7月 23, 2020

Update golden setting for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

8f3b800a

16 7月, 2020 8 次提交

drm/amdgpu: enable cp_fw_write_wait for navy_flounder · c5b6c914

由 Jiansong Chen 提交于 6月 24, 2020

It's the same with sienna_cichlid, cp fw for navy_flounder
can support WAIT_REG_MEM packet.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

c5b6c914

drm/amdgpu/gfx10: add gc golden setting for navy_flounder · 41e3b1c1

由 Jiansong Chen 提交于 6月 10, 2020

Add gc golden setting for navy_flounder
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

41e3b1c1

drm/amdgpu: force pa_sc_tile_steering_override to 0 for navy_flounder · 8f8463dd

由 Jiansong Chen 提交于 4月 13, 2020

pa_sc_tile_steering_override is only programmable for
gfx10.0/10.1/10.2, and navy_flounder has the same gfx10.3 IP
with sienna_cichlid.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

8f8463dd

drm/amdgpu: configure navy_flounder gfx according to gfx 10.3 · c4a8b802

由 Tao Zhou 提交于 2月 20, 2020

The gfx version of navy_flounder is 10.3, identical to
sienna_cichlid, follow the way of sienna_cichlid.
Signed-off-by: NTao Zhou <tao.zhou1@amd.com>
Reviewed-by: NJiansong Chen <Jiansong.Chen@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

c4a8b802

drm/amdgpu: add gfx ip block for navy_flounder · 885eb3fa

由 Jiansong Chen 提交于 2月 13, 2020

since navy_flounder has similar gc IP version with
sienna_cichlid, follow its setting for the moment.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <Tao.Zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

885eb3fa

drm/amdgpu/gfx10: add clockgating support for navy_flounder · d463d8c9

由 Jiansong Chen 提交于 2月 10, 2020

Same as navi10.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

d463d8c9

drm/amdgpu/gfx10: add support for navy_flounder firmware · 65010193

由 Jiansong Chen 提交于 2月 10, 2020

Declare the gfx/compute firmwares.
Signed-off-by: NJiansong Chen <Jiansong.Chen@amd.com>
Reviewed-by: NTao Zhou <tao.zhou1@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

65010193

drm/amdgpu: optimize rlcg write for gfx_v10 · fc30e840

由 Jack Zhang 提交于 6月 24, 2020

For gfx10 boards, except for nv12, other boards take mmio write
rather than rlcg write
Signed-off-by: NJack Zhang <Jack.Zhang1@amd.com>
Acked-by: NAlex Deucher <alexander.deucher@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

fc30e840

11 7月, 2020 2 次提交

drm/amdgpu/gfx10: fix race condition for kiq · 926ee775

由 Jack Xiao 提交于 7月 10, 2020

During preemption test for gfx10, it uses kiq to trigger
gfx preemption, which would result in race condition
with flushing TLB for kiq.
Signed-off-by: NJack Xiao <Jack.Xiao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Acked-by: NChristian König <christian.koenig@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

926ee775

drm/amdgpu: remove unnecessary logic of ASIC check · 1cb63593

由 Likun Gao 提交于 7月 08, 2020

Remove some unused ASIC check logic.
Remove some definition of amdgpu_device which only used by
the removed ASIC check logic.(V2)
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

1cb63593

08 7月, 2020 1 次提交

drm/amdgpu: use RREG32_KIQ to read register when get cg state · 2373dd48

由 Likun Gao 提交于 7月 06, 2020

Use RREG32_KIQ to read gfx register when try to get gfx/sdma
clockgating state instead of RREG32, as it will result
to system hard hang when GPU is enter into GFXOFF state.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

2373dd48

03 7月, 2020 1 次提交

drm/amdgpu: Clean up KFD VMID assignment · 40111ec2

由 Felix Kuehling 提交于 6月 24, 2020

The KFD VMID assignment was hard-coded in a few places. Consolidate that in
a single variable adev->vm_manager.first_kfd_vmid. The value is still
assigned in gmc-ip-version-specific code.
Signed-off-by: NFelix Kuehling <Felix.Kuehling@amd.com>
Reviewed-by: NChristian König <christian.koenig@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

40111ec2

01 7月, 2020 14 次提交

drm/amdgpu/sriov: Need to clear kiq position · 7ef869ef

由 Emily Deng 提交于 6月 11, 2020

As will clear vf fw during unload driver, to avoid idle fail. Need
to clear KIQ portion also.
Signed-off-by: NEmily Deng <Emily.Deng@amd.com>
Ack-by: NMonk.liu <monk.liu@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

7ef869ef

drm/amdgpu: update golden setting for sienna_cichlid · 04af75ef

由 Likun Gao 提交于 5月 08, 2020

Update golden setting for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

04af75ef

drm/amdgpu: enable gfxoff for sienna_cichlid · e0da123a

由 Likun Gao 提交于 5月 29, 2020

Enable GFXOFF for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NKenneth Feng <kenneth.feng@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

e0da123a

drm/amdgpu: only use one gfx pipe for Sienna_Cichlid · f64668f9

由 Likun Gao 提交于 4月 17, 2020

Only enable one gfx pipe for sienna_cichlid currently.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Acked-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

f64668f9

drm/amdgpu/sriov : Use kiq to do tlb invalidation for gfx10 on sriov · 8db1015b

由 shaoyunl 提交于 4月 09, 2020

On SRIOV run time, driver shouldn't directly access invalidation registers through MMIO.
Use kiq to submit wait_reg_mem package for the invalidation
Signed-off-by: Nshaoyunl <shaoyun.liu@amd.com>
Reviewed-by: NChristian König <christian.koenig@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

8db1015b

drm/amdgpu: update golden setting for sienna_cichlid · 046c18f4

由 Likun Gao 提交于 3月 30, 2020

Update golden setting for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NKenneth Feng <kenneth.feng@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

046c18f4

drm/amdgpu: enable 3D pipe 1 on Sienna_Cichlid · 689dede0

由 Likun Gao 提交于 3月 03, 2020

Only disable 3D pipe 1 on navi1x, enable 3D pipe 1 on Sienna_Cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NFeifei Xu <Feifei.Xu@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

689dede0

drm/amdgpu: update golden setting for gfx10.3 · 850e56ba

由 Likun Gao 提交于 2月 14, 2020

Update gfx golden setting for gfx10.3.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NAlex Deucher <alexander.deucher@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

850e56ba

drm/amdgpu: drop gfx_v10_0_tiling_mode_table_init · 321b3eeb

由 Hawking Zhang 提交于 1月 20, 2020

tiling mode table is not used anymore for gfx10
Signed-off-by: NHawking Zhang <Hawking.Zhang@amd.com>
Reviewed-by: NLikun Gao <Likun.Gao@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

321b3eeb

drm/amdgpu: disable gfxoff for sienna_cichlid · f95c2046

由 Likun Gao 提交于 1月 20, 2020

Temporary disable gfxoff for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

f95c2046

drm/amdgpu: add cp firmware backdoor loading triger · 0f7ee057

由 Likun Gao 提交于 1月 17, 2020

Triger CP ucode addr and data to backdoor load CP firmware.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

0f7ee057

drm/amdgpu: force pa_sc_tile_steering_override to 0 for gfx10.3 · 305401e7

由 Hawking Zhang 提交于 1月 16, 2020

pa_sc_tile_steering_override is only programmable for
gfx10.0/10.1/10.2
Signed-off-by: NHawking Zhang <Hawking.Zhang@amd.com>
Reviewed-by: NLikun Gao <Likun.Gao@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

305401e7

drm/amdgpu/gfx10: add gc golden setting for sienna_cichlid · 263acd47

由 Likun Gao 提交于 4月 09, 2020

Add gc golden setting for sienna_cichlid.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

263acd47

drm/amdgpu: update the num of queue per pipe for mec on sienna_cichlid · 83a0c342

由 Likun Gao 提交于 10月 24, 2019

The number of queue per pipe for mec on sienna_cichlid should be 4.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHuang Rui <ray.huang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

83a0c342

04 6月, 2020 4 次提交

drm/amdgpu/gfx10: change register configure for sienna_cichlid · 58139a42

由 Likun Gao 提交于 5月 29, 2020

Update sienna_cichlid register configuration for sienna_cichlid
to match the update of header files.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

58139a42

drm/amdgpu: add gfx ip block for sienna_cichlid (v3) · 933c8a93

由 Likun Gao 提交于 5月 01, 2020

Add support for GC 10.3.

v2: Squash in gb_addr_config fix (Alex)
v3: Add num_pkrs support (Alex)
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

933c8a93

drm/amdgpu/gfx10: add clockgating support for sienna_cichlid · 2f7f5227

由 Likun Gao 提交于 3月 19, 2019

Same as navi10.
Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

2f7f5227

drm/amdgpu/gfx10: add support for sienna_cichlid firmware · 6c063330

由 Likun Gao 提交于 3月 19, 2019

Signed-off-by: NLikun Gao <Likun.Gao@amd.com>
Reviewed-by: NHawking Zhang <Hawking.Zhang@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

6c063330

29 5月, 2020 2 次提交

drm/amd/amdgpu: Fix the CGCG setting is overwritten for SRIOV. · b0f8a6d5

由 Gavin Wan 提交于 5月 21, 2020

For SRIOV, since the CP_INT_CNTL_RING0 is programed on host side.
The Guest should not program CP_INT_CNTL_RING0 again.
Signed-off-by: NGavin Wan <Gavin.Wan@amd.com>
Reviewed-by: NMonk Liu <Monk.Liu@amd.com>
Acked-by: NAlex Deucher <alexander.deucher@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

b0f8a6d5

drm/amdgpu/gfx10: add navi12 to gfxoff case · ac4e189a

由 Alex Deucher 提交于 5月 18, 2020

Looks like it should be handled here as well.
Reviewed-by: NEvan Quan <evan.quan@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

ac4e189a

18 5月, 2020 2 次提交

drm/amdgpu: apply AMDGPU_IB_FLAG_EMIT_MEM_SYNC to compute IBs too (v3) · d35745bb

由 Marek Olšák 提交于 4月 27, 2020

Compute IBs need this too.

v2: split out version bump
v3: squash in emit frame count fixes
Signed-off-by: NMarek Olšák <marek.olsak@amd.com>
Reviewed-by: NChristian König <christian.koenig@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

d35745bb

drm/amdgpu: Add mem_sync implementation for all the ASICs. · 2f9ce2a3

由 Andrey Grodzovsky 提交于 5月 08, 2020

Implement the .mem_sync hook defined earlier.

v2: Rename functions
Signed-off-by: NAndrey Grodzovsky <andrey.grodzovsky@amd.com>
Reviewed-by: NLuben Tuikov <luben.tuikov@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

2f9ce2a3

15 5月, 2020 1 次提交

drm/amdgpu: turn back rlcg write for gfx_v10 · 72d99b39

由 Yintian Tao 提交于 5月 12, 2020

There is no need to use amdgpu_mm_wreg_mmio_rlc()
during initialization time because this interface
is only designed for debugfs case to access the
registers which are only permitted by RLCG during
run-time. Therefore, turn back rlcg write for gfx_v10.
If we not turn back it, it will raise amdgpu load failure.
[   54.904333] amdgpu: SMU driver if version not matched
[   54.904393] amdgpu: SMU is initialized successfully!
[   54.905971] [drm] kiq ring mec 2 pipe 1 q 0
[   55.115416] amdgpu 0000:00:06.0: [drm:amdgpu_ring_test_helper [amdgpu]] *ERROR* ring gfx_0.0.0 test failed (-110)
[   55.118877] [drm:amdgpu_device_init [amdgpu]] *ERROR* hw_init of IP block <gfx_v10_0> failed -110
[   55.126587] amdgpu 0000:00:06.0: amdgpu_device_ip_init failed
[   55.133466] amdgpu 0000:00:06.0: Fatal error during GPU init
Signed-off-by: NYintian Tao <yttao@amd.com>
Acked-by: NAlex Deucher <alexander.deucher@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

72d99b39

09 5月, 2020 1 次提交

drm/amdgpu: implement soft_recovery for gfx10 · bff1a611

由 Alex Deucher 提交于 5月 08, 2020

Same as gfx9.  This allows us to kill the waves for hung
shaders.
Acked-by: NEvan Quan <evan.quan@amd.com>
Reviewed-by: NChristian König <christian.koenig@amd.com>
Signed-off-by: NAlex Deucher <alexander.deucher@amd.com>

bff1a611

openeuler / Kernel 1 年多 前同步成功

openeuler / Kernel
1 年多前同步成功