提交 22ee3a98 编写于 作者: R Richard Henderson

tcg-mips: Hoist args loads

Reviewed-by: NPaolo Bonzini <pbonzini@redhat.com>
Signed-off-by: NRichard Henderson <rth@twiddle.net>
上级 070603f6
...@@ -1345,10 +1345,17 @@ static void tcg_out_qemu_st(TCGContext *s, const TCGArg *args, bool is_64) ...@@ -1345,10 +1345,17 @@ static void tcg_out_qemu_st(TCGContext *s, const TCGArg *args, bool is_64)
static inline void tcg_out_op(TCGContext *s, TCGOpcode opc, static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
const TCGArg *args, const int *const_args) const TCGArg *args, const int *const_args)
{ {
switch(opc) { TCGArg a0, a1, a2;
int c2;
a0 = args[0];
a1 = args[1];
a2 = args[2];
c2 = const_args[2];
switch (opc) {
case INDEX_op_exit_tb: case INDEX_op_exit_tb:
{ {
uintptr_t a0 = args[0];
TCGReg b0 = TCG_REG_ZERO; TCGReg b0 = TCG_REG_ZERO;
if (a0 & ~0xffff) { if (a0 & ~0xffff) {
...@@ -1370,237 +1377,235 @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc, ...@@ -1370,237 +1377,235 @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
} else { } else {
/* indirect jump method */ /* indirect jump method */
tcg_out_ld(s, TCG_TYPE_PTR, TCG_TMP0, TCG_REG_ZERO, tcg_out_ld(s, TCG_TYPE_PTR, TCG_TMP0, TCG_REG_ZERO,
(uintptr_t)(s->tb_next + args[0])); (uintptr_t)(s->tb_next + a0));
tcg_out_opc_reg(s, OPC_JR, 0, TCG_TMP0, 0); tcg_out_opc_reg(s, OPC_JR, 0, TCG_TMP0, 0);
} }
tcg_out_nop(s); tcg_out_nop(s);
s->tb_next_offset[args[0]] = tcg_current_code_size(s); s->tb_next_offset[a0] = tcg_current_code_size(s);
break; break;
case INDEX_op_br: case INDEX_op_br:
tcg_out_brcond(s, TCG_COND_EQ, TCG_REG_ZERO, TCG_REG_ZERO, args[0]); tcg_out_brcond(s, TCG_COND_EQ, TCG_REG_ZERO, TCG_REG_ZERO, a0);
break; break;
case INDEX_op_ld8u_i32: case INDEX_op_ld8u_i32:
tcg_out_ldst(s, OPC_LBU, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_LBU, a0, a1, a2);
break; break;
case INDEX_op_ld8s_i32: case INDEX_op_ld8s_i32:
tcg_out_ldst(s, OPC_LB, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_LB, a0, a1, a2);
break; break;
case INDEX_op_ld16u_i32: case INDEX_op_ld16u_i32:
tcg_out_ldst(s, OPC_LHU, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_LHU, a0, a1, a2);
break; break;
case INDEX_op_ld16s_i32: case INDEX_op_ld16s_i32:
tcg_out_ldst(s, OPC_LH, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_LH, a0, a1, a2);
break; break;
case INDEX_op_ld_i32: case INDEX_op_ld_i32:
tcg_out_ldst(s, OPC_LW, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_LW, a0, a1, a2);
break; break;
case INDEX_op_st8_i32: case INDEX_op_st8_i32:
tcg_out_ldst(s, OPC_SB, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_SB, a0, a1, a2);
break; break;
case INDEX_op_st16_i32: case INDEX_op_st16_i32:
tcg_out_ldst(s, OPC_SH, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_SH, a0, a1, a2);
break; break;
case INDEX_op_st_i32: case INDEX_op_st_i32:
tcg_out_ldst(s, OPC_SW, args[0], args[1], args[2]); tcg_out_ldst(s, OPC_SW, a0, a1, a2);
break; break;
case INDEX_op_add_i32: case INDEX_op_add_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_imm(s, OPC_ADDIU, args[0], args[1], args[2]); tcg_out_opc_imm(s, OPC_ADDIU, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_ADDU, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_ADDU, a0, a1, a2);
} }
break; break;
case INDEX_op_add2_i32: case INDEX_op_add2_i32:
if (const_args[4]) { if (const_args[4]) {
tcg_out_opc_imm(s, OPC_ADDIU, TCG_TMP0, args[2], args[4]); tcg_out_opc_imm(s, OPC_ADDIU, TCG_TMP0, a2, args[4]);
} else { } else {
tcg_out_opc_reg(s, OPC_ADDU, TCG_TMP0, args[2], args[4]); tcg_out_opc_reg(s, OPC_ADDU, TCG_TMP0, a2, args[4]);
} }
tcg_out_opc_reg(s, OPC_SLTU, TCG_TMP1, TCG_TMP0, args[2]); tcg_out_opc_reg(s, OPC_SLTU, TCG_TMP1, TCG_TMP0, a2);
if (const_args[5]) { if (const_args[5]) {
tcg_out_opc_imm(s, OPC_ADDIU, args[1], args[3], args[5]); tcg_out_opc_imm(s, OPC_ADDIU, a1, args[3], args[5]);
} else { } else {
tcg_out_opc_reg(s, OPC_ADDU, args[1], args[3], args[5]); tcg_out_opc_reg(s, OPC_ADDU, a1, args[3], args[5]);
} }
tcg_out_opc_reg(s, OPC_ADDU, args[1], args[1], TCG_TMP1); tcg_out_opc_reg(s, OPC_ADDU, a1, a1, TCG_TMP1);
tcg_out_mov(s, TCG_TYPE_I32, args[0], TCG_TMP0); tcg_out_mov(s, TCG_TYPE_I32, a0, TCG_TMP0);
break; break;
case INDEX_op_sub_i32: case INDEX_op_sub_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_imm(s, OPC_ADDIU, args[0], args[1], -args[2]); tcg_out_opc_imm(s, OPC_ADDIU, a0, a1, -a2);
} else { } else {
tcg_out_opc_reg(s, OPC_SUBU, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_SUBU, a0, a1, a2);
} }
break; break;
case INDEX_op_sub2_i32: case INDEX_op_sub2_i32:
if (const_args[4]) { if (const_args[4]) {
tcg_out_opc_imm(s, OPC_ADDIU, TCG_TMP0, args[2], -args[4]); tcg_out_opc_imm(s, OPC_ADDIU, TCG_TMP0, a2, -args[4]);
} else { } else {
tcg_out_opc_reg(s, OPC_SUBU, TCG_TMP0, args[2], args[4]); tcg_out_opc_reg(s, OPC_SUBU, TCG_TMP0, a2, args[4]);
} }
tcg_out_opc_reg(s, OPC_SLTU, TCG_TMP1, args[2], TCG_TMP0); tcg_out_opc_reg(s, OPC_SLTU, TCG_TMP1, a2, TCG_TMP0);
if (const_args[5]) { if (const_args[5]) {
tcg_out_opc_imm(s, OPC_ADDIU, args[1], args[3], -args[5]); tcg_out_opc_imm(s, OPC_ADDIU, a1, args[3], -args[5]);
} else { } else {
tcg_out_opc_reg(s, OPC_SUBU, args[1], args[3], args[5]); tcg_out_opc_reg(s, OPC_SUBU, a1, args[3], args[5]);
} }
tcg_out_opc_reg(s, OPC_SUBU, args[1], args[1], TCG_TMP1); tcg_out_opc_reg(s, OPC_SUBU, a1, a1, TCG_TMP1);
tcg_out_mov(s, TCG_TYPE_I32, args[0], TCG_TMP0); tcg_out_mov(s, TCG_TYPE_I32, a0, TCG_TMP0);
break; break;
case INDEX_op_mul_i32: case INDEX_op_mul_i32:
if (use_mips32_instructions) { if (use_mips32_instructions) {
tcg_out_opc_reg(s, OPC_MUL, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_MUL, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_MULT, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_MULT, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFLO, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFLO, a0, 0, 0);
} }
break; break;
case INDEX_op_muls2_i32: case INDEX_op_muls2_i32:
tcg_out_opc_reg(s, OPC_MULT, 0, args[2], args[3]); tcg_out_opc_reg(s, OPC_MULT, 0, a2, args[3]);
tcg_out_opc_reg(s, OPC_MFLO, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFLO, a0, 0, 0);
tcg_out_opc_reg(s, OPC_MFHI, args[1], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a1, 0, 0);
break; break;
case INDEX_op_mulu2_i32: case INDEX_op_mulu2_i32:
tcg_out_opc_reg(s, OPC_MULTU, 0, args[2], args[3]); tcg_out_opc_reg(s, OPC_MULTU, 0, a2, args[3]);
tcg_out_opc_reg(s, OPC_MFLO, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFLO, a0, 0, 0);
tcg_out_opc_reg(s, OPC_MFHI, args[1], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a1, 0, 0);
break; break;
case INDEX_op_mulsh_i32: case INDEX_op_mulsh_i32:
tcg_out_opc_reg(s, OPC_MULT, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_MULT, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFHI, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a0, 0, 0);
break; break;
case INDEX_op_muluh_i32: case INDEX_op_muluh_i32:
tcg_out_opc_reg(s, OPC_MULTU, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_MULTU, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFHI, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a0, 0, 0);
break; break;
case INDEX_op_div_i32: case INDEX_op_div_i32:
tcg_out_opc_reg(s, OPC_DIV, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_DIV, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFLO, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFLO, a0, 0, 0);
break; break;
case INDEX_op_divu_i32: case INDEX_op_divu_i32:
tcg_out_opc_reg(s, OPC_DIVU, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_DIVU, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFLO, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFLO, a0, 0, 0);
break; break;
case INDEX_op_rem_i32: case INDEX_op_rem_i32:
tcg_out_opc_reg(s, OPC_DIV, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_DIV, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFHI, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a0, 0, 0);
break; break;
case INDEX_op_remu_i32: case INDEX_op_remu_i32:
tcg_out_opc_reg(s, OPC_DIVU, 0, args[1], args[2]); tcg_out_opc_reg(s, OPC_DIVU, 0, a1, a2);
tcg_out_opc_reg(s, OPC_MFHI, args[0], 0, 0); tcg_out_opc_reg(s, OPC_MFHI, a0, 0, 0);
break; break;
case INDEX_op_and_i32: case INDEX_op_and_i32:
if (const_args[2]) { if (c2) {
if (args[2] == (uint16_t)args[2]) { if (a2 == (uint16_t)a2) {
tcg_out_opc_imm(s, OPC_ANDI, args[0], args[1], args[2]); tcg_out_opc_imm(s, OPC_ANDI, a0, a1, a2);
} else { } else {
int msb = ctz32(~args[2]) - 1; int msb = ctz32(~a2) - 1;
assert(use_mips32r2_instructions); assert(use_mips32r2_instructions);
assert(is_p2m1(args[2])); assert(is_p2m1(a2));
tcg_out_opc_bf(s, OPC_EXT, args[0], args[1], msb, 0); tcg_out_opc_bf(s, OPC_EXT, a0, a1, msb, 0);
} }
} else { } else {
tcg_out_opc_reg(s, OPC_AND, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_AND, a0, a1, a2);
} }
break; break;
case INDEX_op_or_i32: case INDEX_op_or_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_imm(s, OPC_ORI, args[0], args[1], args[2]); tcg_out_opc_imm(s, OPC_ORI, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_OR, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_OR, a0, a1, a2);
} }
break; break;
case INDEX_op_nor_i32: case INDEX_op_nor_i32:
tcg_out_opc_reg(s, OPC_NOR, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_NOR, a0, a1, a2);
break; break;
case INDEX_op_not_i32: case INDEX_op_not_i32:
tcg_out_opc_reg(s, OPC_NOR, args[0], TCG_REG_ZERO, args[1]); tcg_out_opc_reg(s, OPC_NOR, a0, TCG_REG_ZERO, a1);
break; break;
case INDEX_op_xor_i32: case INDEX_op_xor_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_imm(s, OPC_XORI, args[0], args[1], args[2]); tcg_out_opc_imm(s, OPC_XORI, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_XOR, args[0], args[1], args[2]); tcg_out_opc_reg(s, OPC_XOR, a0, a1, a2);
} }
break; break;
case INDEX_op_sar_i32: case INDEX_op_sar_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_sa(s, OPC_SRA, args[0], args[1], args[2]); tcg_out_opc_sa(s, OPC_SRA, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_SRAV, args[0], args[2], args[1]); tcg_out_opc_reg(s, OPC_SRAV, a0, a2, a1);
} }
break; break;
case INDEX_op_shl_i32: case INDEX_op_shl_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_sa(s, OPC_SLL, args[0], args[1], args[2]); tcg_out_opc_sa(s, OPC_SLL, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_SLLV, args[0], args[2], args[1]); tcg_out_opc_reg(s, OPC_SLLV, a0, a2, a1);
} }
break; break;
case INDEX_op_shr_i32: case INDEX_op_shr_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_sa(s, OPC_SRL, args[0], args[1], args[2]); tcg_out_opc_sa(s, OPC_SRL, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_SRLV, args[0], args[2], args[1]); tcg_out_opc_reg(s, OPC_SRLV, a0, a2, a1);
} }
break; break;
case INDEX_op_rotl_i32: case INDEX_op_rotl_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_sa(s, OPC_ROTR, args[0], args[1], 0x20 - args[2]); tcg_out_opc_sa(s, OPC_ROTR, a0, a1, 32 - a2);
} else { } else {
tcg_out_movi(s, TCG_TYPE_I32, TCG_TMP0, 32); tcg_out_opc_reg(s, OPC_SUBU, TCG_TMP0, TCG_REG_ZERO, a2);
tcg_out_opc_reg(s, OPC_SUBU, TCG_TMP0, TCG_TMP0, args[2]); tcg_out_opc_reg(s, OPC_ROTRV, a0, TCG_TMP0, a1);
tcg_out_opc_reg(s, OPC_ROTRV, args[0], TCG_TMP0, args[1]);
} }
break; break;
case INDEX_op_rotr_i32: case INDEX_op_rotr_i32:
if (const_args[2]) { if (c2) {
tcg_out_opc_sa(s, OPC_ROTR, args[0], args[1], args[2]); tcg_out_opc_sa(s, OPC_ROTR, a0, a1, a2);
} else { } else {
tcg_out_opc_reg(s, OPC_ROTRV, args[0], args[2], args[1]); tcg_out_opc_reg(s, OPC_ROTRV, a0, a2, a1);
} }
break; break;
case INDEX_op_bswap16_i32: case INDEX_op_bswap16_i32:
tcg_out_opc_reg(s, OPC_WSBH, args[0], 0, args[1]); tcg_out_opc_reg(s, OPC_WSBH, a0, 0, a1);
break; break;
case INDEX_op_bswap32_i32: case INDEX_op_bswap32_i32:
tcg_out_opc_reg(s, OPC_WSBH, args[0], 0, args[1]); tcg_out_opc_reg(s, OPC_WSBH, a0, 0, a1);
tcg_out_opc_sa(s, OPC_ROTR, args[0], args[0], 16); tcg_out_opc_sa(s, OPC_ROTR, a0, a0, 16);
break; break;
case INDEX_op_ext8s_i32: case INDEX_op_ext8s_i32:
tcg_out_opc_reg(s, OPC_SEB, args[0], 0, args[1]); tcg_out_opc_reg(s, OPC_SEB, a0, 0, a1);
break; break;
case INDEX_op_ext16s_i32: case INDEX_op_ext16s_i32:
tcg_out_opc_reg(s, OPC_SEH, args[0], 0, args[1]); tcg_out_opc_reg(s, OPC_SEH, a0, 0, a1);
break; break;
case INDEX_op_deposit_i32: case INDEX_op_deposit_i32:
tcg_out_opc_bf(s, OPC_INS, args[0], args[2], tcg_out_opc_bf(s, OPC_INS, a0, a2, args[3] + args[4] - 1, args[3]);
args[3] + args[4] - 1, args[3]);
break; break;
case INDEX_op_brcond_i32: case INDEX_op_brcond_i32:
tcg_out_brcond(s, args[2], args[0], args[1], args[3]); tcg_out_brcond(s, a2, a0, a1, args[3]);
break; break;
case INDEX_op_brcond2_i32: case INDEX_op_brcond2_i32:
tcg_out_brcond2(s, args[4], args[0], args[1], args[2], args[3], args[5]); tcg_out_brcond2(s, args[4], a0, a1, a2, args[3], args[5]);
break; break;
case INDEX_op_movcond_i32: case INDEX_op_movcond_i32:
tcg_out_movcond(s, args[5], args[0], args[1], args[2], args[3]); tcg_out_movcond(s, args[5], a0, a1, a2, args[3]);
break; break;
case INDEX_op_setcond_i32: case INDEX_op_setcond_i32:
tcg_out_setcond(s, args[3], args[0], args[1], args[2]); tcg_out_setcond(s, args[3], a0, a1, a2);
break; break;
case INDEX_op_setcond2_i32: case INDEX_op_setcond2_i32:
tcg_out_setcond2(s, args[5], args[0], args[1], args[2], args[3], args[4]); tcg_out_setcond2(s, args[5], a0, a1, a2, args[3], args[4]);
break; break;
case INDEX_op_qemu_ld_i32: case INDEX_op_qemu_ld_i32:
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册