/external/llvm/test/CodeGen/X86/ |
sdiv-exact.ll | 25 ; CHECK: pmuludq 26 ; CHECK: pmuludq
|
combine-multiplies.ll | 78 ; pmuludq %xmm2, %xmm0 80 ; pmuludq %xmm2, %xmm3 93 ; pmuludq instructions), followed by two adds. Without this optimization, we'd 94 ; do 2 adds, followed by 2 multiplies (i.e. 4 pmuludq instructions). 101 ; CHECK-NEXT: pmuludq [[C22]], [[T2:%xmm[0-9]]] 103 ; CHECK-NEXT: pmuludq [[C22]], [[T4:%xmm[0-9]]] 139 ; CHECK-NEXT: pmuludq [[C22]], [[T2:%xmm[0-9]]] 142 ; CHECK-NEXT: pmuludq [[T1]], [[T7]]
|
pmul.ll | 76 ; SSE2-NEXT: pmuludq %xmm1, %xmm0 78 ; SSE2-NEXT: pmuludq %xmm1, %xmm2 103 ; SSE-NEXT: pmuludq %xmm1, %xmm2 105 ; SSE-NEXT: pmuludq %xmm1, %xmm0 198 ; SSE2-NEXT: pmuludq %xmm1, %xmm0 201 ; SSE2-NEXT: pmuludq %xmm2, %xmm1 224 ; SSE-NEXT: pmuludq %xmm1, %xmm2 227 ; SSE-NEXT: pmuludq %xmm0, %xmm3 231 ; SSE-NEXT: pmuludq %xmm1, %xmm0 265 ; SSE2-NEXT: pmuludq %xmm2, %xmm [all...] |
vector-idiv.ll | 14 ; SSE41-NEXT: pmuludq %xmm2, %xmm3 15 ; SSE41-NEXT: pmuludq %xmm0, %xmm1 28 ; SSE-NEXT: pmuludq %xmm1, %xmm2 32 ; SSE-NEXT: pmuludq %xmm1, %xmm3 65 ; SSE41-NEXT: pmuludq %xmm3, %xmm4 67 ; SSE41-NEXT: pmuludq %xmm2, %xmm5 75 ; SSE41-NEXT: pmuludq %xmm3, %xmm4 76 ; SSE41-NEXT: pmuludq %xmm1, %xmm2 89 ; SSE-NEXT: pmuludq %xmm2, %xmm3 93 ; SSE-NEXT: pmuludq %xmm4, %xmm [all...] |
/external/boringssl/linux-x86/crypto/bn/ |
x86-mont.S | 63 pmuludq %mm4,%mm5 67 pmuludq 20(%esp),%mm5 68 pmuludq %mm5,%mm3 77 pmuludq %mm4,%mm0 78 pmuludq %mm5,%mm1 92 pmuludq %mm4,%mm0 93 pmuludq %mm5,%mm1 111 pmuludq %mm4,%mm5 116 pmuludq 20(%esp),%mm5 117 pmuludq %mm5,%mm [all...] |
bn-586.S | 27 pmuludq %mm0,%mm2 29 pmuludq %mm0,%mm4 31 pmuludq %mm0,%mm6 33 pmuludq %mm0,%mm7 43 pmuludq %mm0,%mm2 46 pmuludq %mm0,%mm4 49 pmuludq %mm0,%mm6 54 pmuludq %mm0,%mm3 91 pmuludq %mm0,%mm2 308 pmuludq %mm0,%mm [all...] |
/external/boringssl/mac-x86/crypto/bn/ |
x86-mont.S | 62 pmuludq %mm4,%mm5 66 pmuludq 20(%esp),%mm5 67 pmuludq %mm5,%mm3 76 pmuludq %mm4,%mm0 77 pmuludq %mm5,%mm1 91 pmuludq %mm4,%mm0 92 pmuludq %mm5,%mm1 110 pmuludq %mm4,%mm5 115 pmuludq 20(%esp),%mm5 116 pmuludq %mm5,%mm [all...] |
bn-586.S | 26 pmuludq %mm0,%mm2 28 pmuludq %mm0,%mm4 30 pmuludq %mm0,%mm6 32 pmuludq %mm0,%mm7 42 pmuludq %mm0,%mm2 45 pmuludq %mm0,%mm4 48 pmuludq %mm0,%mm6 53 pmuludq %mm0,%mm3 90 pmuludq %mm0,%mm2 305 pmuludq %mm0,%mm [all...] |
/external/boringssl/win-x86/crypto/bn/ |
x86-mont.asm | 72 pmuludq mm5,mm4 76 pmuludq mm5,[20+esp] 77 pmuludq mm3,mm5 86 pmuludq mm0,mm4 87 pmuludq mm1,mm5 101 pmuludq mm0,mm4 102 pmuludq mm1,mm5 120 pmuludq mm5,mm4 125 pmuludq mm5,[20+esp] 126 pmuludq mm3,mm [all...] |
bn-586.asm | 36 pmuludq mm2,mm0 38 pmuludq mm4,mm0 40 pmuludq mm6,mm0 42 pmuludq mm7,mm0 52 pmuludq mm2,mm0 55 pmuludq mm4,mm0 58 pmuludq mm6,mm0 63 pmuludq mm3,mm0 100 pmuludq mm2,mm0 311 pmuludq mm2,mm [all...] |
/toolchain/binutils/binutils-2.25/gas/testsuite/gas/i386/ |
x86-64-simd.s | 123 pmuludq %mm1,%mm0 124 pmuludq (%rax),%mm0 125 pmuludq %xmm1,%xmm0 126 pmuludq (%rax),%xmm0 245 pmuludq mm1,QWORD PTR [rax] label 246 pmuludq mm1,QWORD PTR [rax] label 247 pmuludq xmm1,XMMWORD PTR [rax] label 248 pmuludq xmm1,XMMWORD PTR [rax] label
|
sse2.s | 140 pmuludq %mm0, %mm1 141 pmuludq (%eax), %mm1 142 pmuludq %xmm0, %xmm1 143 pmuludq (%eax), %xmm1
|
sse-noavx.s | 46 pmuludq %mm0, %mm1
|
x86-64-sse-noavx.s | 47 pmuludq %mm0, %mm1
|
x86-64-simd-intel.d | 124 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq mm0,mm1 125 [ ]*[a-f0-9]+: 0f f4 00 pmuludq mm0,QWORD PTR \[rax\] 126 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq xmm0,xmm1 127 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq xmm0,XMMWORD PTR \[rax\] 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq mm1,QWORD PTR \[rax\] 244 [ ]*[a-f0-9]+: 0f f4 08 pmuludq mm1,QWORD PTR \[rax\] 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq xmm1,XMMWORD PTR \[rax\] 246 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq xmm1,XMMWORD PTR \[rax\]
|
x86-64-simd-suffix.d | 124 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq %mm1,%mm0 125 [ ]*[a-f0-9]+: 0f f4 00 pmuludq \(%rax\),%mm0 126 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq %xmm1,%xmm0 127 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq \(%rax\),%xmm0 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 244 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1 246 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1
|
x86-64-simd.d | 123 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq %mm1,%mm0 124 [ ]*[a-f0-9]+: 0f f4 00 pmuludq \(%rax\),%mm0 125 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq %xmm1,%xmm0 126 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq \(%rax\),%xmm0 242 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 244 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1
|
/external/boringssl/src/crypto/bn/asm/ |
x86-mont.pl | 135 &pmuludq($mul1,$mul0); # ap[0]*bp[0] 140 &pmuludq($mul1,$_n0q); # *=n0 142 &pmuludq($car1,$mul1); # "t[0]"*np[0]*n0 153 &pmuludq($acc0,$mul0); # ap[j]*bp[0] 154 &pmuludq($acc1,$mul1); # np[j]*m1 171 &pmuludq($acc0,$mul0); # ap[num-1]*bp[0] 172 &pmuludq($acc1,$mul1); # np[num-1]*m1 196 &pmuludq($mul1,$mul0); # ap[0]*bp[i] 203 &pmuludq($mul1,$_n0q); # *=n0 205 &pmuludq($car1,$mul1) [all...] |
bn-586.pl | 50 &pmuludq("mm2","mm0"); # mm2 = w*a[0] 52 &pmuludq("mm4","mm0"); # mm4 = w*a[1] 54 &pmuludq("mm6","mm0"); # mm6 = w*a[2] 56 &pmuludq("mm7","mm0"); # mm7 = w*a[3] 66 &pmuludq("mm2","mm0"); # mm2 = w*a[4] 69 &pmuludq("mm4","mm0"); # mm4 = w*a[5] 72 &pmuludq("mm6","mm0"); # mm6 = w*a[6] 77 &pmuludq("mm3","mm0"); # mm3 = w*a[7] 115 &pmuludq("mm2","mm0"); # a[i] *= w 233 &pmuludq("mm2","mm0"); # a[i] *= [all...] |
/toolchain/binutils/binutils-2.25/gas/testsuite/gas/i386/ilp32/ |
x86-64-simd-intel.d | 124 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq mm0,mm1 125 [ ]*[a-f0-9]+: 0f f4 00 pmuludq mm0,QWORD PTR \[rax\] 126 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq xmm0,xmm1 127 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq xmm0,XMMWORD PTR \[rax\] 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq mm1,QWORD PTR \[rax\] 244 [ ]*[a-f0-9]+: 0f f4 08 pmuludq mm1,QWORD PTR \[rax\] 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq xmm1,XMMWORD PTR \[rax\] 246 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq xmm1,XMMWORD PTR \[rax\]
|
x86-64-simd-suffix.d | 124 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq %mm1,%mm0 125 [ ]*[a-f0-9]+: 0f f4 00 pmuludq \(%rax\),%mm0 126 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq %xmm1,%xmm0 127 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq \(%rax\),%xmm0 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 244 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1 246 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1
|
x86-64-simd.d | 124 [ ]*[a-f0-9]+: 0f f4 c1 pmuludq %mm1,%mm0 125 [ ]*[a-f0-9]+: 0f f4 00 pmuludq \(%rax\),%mm0 126 [ ]*[a-f0-9]+: 66 0f f4 c1 pmuludq %xmm1,%xmm0 127 [ ]*[a-f0-9]+: 66 0f f4 00 pmuludq \(%rax\),%xmm0 243 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 244 [ ]*[a-f0-9]+: 0f f4 08 pmuludq \(%rax\),%mm1 245 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1 246 [ ]*[a-f0-9]+: 66 0f f4 08 pmuludq \(%rax\),%xmm1
|
/external/llvm/test/Analysis/CostModel/X86/ |
testshiftshl.ll | 22 ; SSE2-CODEGEN: pmuludq 82 ; SSE2-CODEGEN: pmuludq 94 ; SSE2-CODEGEN: pmuludq 106 ; SSE2-CODEGEN: pmuludq 118 ; SSE2-CODEGEN: pmuludq 202 ; SSE2-CODEGEN: pmuludq
|
/external/libvpx/libvpx/vp8/common/x86/ |
mfqe_sse2.asm | 238 pmuludq xmm0, xmm0
|
/external/libvpx/libvpx/vp9/common/x86/ |
vp9_mfqe_sse2.asm | 239 pmuludq xmm0, xmm0
|