Lines Matching full:tmp1
10 %tmp1 = load <8 x i8>, <8 x i8>* %B
12 %tmp3 = insertelement <8 x i8> %tmp1, i8 %tmp2, i32 3
20 %tmp1 = load <4 x i16>, <4 x i16>* %B
22 %tmp3 = insertelement <4 x i16> %tmp1, i16 %tmp2, i32 2
30 %tmp1 = load <2 x i32>, <2 x i32>* %B
32 %tmp3 = insertelement <2 x i32> %tmp1, i32 %tmp2, i32 1
40 %tmp1 = load <2 x i32>, <2 x i32>* %B
42 %tmp3 = insertelement <2 x i32> %tmp1, i32 %tmp2, i32 1
49 %tmp1 = load <2 x float>, <2 x float>* %B
51 %tmp3 = insertelement <2 x float> %tmp1, float %tmp2, i32 1
58 %tmp1 = load <16 x i8>, <16 x i8>* %B
60 %tmp3 = insertelement <16 x i8> %tmp1, i8 %tmp2, i32 9
67 %tmp1 = load <8 x i16>, <8 x i16>* %B
69 %tmp3 = insertelement <8 x i16> %tmp1, i16 %tmp2, i32 5
76 %tmp1 = load <4 x i32>, <4 x i32>* %B
78 %tmp3 = insertelement <4 x i32> %tmp1, i32 %tmp2, i32 3
85 %tmp1 = load <4 x float>, <4 x float>* %B
87 %tmp3 = insertelement <4 x float> %tmp1, float %tmp2, i32 0
104 %tmp1 = load <8 x i8>, <8 x i8>* %B
105 %tmp2 = call %struct.__neon_int8x8x2_t @llvm.arm.neon.vld2lane.v8i8.p0i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 4)
117 %tmp1 = load <4 x i16>, <4 x i16>* %B
118 %tmp2 = call %struct.__neon_int16x4x2_t @llvm.arm.neon.vld2lane.v4i16.p0i8(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 8)
129 %tmp1 = load <2 x i32>, <2 x i32>* %B
130 %tmp2 = call %struct.__neon_int32x2x2_t @llvm.arm.neon.vld2lane.v2i32.p0i8(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 1)
143 %tmp1 = load <2 x i32>, <2 x i32>* %B
144 %tmp2 = call %struct.__neon_int32x2x2_t @llvm.arm.neon.vld2lane.v2i32.p0i8(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 1)
157 %tmp1 = load <2 x float>, <2 x float>* %B
158 %tmp2 = call %struct.__neon_float32x2x2_t @llvm.arm.neon.vld2lane.v2f32.p0i8(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
170 %tmp1 = load <8 x i16>, <8 x i16>* %B
171 %tmp2 = call %struct.__neon_int16x8x2_t @llvm.arm.neon.vld2lane.v8i16.p0i8(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 5, i32 1)
183 %tmp1 = load <4 x i32>, <4 x i32>* %B
184 %tmp2 = call %struct.__neon_int32x4x2_t @llvm.arm.neon.vld2lane.v4i32.p0i8(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 2, i32 16)
195 %tmp1 = load <4 x float>, <4 x float>* %B
196 %tmp2 = call %struct.__neon_float32x4x2_t @llvm.arm.neon.vld2lane.v4f32.p0i8(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)
224 %tmp1 = load <8 x i8>, <8 x i8>* %B
225 %tmp2 = call %struct.__neon_int8x8x3_t @llvm.arm.neon.vld3lane.v8i8.p0i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 1)
239 %tmp1 = load <4 x i16>, <4 x i16>* %B
240 %tmp2 = call %struct.__neon_int16x4x3_t @llvm.arm.neon.vld3lane.v4i16.p0i8(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 8)
253 %tmp1 = load <2 x i32>, <2 x i32>* %B
254 %tmp2 = call %struct.__neon_int32x2x3_t @llvm.arm.neon.vld3lane.v2i32.p0i8(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 1)
267 %tmp1 = load <2 x float>, <2 x float>* %B
268 %tmp2 = call %struct.__neon_float32x2x3_t @llvm.arm.neon.vld3lane.v2f32.p0i8(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
282 %tmp1 = load <8 x i16>, <8 x i16>* %B
283 %tmp2 = call %struct.__neon_int16x8x3_t @llvm.arm.neon.vld3lane.v8i16.p0i8(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 1, i32 8)
298 %tmp1 = load <8 x i16>, <8 x i16>* %B
299 %tmp2 = call %struct.__neon_int16x8x3_t @llvm.arm.neon.vld3lane.v8i16.p0i8(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 1, i32 8)
314 %tmp1 = load <4 x i32>, <4 x i32>* %B
315 %tmp2 = call %struct.__neon_int32x4x3_t @llvm.arm.neon.vld3lane.v4i32.p0i8(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 3, i32 1)
328 %tmp1 = load <4 x float>, <4 x float>* %B
329 %tmp2 = call %struct.__neon_float32x4x3_t @llvm.arm.neon.vld3lane.v4f32.p0i8(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)
360 %tmp1 = load <8 x i8>, <8 x i8>* %B
361 %tmp2 = call %struct.__neon_int8x8x4_t @llvm.arm.neon.vld4lane.v8i8.p0i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 8)
377 %tmp1 = load <8 x i8>, <8 x i8>* %B
378 %tmp2 = call %struct.__neon_int8x8x4_t @llvm.arm.neon.vld4lane.v8i8.p0i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 8)
397 %tmp1 = load <4 x i16>, <4 x i16>* %B
398 %tmp2 = call %struct.__neon_int16x4x4_t @llvm.arm.neon.vld4lane.v4i16.p0i8(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 4)
415 %tmp1 = load <2 x i32>, <2 x i32>* %B
416 %tmp2 = call %struct.__neon_int32x2x4_t @llvm.arm.neon.vld4lane.v2i32.p0i8(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 8)
431 %tmp1 = load <2 x float>, <2 x float>* %B
432 %tmp2 = call %struct.__neon_float32x2x4_t @llvm.arm.neon.vld4lane.v2f32.p0i8(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
448 %tmp1 = load <8 x i16>, <8 x i16>* %B
449 %tmp2 = call %struct.__neon_int16x8x4_t @llvm.arm.neon.vld4lane.v8i16.p0i8(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 1, i32 16)
465 %tmp1 = load <4 x i32>, <4 x i32>* %B
466 %tmp2 = call %struct.__neon_int32x4x4_t @llvm.arm.neon.vld4lane.v4i32.p0i8(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 2, i32 1)
481 %tmp1 = load <4 x float>, <4 x float>* %B
482 %tmp2 = call %struct.__neon_float32x4x4_t @llvm.arm.neon.vld4lane.v4f32.p0i8(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)