Home | History | Annotate | Download | only in NVPTX
      1 ; RUN: llc < %s -march=nvptx -mcpu=sm_20 | FileCheck %s
      2 ; RUN: llc < %s -march=nvptx64 -mcpu=sm_20 | FileCheck %s
      3 
      4 ;; These tests should run for all targets
      5 
      6 ;;===-- Basic instruction selection tests ---------------------------------===;;
      7 
      8 
      9 ;;; i64
     10 
     11 define i64 @add_i64(i64 %a, i64 %b) {
     12 ; CHECK: add.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     13 ; CHECK: ret
     14   %ret = add i64 %a, %b
     15   ret i64 %ret
     16 }
     17 
     18 define i64 @sub_i64(i64 %a, i64 %b) {
     19 ; CHECK: sub.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     20 ; CHECK: ret
     21   %ret = sub i64 %a, %b
     22   ret i64 %ret
     23 }
     24 
     25 define i64 @mul_i64(i64 %a, i64 %b) {
     26 ; CHECK: mul.lo.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     27 ; CHECK: ret
     28   %ret = mul i64 %a, %b
     29   ret i64 %ret
     30 }
     31 
     32 define i64 @umul_lohi_i64(i64 %a) {
     33 ; CHECK-LABEL: umul_lohi_i64(
     34 entry:
     35   %0 = zext i64 %a to i128
     36   %1 = mul i128 %0, 288
     37 ; CHECK: mul.lo.{{u|s}}64
     38 ; CHECK: mul.hi.{{u|s}}64
     39   %2 = lshr i128 %1, 1
     40   %3 = trunc i128 %2 to i64
     41   ret i64 %3
     42 }
     43 
     44 define i64 @smul_lohi_i64(i64 %a) {
     45 ; CHECK-LABEL: smul_lohi_i64(
     46 entry:
     47   %0 = sext i64 %a to i128
     48   %1 = mul i128 %0, 288
     49 ; CHECK: mul.lo.{{u|s}}64
     50 ; CHECK: mul.hi.{{u|s}}64
     51   %2 = ashr i128 %1, 1
     52   %3 = trunc i128 %2 to i64
     53   ret i64 %3
     54 }
     55 
     56 define i64 @sdiv_i64(i64 %a, i64 %b) {
     57 ; CHECK: div.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     58 ; CHECK: ret
     59   %ret = sdiv i64 %a, %b
     60   ret i64 %ret
     61 }
     62 
     63 define i64 @udiv_i64(i64 %a, i64 %b) {
     64 ; CHECK: div.u64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     65 ; CHECK: ret
     66   %ret = udiv i64 %a, %b
     67   ret i64 %ret
     68 }
     69 
     70 define i64 @srem_i64(i64 %a, i64 %b) {
     71 ; CHECK: rem.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     72 ; CHECK: ret
     73   %ret = srem i64 %a, %b
     74   ret i64 %ret
     75 }
     76 
     77 define i64 @urem_i64(i64 %a, i64 %b) {
     78 ; CHECK: rem.u64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     79 ; CHECK: ret
     80   %ret = urem i64 %a, %b
     81   ret i64 %ret
     82 }
     83 
     84 define i64 @and_i64(i64 %a, i64 %b) {
     85 ; CHECK: and.b64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     86 ; CHECK: ret
     87   %ret = and i64 %a, %b
     88   ret i64 %ret
     89 }
     90 
     91 define i64 @or_i64(i64 %a, i64 %b) {
     92 ; CHECK: or.b64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
     93 ; CHECK: ret
     94   %ret = or i64 %a, %b
     95   ret i64 %ret
     96 }
     97 
     98 define i64 @xor_i64(i64 %a, i64 %b) {
     99 ; CHECK: xor.b64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %rd{{[0-9]+}}
    100 ; CHECK: ret
    101   %ret = xor i64 %a, %b
    102   ret i64 %ret
    103 }
    104 
    105 define i64 @shl_i64(i64 %a, i64 %b) {
    106 ; PTX requires 32-bit shift amount
    107 ; CHECK: shl.b64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %r{{[0-9]+}}
    108 ; CHECK: ret
    109   %ret = shl i64 %a, %b
    110   ret i64 %ret
    111 }
    112 
    113 define i64 @ashr_i64(i64 %a, i64 %b) {
    114 ; PTX requires 32-bit shift amount
    115 ; CHECK: shr.s64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %r{{[0-9]+}}
    116 ; CHECK: ret
    117   %ret = ashr i64 %a, %b
    118   ret i64 %ret
    119 }
    120 
    121 define i64 @lshr_i64(i64 %a, i64 %b) {
    122 ; PTX requires 32-bit shift amount
    123 ; CHECK: shr.u64 %rd{{[0-9]+}}, %rd{{[0-9]+}}, %r{{[0-9]+}}
    124 ; CHECK: ret
    125   %ret = lshr i64 %a, %b
    126   ret i64 %ret
    127 }
    128 
    129 
    130 ;;; i32
    131 
    132 define i32 @add_i32(i32 %a, i32 %b) {
    133 ; CHECK: add.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    134 ; CHECK: ret
    135   %ret = add i32 %a, %b
    136   ret i32 %ret
    137 }
    138 
    139 define i32 @sub_i32(i32 %a, i32 %b) {
    140 ; CHECK: sub.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    141 ; CHECK: ret
    142   %ret = sub i32 %a, %b
    143   ret i32 %ret
    144 }
    145 
    146 define i32 @mul_i32(i32 %a, i32 %b) {
    147 ; CHECK: mul.lo.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    148 ; CHECK: ret
    149   %ret = mul i32 %a, %b
    150   ret i32 %ret
    151 }
    152 
    153 define i32 @sdiv_i32(i32 %a, i32 %b) {
    154 ; CHECK: div.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    155 ; CHECK: ret
    156   %ret = sdiv i32 %a, %b
    157   ret i32 %ret
    158 }
    159 
    160 define i32 @udiv_i32(i32 %a, i32 %b) {
    161 ; CHECK: div.u32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    162 ; CHECK: ret
    163   %ret = udiv i32 %a, %b
    164   ret i32 %ret
    165 }
    166 
    167 define i32 @srem_i32(i32 %a, i32 %b) {
    168 ; CHECK: rem.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    169 ; CHECK: ret
    170   %ret = srem i32 %a, %b
    171   ret i32 %ret
    172 }
    173 
    174 define i32 @urem_i32(i32 %a, i32 %b) {
    175 ; CHECK: rem.u32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    176 ; CHECK: ret
    177   %ret = urem i32 %a, %b
    178   ret i32 %ret
    179 }
    180 
    181 define i32 @and_i32(i32 %a, i32 %b) {
    182 ; CHECK: and.b32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    183 ; CHECK: ret
    184   %ret = and i32 %a, %b
    185   ret i32 %ret
    186 }
    187 
    188 define i32 @or_i32(i32 %a, i32 %b) {
    189 ; CHECK: or.b32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    190 ; CHECK: ret
    191   %ret = or i32 %a, %b
    192   ret i32 %ret
    193 }
    194 
    195 define i32 @xor_i32(i32 %a, i32 %b) {
    196 ; CHECK: xor.b32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    197 ; CHECK: ret
    198   %ret = xor i32 %a, %b
    199   ret i32 %ret
    200 }
    201 
    202 define i32 @shl_i32(i32 %a, i32 %b) {
    203 ; CHECK: shl.b32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    204 ; CHECK: ret
    205   %ret = shl i32 %a, %b
    206   ret i32 %ret
    207 }
    208 
    209 define i32 @ashr_i32(i32 %a, i32 %b) {
    210 ; CHECK: shr.s32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    211 ; CHECK: ret
    212   %ret = ashr i32 %a, %b
    213   ret i32 %ret
    214 }
    215 
    216 define i32 @lshr_i32(i32 %a, i32 %b) {
    217 ; CHECK: shr.u32 %r{{[0-9]+}}, %r{{[0-9]+}}, %r{{[0-9]+}}
    218 ; CHECK: ret
    219   %ret = lshr i32 %a, %b
    220   ret i32 %ret
    221 }
    222 
    223 ;;; i16
    224 
    225 define i16 @add_i16(i16 %a, i16 %b) {
    226 ; CHECK: add.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    227 ; CHECK: ret
    228   %ret = add i16 %a, %b
    229   ret i16 %ret
    230 }
    231 
    232 define i16 @sub_i16(i16 %a, i16 %b) {
    233 ; CHECK: sub.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    234 ; CHECK: ret
    235   %ret = sub i16 %a, %b
    236   ret i16 %ret
    237 }
    238 
    239 define i16 @mul_i16(i16 %a, i16 %b) {
    240 ; CHECK: mul.lo.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    241 ; CHECK: ret
    242   %ret = mul i16 %a, %b
    243   ret i16 %ret
    244 }
    245 
    246 define i16 @sdiv_i16(i16 %a, i16 %b) {
    247 ; CHECK: div.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    248 ; CHECK: ret
    249   %ret = sdiv i16 %a, %b
    250   ret i16 %ret
    251 }
    252 
    253 define i16 @udiv_i16(i16 %a, i16 %b) {
    254 ; CHECK: div.u16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    255 ; CHECK: ret
    256   %ret = udiv i16 %a, %b
    257   ret i16 %ret
    258 }
    259 
    260 define i16 @srem_i16(i16 %a, i16 %b) {
    261 ; CHECK: rem.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    262 ; CHECK: ret
    263   %ret = srem i16 %a, %b
    264   ret i16 %ret
    265 }
    266 
    267 define i16 @urem_i16(i16 %a, i16 %b) {
    268 ; CHECK: rem.u16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    269 ; CHECK: ret
    270   %ret = urem i16 %a, %b
    271   ret i16 %ret
    272 }
    273 
    274 define i16 @and_i16(i16 %a, i16 %b) {
    275 ; CHECK: and.b16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    276 ; CHECK: ret
    277   %ret = and i16 %a, %b
    278   ret i16 %ret
    279 }
    280 
    281 define i16 @or_i16(i16 %a, i16 %b) {
    282 ; CHECK: or.b16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    283 ; CHECK: ret
    284   %ret = or i16 %a, %b
    285   ret i16 %ret
    286 }
    287 
    288 define i16 @xor_i16(i16 %a, i16 %b) {
    289 ; CHECK: xor.b16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %rs{{[0-9]+}}
    290 ; CHECK: ret
    291   %ret = xor i16 %a, %b
    292   ret i16 %ret
    293 }
    294 
    295 define i16 @shl_i16(i16 %a, i16 %b) {
    296 ; PTX requires 32-bit shift amount
    297 ; CHECK: shl.b16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %r{{[0-9]+}}
    298 ; CHECK: ret
    299   %ret = shl i16 %a, %b
    300   ret i16 %ret
    301 }
    302 
    303 define i16 @ashr_i16(i16 %a, i16 %b) {
    304 ; PTX requires 32-bit shift amount
    305 ; CHECK: shr.s16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %r{{[0-9]+}}
    306 ; CHECK: ret
    307   %ret = ashr i16 %a, %b
    308   ret i16 %ret
    309 }
    310 
    311 define i16 @lshr_i16(i16 %a, i16 %b) {
    312 ; PTX requires 32-bit shift amount
    313 ; CHECK: shr.u16 %rs{{[0-9]+}}, %rs{{[0-9]+}}, %r{{[0-9]+}}
    314 ; CHECK: ret
    315   %ret = lshr i16 %a, %b
    316   ret i16 %ret
    317 }
    318