SVP64 REMAP Worked Example: Matrix Multiply

Fri Nov 10 07:46:45 2023 · any

    mat_X * mat_Y = mat_Z

    X_axb * Y_bxc = Z_axc

    X =| 1 2 3 |  Y =  |  6  7 |  Z = |  52  58 |
       | 3 4 5 |       |  8  9 |      | 100 112 |
                       | 10 11 |

for i in range(0, mat_X_num_rows):
    for k in range(0, mat_Y_num_cols):
        for j in range(0, mat_X_num_cols): # or mat_Y_num_rows
            mat_Z[i][k] += mat_X[i][j] * mat_Y[j][k]

    | 1 2 3 |   |  6  7 | = | (1*6 + 2*8 + 3*10) (1*7 + 2*9 3*11) |
    | 3 4 5 | * |  8  9 |   | (3*6 + 4*8 + 5*10) (3*7 + 4*9 5*11) |
                | 10 11 |

    | 1 2 3 |   |  6  7 | = | ( 6 + 16 + 30) ( 7 + 18 + 33) |
    | 3 4 5 | * |  8  9 |   | (18 + 32 + 50) (21 + 36 + 55) |
                | 10 11 |

    | 1 2 3 |   |  6  7 | = |  52  58 |
    | 3 4 5 | * |  8  9 |   | 100 112 |
                | 10 11 |

    Index | 0 1 2 3 4 5 |
    Mat X | 1 2 3 3 4 5 |

    Index | 0  1  2  3  4  5 |
    Mat Y | 6  7  8  9 10 11 |

    Index |   0   1   2   3 |
    Mat Z |  52  58 100 112 |

    | Mat X | Mat Y | Mat Z |
    |   0   |   0   |   0   |
    |   1   |   2   |   0   |
    |   2   |   4   |   0   |
    |   0   |   1   |   1   |
    |   1   |   3   |   1   |
    |   2   |   5   |   1   |
    |   3   |   0   |   2   |
    |   4   |   2   |   2   |
    |   5   |   4   |   2   |
    |   3   |   1   |   3   |
    |   4   |   3   |   3   |
    |   5   |   5   |   3   |

for i in range(mat_X_num_rows):
    for j in range(0, mat_X_num_cols): # or mat_Y_num_rows
        for k in range(0, mat_Y_num_cols):
            mat_Z[i][k] += mat_X[i][j] * mat_Y[j][k]

    | Mat X | Mat Y | Mat Z |
    |   0   |   0   |   0   |
    |   0   |   1   |   1   |
    |   3   |   0   |   2   |
    |   3   |   1   |   3   |
    |   1   |   2   |   0   |
    |   1   |   3   |   1   |
    |   4   |   2   |   2   |
    |   4   |   3   |   3   |
    |   2   |   4   |   0   |
    |   2   |   5   |   1   |
    |   5   |   4   |   2   |
    |   5   |   5   |   3   |

    |   Outer Product       |   Inner Product       |
    | Mat X | Mat Y | Mat Z | Mat X | Mat Y | Mat Z |
    |   0   |   0   |   0   |   0   |   0   |   0   |
    |   1   |   2   |   0   |   0   |   1   |   1   |
    |   2   |   4   |   0   |   3   |   0   |   2   |
    |   0   |   1   |   1   |   3   |   1   |   3   |
    |   1   |   3   |   1   |   1   |   2   |   0   |
    |   2   |   5   |   1   |   1   |   3   |   1   |
    |   3   |   0   |   2   |   4   |   2   |   2   |
    |   4   |   2   |   2   |   4   |   3   |   3   |
    |   5   |   4   |   2   |   2   |   4   |   0   |
    |   3   |   1   |   3   |   2   |   5   |   1   |
    |   4   |   3   |   3   |   5   |   4   |   2   |
    |   5   |   5   |   3   |   5   |   5   |   3   |

    svshape 2, 2, 3, 0, 0
    svremap 15, 1, 2, 3, 0, 0, 0
    sv.maddld *0, *16, *32, *0

                             Row/Column Indices
    Flattened Indices      | Mat X | Mat Y | Mat Z |
| Mat X | Mat Y | Mat Z |  | r   c | r   c | r   c |
|   0   |   0   |   0   |  | 0   0 | 0   0 | 0   0 |
|   0   |   1   |   1   |  | 0   0 | 0   1 | 0   1 |
|   3   |   0   |   2   |  | 1   0 | 0   0 | 1   0 |
|   3   |   1   |   3   |  | 1   0 | 0   1 | 1   1 |
|   1   |   2   |   0   |  | 0   1 | 1   0 | 0   0 |
|   1   |   3   |   1   |  | 0   1 | 1   1 | 0   1 |
|   4   |   2   |   2   |  | 1   1 | 1   0 | 1   0 |
|   4   |   3   |   3   |  | 1   1 | 1   1 | 1   1 |
|   2   |   4   |   0   |  | 0   2 | 2   0 | 0   0 |
|   2   |   5   |   1   |  | 0   2 | 2   1 | 0   1 |
|   5   |   4   |   2   |  | 1   2 | 2   0 | 1   0 |
|   5   |   5   |   3   |  | 1   2 | 2   1 | 1   1 |

    svshape 2, 2, 3, 0, 0

    SVxd |         mat_Y_num_cols
    SVyd |         mat_X_num_rows
    SVzd | both mat_X_num_cols AND mat_Y_num_rows

svremap 15, 1, 2, 3, 0, 0, 0

sv.maddld *0, *16, *32, *0

    $: cd /PATH/TO/src/openpower-isa/src/openpower/decoder/isa/
    $: python3 test_caller_svp64_matrix.py >& /tmp/f

                  | (x ==   | (y ==   | (z ==
index | x | y | z |  x_end) |  y_end) |  z_end)
   0  | 0 | 0 | 0 |    F    |    F    |   F
   1  | 1 | 0 | 0 |    T    |    F    |   F
   2  | 0 | 1 | 0 |    F    |    T    |   F
   3  | 1 | 1 | 0 |    T    |    T    |   F
   4  | 0 | 0 | 1 |    F    |    F    |   F
   5  | 1 | 0 | 1 |    T    |    F    |   F
   6  | 0 | 1 | 1 |    F    |    T    |   F
   7  | 1 | 1 | 1 |    T    |    T    |   F
   8  | 0 | 0 | 2 |    F    |    F    |   T
   9  | 1 | 0 | 2 |    T    |    F    |   T
  10  | 0 | 1 | 2 |    F    |    T    |   T
  11  | 1 | 1 | 2 |    T    |    T    |   T

SVP64 REMAP Worked Example: Matrix Multiply

Worked example - manual (conventional method)

Inner Product

SVP64 instructions implementing matrix multiply

svshape

SVSHAPE Remapping SPRs

Limitations of Matrix REMAP

SVREMAP

maddld - Multiply-Add Low Doubleword VA-form

Appendix

Running the simulator test case

Remapyield showing how the matrix indices are generated