1. 測試環境:
  2. 實驗設備包含十二部HP 715/33工作站,一部Sun Sparc2,一部Sun

    Sparc 20 每種工作站的計算能力的實驗結果為:Sun Sparc 20

    HP的最大以及最小執行時間十分相近 , Sun Sparc 10的最大和

    最小的執行時間約為Sun Sparc 2的一半,平均值亦然。

    網路環境由Eithernet連接,順序為Hp1Hp12,Sparc 2,Sparc20

    平行計算平台為PVM(Parallel Virtual Machine)

     

  3. 矩陣相乘平行化的作法以及結果分析:

 

測試的矩陣大小有兩個Data Set分別為1000 x 10002000 x 2000

,並將N x N的矩陣分為N/P x N/P大小的submatrices(P:processor

個數),分別傳送給Slaves做運算,之後再將運算結果送回給Master

實驗結果如下圖所示,下圖的分析方式是由speedup以及工作站的個

數作為分析依據。

並由下圖我們得到下列結論:

  1. 分配給Slave較大Size的矩陣有較好的speedup,因為可以減少
  2. Communication Overhead

  3. 由下圖可發現在P2,4,8的地方有較明顯的增益,這是因為

Data Distribution使用了split-and-merge的方式使得這些情

況下並沒有閒置的機器。