**1. Vizsgálja meg, hogy mi történik barrier hívások használata nélkül. Helyes-e az eredmény?**
**1. Vizsgálja meg, hogy mi történik barrier hívások használata nélkül. Helyes-e az eredmény?**
Barrier hívások nélkül a kernel helytelen eredményt ad.
Barrier hívások nélkül a kernel helytelen eredményt ad.
**2. Hasonlítsa össze teljesítmény szempontjából a globális és a lokális memóriában végzett
**2. Hasonlítsa össze teljesítmény szempontjából a globális és a lokális memóriában végzett
hisztogram számtást!**
hisztogram számtást!**
Az összehasonlításhoz egységesen 4096 elemű, de változó értékkészletű vektorok hisztogramját számítottam ki. Az alábbi táblázatban az oszlopok az értékkészlet nagyságát jelölik, a sorok a globális, illetve a lokáis kerneleket, a cellák pedig az egyes futási időket egy adott típusó kernelhez egy értékkészleten.
Az összehasonlításhoz egységesen 4096 elemű, de változó értékkészletű vektorok hisztogramját számítottam ki. Az alábbi táblázatban az oszlopok az értékkészlet nagyságát jelölik, a sorok a globális, illetve a lokáis kerneleket, a cellák pedig az egyes futási időket egy adott típusó kernelhez egy értékkészleten.
| / | 2 | 128 | **200** | **250** |
| **/** | **2** | **128** | **200** | **250** |
| --- | --- | --- | --- | --- |
| --- | --- | --- | --- | --- |
| **local** | 0.006592 ms | 0.004064 ms | 0.004512 ms | 0.004448 ms |
| **local** | 0.006592 ms | 0.004064 ms | 0.004512 ms | 0.004448 ms |
| **global** | 0.00784 ms | 0.0064 ms | 0.0064 ms | 0.005952 ms |
| **global** | 0.00784 ms | 0.0064 ms | 0.0064 ms | 0.005952 ms |
A futási időkből látszik, hogy a lokális memóriát használó kernel minden értékkészletre gyorsabb, viszont a lokális és globális kernelek is gyorsabban futnak, ha ez az értékkészlet nagyobb.