Browse Source

Doc - Histogram/local2

master
Daniel Gyulai 3 years ago
parent
commit
c6f99522f8
  1. 10
      Primitives/primitives.md

10
Primitives/primitives.md

@ -69,16 +69,18 @@ IF LID < histogramSize DO:
histogram[LID] = lhistogram[LID]
```
**1. Vizsgálja meg, hogy mi történik barrier hívások használata nélkül. Helyes-e az eredmény?**
**1. Vizsgálja meg, hogy mi történik barrier hívások használata nélkül. Helyes-e az eredmény?**
Barrier hívások nélkül a kernel helytelen eredményt ad.
Barrier hívások nélkül a kernel helytelen eredményt ad.
**2. Hasonlítsa össze teljesítmény szempontjából a globális és a lokális memóriában végzett
hisztogram számtást!**
Az összehasonlításhoz egységesen 4096 elemű, de változó értékkészletű vektorok hisztogramját számítottam ki. Az alábbi táblázatban az oszlopok az értékkészlet nagyságát jelölik, a sorok a globális, illetve a lokáis kerneleket, a cellák pedig az egyes futási időket egy adott típusó kernelhez egy értékkészleten.
| / | 2 | 128 | **200** | **250** |
| --- | --- | --- | --- | --- |
| **/** | **2** | **128** | **200** | **250** |
| --- | --- | --- | --- | --- |
| **local** | 0.006592 ms | 0.004064 ms | 0.004512 ms | 0.004448 ms |
| **global** | 0.00784 ms | 0.0064 ms | 0.0064 ms | 0.005952 ms |
A futási időkből látszik, hogy a lokális memóriát használó kernel minden értékkészletre gyorsabb, viszont a lokális és globális kernelek is gyorsabban futnak, ha ez az értékkészlet nagyobb.
Loading…
Cancel
Save