24 iunie 2011

Days 5+

Implementarea unui algoritm in OpenCL si analiza performantei (rapiditate, scalabilitate, etc... )
Am ales sa implementez "aflarea celui de-al K-lea element dintr-un vector" - variantele banala, recursiva & paralela .

Banala -- sortarea vectorului si afisarea celui de-al K-lea element
Recursiva -- aflarea elementului, fara a sorta vectorul
Paralela -- se bazeaza pe varianta recursiva, cu paralelizarea unuia dintre pasi

Observatii:
- varianta banala tinde sa mearga mai bine decat cea recursiva pentru valori mari ale lui n (overhead la crearea stivelor pt varianta recursiva)
- aparent, varianta paralela merge de... numai paralela nu este . Se pare ca overhead-ul de creare a contextelor este imens... [in curand] optimizari.

Niciun comentariu: