Implementarea unui algoritm in OpenCL si analiza performantei (rapiditate, scalabilitate, etc... )
Am ales sa implementez "aflarea celui de-al K-lea element dintr-un vector" - variantele banala, recursiva & paralela .
Banala -- sortarea vectorului si afisarea celui de-al K-lea element
Recursiva -- aflarea elementului, fara a sorta vectorul
Paralela -- se bazeaza pe varianta recursiva, cu paralelizarea unuia dintre pasi
Observatii:
- varianta banala tinde sa mearga mai bine decat cea recursiva pentru valori mari ale lui n (overhead la crearea stivelor pt varianta recursiva)
- aparent, varianta paralela merge de... numai paralela nu este . Se pare ca overhead-ul de creare a contextelor este imens... [in curand] optimizari.
- varianta banala tinde sa mearga mai bine decat cea recursiva pentru valori mari ale lui n (overhead la crearea stivelor pt varianta recursiva)
- aparent, varianta paralela merge de... numai paralela nu este . Se pare ca overhead-ul de creare a contextelor este imens... [in curand] optimizari.
Niciun comentariu:
Trimiteți un comentariu