Vetorização x Paralelização (cont.)
1a Opção: Vetorizar loop i e paralelizar loop j
- Vetorização vai acessar arrays por colunas (stride=1)
- Devido à dependência, paralelização exige sincronização entre processadores
2a Opção: Paralelizar loop i e vetorizar loop j
- Vetorização vai acessar arrays por linhas (strideɭ)
- Como não há dependência carregada pelo loop i, não é necessário haver sincronização entre processadores
Saldo final vai depender dos custos de acesso à
memória e de sincronização entre processadores