Otimização de Desempenho
Principal técnica:
- Sobrepor computação e comunicação
(Fazer com que Tcomput absorva parte de Toverhead)
Idéia:
- Utilizar, para comunicação, primitivas sem bloqueio
- Antecipar, ao máximo possível, as trocas de dados necessárias
- Esquema similar ao prefetch em memórias cache
Restrição:
- Nem sempre é possível aplicar na prática