• Воо, вот это уже то что надо. Какие размерности матриц-то?
  • @mkaz 1024x1024 float, paste.org.ru вот сорец быстро накатал для ноута, можешь у себя помучать. На 1 Cell'е PS3 работает 0.65с
  • компилятор наверное как-то по-хитрому развернул циклы.
  • @viknet ну да, там у меня достаточно много циклов, которые всегда работают небольшое фиксированное число итераций, но ассемблерный листинг как-то лениво рыть :)
  • @glebus просто я не верю в 50-кратный выигрыш в производительности только из-за смены архитектуры)
  • @viknet там все регистры векторные и операции только с векторами тоже работают, ну и частота в 3 раза больше вроде как
  • @glebus т.е. фактически произведение матрицы раскладывается на произведение не чисел, а целых векторов?.. тогда верю) и чем больше матрица, тем больше выигрыш должен быть...
  • @viknet вектора по 128 байт, т.е 4 float. что-то типо SSE, только получше :)
  • @glebus байта? получается, float — длинной в 32 байта?..
  • @viknet пардон, бита :)