Pentium 3: Tualatin vs. Coppermine - тесты скорости



Posted by Анатолий Анимица (80.243.1.51) on December 06, 2001 at 14:46:16:

Выполняю давно обещанное представление тестов скорости нового процессора от Intel - Pentium 3 1113 EB Tualatin (1113 MHz кэш 2 уровня 512 кб, шина 133 MHZ (коэффициент умножения 8.5) на известной задаче измерения скорости старта сервера "Финансов без проблем" над некоторой эталонной базой http://hdru.com/wwwboard/messages/3718.htm .

В тот раз мы сравнивали две (в основном) железки - Pentium 4 1500 MHz и Pentium 3 850 MHz (это известная машина - которая у меня дома стоит) и два компилятора - Watcom C++ и Intel C++ V.5.01.
Коротко напомню основные результаты на "эталонной" базе, построенной приложением 2001R. Только по Intel компилятору, так как в нынешнем тесте watcom не испытывался.


Процессор/компилятор База R База Z
p3850 /Intel 2134 оп/с 1997 оп/с
p41500 /Intel 1789 оп/с 2145 оп/с

т.е сравнимые результаты (да и цена у них сегодня почти одинаковая - память только стоит по-разному.

Кстати, похоже, провал Pentium 4 на базе R объясняется недостатком объема памяти - всего два RDRAM по 128 Мб, а уменьшить базу тогда не догадались, вот она и сваливалась в свопинг. Есть повод перемерить.


Что сейчас: машина P3 1113 Mhz примерно такой же конфигурации, что и P3 850 (тот же коэффициент умножения 8.5, та же память Micron 2*256 Mb SDRAM PC133 Mhz, даже диски похожие), поэтому я не приведу полный профиль измерения на P3 850. Дам только общую цифру скорости старта - 2100 оп/с. А Tualatin показал вот что:


Финансы без пpоблем:Пpофилеp сообщает:


Расходы вpемени на пеpесчет состояния Сеpвеpа:

всего,мс %
-------------------------------------------------
Чтение файлов опеpаций (*.f3p): 350 1.4
Анализ фpаз опеpаций: 700 2.7
Выполнение пpоводок: 1810 7.1 ##
Выполнение файлов-коэффициентов: 19239 75.5 ######################
Вычисление выpажений в деpеве: 71 0.3
Дескpиптоpы пеpвичных документов: 146 0.6
Создание пеpвичных документов: 0 0.0
Инициализация внутpенних таблиц: 3031 11.9 ###
Индикация на мнемосхеме: 120 0.5
-------------------------------------------------
Итого: 25467 100.0

За эти 25467 мс было пеpесчитано 73210 опеpаций.
Сpедняя скоpость пеpесчета состояния Сеpвеpа: 2875 оп/с.

Расходы вpемени на выполнение файлов-коэффициентов:
-------------------------------------------------
Файл всего,мс pазы мс/pаз абс% отн%
-------------------------------------------------
fctmcotg 7530 14772 0.5 29.6 39.1 ###########
fctvp 2248 6757 0.3 8.8 11.7 ###
fczpsm2 2101 8092 0.3 8.2 10.9 ###
fctvrp 1297 8790 0.1 5.1 6.7 ##
fctmcpr 1270 3689 0.3 5.0 6.6 #
fcznpvn 753 11 68.5 3.0 3.9 #
fcfrp 689 5629 0.1 2.7 3.6 #
fcfrr 670 4437 0.2 2.6 3.5 #
fcra 504 2249 0.2 2.0 2.6
fcent1-3 309 1966 0.2 1.2 1.6
fcfrr70 265 1213 0.2 1.0 1.4
fcraot 192 1062 0.2 0.8 1.0
fcraz 130 669 0.2 0.5 0.7
fcvrrc 121 838 0.1 0.5 0.6
fcvrr 121 130 0.9 0.5 0.6
fcaosiz 114 11 10.4 0.4 0.6
fczvgp1 110 1328 0.1 0.4 0.6
fczin 89 1620 0.1 0.3 0.5
fcvent12 80 148 0.5 0.3 0.4
fcuos 67 192 0.3 0.3 0.3
fcvvsr 65 82 0.8 0.3 0.3
fcvconp 65 249 0.3 0.3 0.3
fcrpzma 52 11 4.7 0.2 0.3
fcvvrc 50 29 1.7 0.2 0.3
fcvrsp 45 1174 0.0 0.2 0.2
fctmcofm 25 568 0.0 0.1 0.1
fcvsp 20 45 0.4 0.1 0.1
fcrva 20 15 1.3 0.1 0.1
fcrprso 15 4 3.8 0.1 0.1
fcvrsr 11 450 0.0 0.0 0.1
fcrucr 10 326 0.0 0.0 0.1
fczn1d1 10 1620 0.0 0.0 0.1
fczurl 10 122 0.1 0.0 0.1
fcusvvsn 10 31 0.3 0.0 0.1
fczras 10 669 0.0 0.0 0.1
fctmcoos 10 848 0.0 0.0 0.1
fczstbn4 10 189 0.1 0.0 0.1
fcrbpss 9 8 ~ ~ ~
fcvr3l 5 9 ~ ~ ~
fcfvraot 5 34 ~ ~ ~
fctmcvo 5 8 ~ ~ ~
fcaospr 5 223 ~ ~ ~
fczuova 5 110 ~ ~ ~
fcrbp 5 13 ~ ~ ~
fcusvsn 5 369 ~ ~ ~
fcztrstv 5 111 ~ ~ ~
fczstbn1 5 900 ~ ~ ~
fctmcofj 5 235 ~ ~ ~
fctmcofk 5 62 ~ ~ ~
fczstbn3 5 810 ~ ~ ~
fctmcozb 5 190 ~ ~ ~
fcaosu 4 102 ~ ~ ~
-------------------------------------------------


Расходы вpемени на выполнение команд в файлах-коэффициентах:
----------------------------------------------------
Команда всего,мс pазы мкс/pаз абс% отн%
----------------------------------------------------
folio-177 8226 85290 96.4 32.3 42.8 ############
fact 2626 62112 42.3 10.3 13.6 ####
news 1371 12737 107.6 5.4 7.1 ##
search 815 58399 14.0 3.2 4.2 #
[SN] 734 155965 4.7 2.9 3.8 #
[GET] 580 467348 1.2 2.3 3.0
rewind range 548 19916 27.5 2.2 2.8
push var 540 5252189 0.1 2.1 2.8
+ 356 1517022 0.2 1.4 1.9
*a 313 545665 0.6 1.2 1.6
set var 286 2217318 0.1 1.1 1.5
[STRIP] 225 887852 0.3 0.9 1.2
[SET] 198 170416 1.2 0.8 1.0
.=0, goto 195 1548747 0.1 0.8 1.0
[PS] 195 439724 0.4 0.8 1.0
[CP] 191 416263 0.5 0.7 1.0
push string 181 1873275 0.1 0.7 0.9
nerase 171 12100 14.1 0.7 0.9
push double 140 2989137 0.0 0.5 0.7
= 98 518589 0.2 0.4 0.5
a=r 96 928935 0.1 0.4 0.5
a==L 95 477160 0.2 0.4 0.5
[PLUS] 91 43092 2.1 0.4 0.5
[INTSN] 85 53208 1.6 0.3 0.4
[STAMP] 85 67205 1.3 0.3 0.4
[VL] 59 130705 0.5 0.2 0.3
a+L 49 150866 0.3 0.2 0.3
[CO] 49 67921 0.7 0.2 0.3
a=b 45 229761 0.2 0.2 0.2
nop 40 617674 0.1 0.2 0.2
[INTERNAL] 40 680901 0.1 0.2 0.2
[PA] 39 100028 0.4 0.2 0.2
a=L 35 174781 0.2 0.1 0.2
| 29 304028 0.1 0.1 0.2
push var addr 25 395528 0.1 0.1 0.1
$$ 25 61775 0.4 0.1 0.1
- 20 342196 0.1 0.1 0.1
goto 20 159934 0.1 0.1 0.1
L+a 20 54154 0.4 0.1 0.1
[cp a,r1,r2] 20 182561 0.1 0.1 0.1
[N1] 20 73719 0.3 0.1 0.1
[SA] 20 23678 0.8 0.1 0.1
* 15 93892 0.2 0.1 0.1
push account 15 376830 0.0 0.1 0.1
a==r 15 57357 0.3 0.1 0.1
[SUCCESS] 15 79527 0.2 0.1 0.1
& 10 42079 0.2 0.0 0.1
/ 10 113662 0.1 0.0 0.1
in 10 66531 0.2 0.0 0.1
~ 10 72014 0.1 0.0 0.1
a>r 10 57350 0.2 0.0 0.1
[N2] 10 1306 7.7 0.0 0.1
[TYPE] 10 256433 0.0 0.0 0.1
loop 5 13399 ~ ~ ~
< 5 34536 ~ ~ ~
> 5 54425 ~ ~ ~
pop stack 5 184577 ~ ~ ~
acents on 5 34208 ~ ~ ~
[EA] 5 10182 ~ ~ ~
[AP] 5 1980 ~ ~ ~
[AS] 5 17722 ~ ~ ~
[EX] 5 88735 ~ ~ ~
unar minus ~ 180027 ~ ~ ~
call ~ 1885 ~ ~ ~
return ~ 1885 ~ ~ ~
stop ~ 30501 ~ ~ ~
a=a+r ~ 4 ~ ~ ~
#a ~ 32659 ~ ~ ~
@a ~ 130 ~ ~ ~
ex prec. ~ 88735 ~ ~ ~
comma off ~ 34208 ~ ~ ~
[EK] ~ 11 ~ ~ ~
[BA] ~ 1022 ~ ~ ~
[MP] ~ 7920 ~ ~ ~
[CE] ~ 114 ~ ~ ~
[RO] ~ 5201 ~ ~ ~
[TR] ~ 57 ~ ~ ~
[DA] ~ 1169 ~ ~ ~
[FOUND] ~ 1980 ~ ~ ~
[LENGTH] ~ 45553 ~ ~ ~
[GED] ~ 45 ~ ~ ~
-----------------------------------------------------

Я специально привел полный профиль, чтобы заодно можно было увидеть распределение времени старта между компонентами приложения. Там видно: fctmcotg - это отгрузки товара и другие складские операции, fctmcpr - приходы товара от контрагентов и так далее. Смотрите 2001R.

Потрясающий вывод - кэш 512 кб против кэш 256 кб позволил добиться точно 33% прироста скорости сервера при увеличении частоты шины на 33%. Я такого не видел еще никогда: 2875/2100= 1.39, а 1113/850=1.33, что практически одно и то же.

На этом тестирование не закончено. Машину собирали впопыхах - я нагрянул в уже известный вам Медиатех в Зеленограде без подготовки, поэтому память DDR SDRAM PC2100 (266 266MHz) не успели завезти, пришлось на обычной (дожили - полгигабайта памяти на частоте 133000 кГц уже обычны), так что тестирование будет продолжено. ASAP, как научил меня говорить один мой друг - as soon as possible.

Спасибо за внимание. Ваш ААА

PS. Я тут с AMD связывался (давно не брал я в руки шашек), так обещали помочь в измерениях и предоставить их новые Атлоны и Дуроны. Померяем.




Пpишедшие ответы: