Šachy a procesory
Chess and CPUs

08. 06. 2010


Velký test CPU/Big CPU test - BS2001 na TBirdech - P4 nebo TBird? - Ještě o růstu síly s MHz/Another ELO/MHz test - Burchamovy benchmarky /Burcham's benchmarks - Rychlé procesory 02/2002 - Intel vs AMD - Novinky CPU 08/2002 - Procesory 2003 - CPUs 2003/04 - Přehled procesorů pro stolní a mobilní počítače - Jak bude vypadat PC v roce 2004 - Centrino - Hyperthreading - Axon CPU test - 64 bit and reverse HT - Core2Duo - 64bit - 8 jader - Plies and ELO - Hash tables size and kN/s - Fritz benchmarks - Fritz benchmarks om Tom's hw - What runs under 64 bits - DeepHiarcs12 - Efektivita H12 - Efektivita 2 a 4 jader - FireMark


Velký test procesorů pro šachové účely - plaťte jen za MHz!
A big CPU test for chess - pay only for MHz!

Úvodem

Pan Liebert provedl velké srovnávací měření, jak se chovají moderní šachové programy na moderních procesorech.
Potvrdila se známá věc, že rychlost programu je podstatně (prakticky lineárně) závislá na taktování - to je číslo udávané v MHz. Naopak závislost na jednotlivých typech procesorů je minimální a při stejném taktování málokdy činí víc než 10 procent výkonu. Navíc se jednotlivé programy liší v tom, na kterém čipu běží rychleji.

Stručné představení testovaných procesorů

Intel

Klasický výrobce Intel dodává nyní standardní plný typ Pentium III s vysokým výkonem, ale značnou cenou.
Jako odlehčená alternativa je populární Celeron s malou keší, který však výkonem v obecných aplikacích značně zaostává.
V testu není zahrnuto pro šachy absolutně nevhodné Pentium II. Bylo cenově srovnatelné s Pentiem III a přitom vzhledem k pomalé keši na něm šachové programy běžely často pomaleji, než na Celeronu.
V testu také chybí Pentium 4 - příliš nový a drahý čip! Navíc se proslýchá, že půjde o slepou větev vývoje stejně jako svého času Pentium Pro.

AMD

Výrobce levných a výkonných napodobenin už od modelů 486.
V testu je pro zajímavost zařazena poslední verze odvozená z Pentia - K6/3.
V testu chybí modely K7, které jsou málo perspektivní a přitom dražší než Durony.
Vlajkovou lodí je nyní plný procesor Athlon, kterým poprvé v historii na čas předběhl AMD Intel ve výkonu procesoru.
Velmi zajímavý je odlehčený typ Duron. Na rozdíl od slabého Celeronu se jeho výkon od Athlonu až tak neliší.
Procesory AMD nejsou vždy stoprocentně kompatibilní a s některými programy mohou být potíže. Když přišly před časem rychlé K6/2, od 400 MHz přestávaly fungovat Windows95, což byla vada dosti podstatná a samozřejmě se rychle vyřešila záplatou do Windows. Nyní se zase proslýchá, že velké potíže jsou s Windows Me, které často tuhnou ("Modrá smrt"). Microsoft zatím svou vinu popírá.

Výsledky

Pro každý program a procesor bylo změřeno několik šachových testů a při nich stanovena průměrná rychlost programu v počtu pozic za sekundu. Tento ukazatel byl ještě přepočítán na jednotnou frekvenci, protože stejně taktované stroje nebyly k dispozici. V tabulce je uvedena relativní rychlost propočtu programu, jako základ 100 byl vždy brán Celeron. Vítězové jsou vyznačeni žlutě, K6/3 mimo soutěž.
V posledním řádku je pro zajímavost uvedena cena procesoru 750MHz bez DPH, platná začátkem roku 2001.

software/procesor AMD K6/3 Celeron Pentium III Duron Athlon
DeepFritz 93 100 108 92 99
Hiarcs 7.32 110 100 113 103 110
Nimzo 8 132 100 109 103 108
Junior 6a 110 100 103 103 105
Gandalf 4.32h 136 100 139 125 130
Goliath Light 2 147 100 119 117 135
Shredder 5 120 100 106 99 103
Gambit Tiger 113 100 104 98 103
750 MHz Price/Kč 2500 (550MHz) 5000 8000 3000 4500

Závěry a doporučení
Results and Recommendations

Staré procesory nejsou špatné - dost překvapuje vynikající výsledek K6/3, založený ještě z velké části na klasickém jádru Pentia. Bohužel jeho taktování končí někde na 550 MHz, což je pro modernizaci nebo nový stroj příliš málo.
Pokud nebudete hledět na cenu, nejlepším řešením je čisté Pentium III, které u většiny programů dá při stejném taktu o něco vyšší výkon.
Na cenu ale hledět jistě budete. Proto při koupi šachového PC z poměru MHz/Kč suverénně vítězí Duron společnosti AMD. Rozdíly v rychlosti jsou nepatrné. Je ověřeno, že moderní šachové programy pod Windows98 SE nemají s AMD žádné potíže.
Má-li však být počítač nasazen i jinak, celá věc přestává být jednoduchá. Na "AMD-éčkách" mají totiž potíže některé jiné programy, údajně dokonce i Windows Me.

In the table are relative speeds (Celeron = 100) of some important chess programs in a small chess benchmark.
The speed is very low depended on the CPU type, even the old AMD K6 would be very good, but it ends on 550 MHz. But the speed is very depended on frequency, so pay for MHz and not for CPU type.
Unfortunately AMDs Duron, Athlon are not very compatible, especially I have to strongly warn for AMD/WinME combination.

A co čipset?

Autor testu bohužel nevěnuje pozornost takzvanému čipsetu, který je dnes (vedle procesoru) klíčovým prvkem základní desky a při vyrovnaném výkonu procesorů často rozhoduje o rychlosti počítače. Mimo jiné má na starost komunikaci procesoru s pamětmi, diskem a grafickou kartou.
Rozdíly ve výkonu mezi špičkovým čipsetem (klasický Intel BX nebo moderní Intel 815E) a některými levnějšími typy společností ALI nebo VIA může být až 10 procent, což je v řádové shodě s naměřenými rozdíly rychlostí. To by tedy mohlo ještě trochu výsledky zamíchat. Hlavní závěr o malém vlivu výrobce a typu procesoru však bezesporu platí.


Test BS2001

září/september 2001

Silný český korespondenční šachista měnil nedávno hardware z velmi slušného AMD T-Bird 800 MHz na špičkové AMD T-Bird 1.4GHz. Při této příležitosti provedl testy BS2001, zajímavé hned dvojnásobně. Jednak ukazují sílu (a vyrovnanost) současné absolutní špičky a jednak vypovídají o tom, kolik ELO bodů můžete za těch Kč 17.000+ získat.

A strong czech correspondence player updated his hardware and he made a small interesting test.

  T-Bird 800MHz T-Bird 1400 MHz plus celkem total
Nimzo 8 2612 11 2641 13 29 2626.5
Junior 7 2610 12 2643 14 33 2626.5
Shredder 5.32 2600 10 2645 12 45 2622.5
Gambit Tiger 2 2575 9 2649 14 74 2612
Hiarcs 7.32 2600 11 2613 11 13 2606.5
Fritz 6 2570 8 2614 11 44 2592
Tiger 14 2575 9 2600 10 25 2587.5

Vedle ELA je vždy uveden počet vyřešených úloh.
ELO und number of solved position are given.

Závěry o síle programů
Results - the strength of software

Dnešní špička je neobyčejně vyrovnaná a velmi záleží na použití programu.

Třeba Nimzo 8, o kterém se na základě hraných partií tvrdí, že se vyloženě nepovedl. Při analýze nezvyklých pozic korespondenčního šachu a studií však může prokázat větší službu než turnajová hvězda Fritz, který skončil na chvostu tabulky. Není také vyloučeno, že při volbě jiných pozic by se pořadí zamíchalo. První místo dělil také nový Junior 7 a potvrdil tak dobou pověst mezi korespondenčními šachisty, o které byla několikrát řeč v Novinkách. Z vlastní zkušenosti však mohu potvrdit, že na koncovky se Junior ale vyloženě nehodí.

Today's top programs are very level-headed. It depens on using. For example Nimzo 8 not considered as successful tournament version has excellent analytical ability and here he placed as first.

Závěry o vzrůstu síly
Results - ELO/MHz

Docela překvapilo, jak velmi kolísá u jednotlivých programů efekt nového procesoru. U Hiarcsu s +13 je skoro zanedbatelný, neuvěřitelně zato vylétl GambitTiger s +74. Průměrný vzrůst síly je 37.5 bodu. Důležitým koeficientem je přírůstek ELA při zdvojnásobení rychlosti.

There are surprisingly big differences in using increased CPU power. Hiarcs only +13 and in contrast GambiTiger +74. Average growing is 37.5. The important koeficient gives an ELO increment for doubled frequency.

ELO2 = ELO1 + K * log2 (MHz2/MHz1)   =>    K = 37.5 / log2 (1400/800) = 46.5

Zatímco u klasických programů dobře platilo "zlaté" číslo 100, dnes ve špičkové oblasti je pravdou spíš 50 než 70, jak se často udává.

A classical "gold" rule (doubled MHz = +100 ELO) should be today changed to around a half.


Intel Pentium4 2GHz nebo AMD?
Intel Pentium4 2GHz or AMD?

Aktuální FritzMarky pro v současné době špičkové procesory obou konkurenčních výrobců zaslalo několik diskutujících na CCC fórum, zde krátké shrnutí. V prvním sloupci je nejlevnější z nové řady "opravdových" Pentií 4. TBird v posledním sloupci je 1.4GHz přetaktovaný o necelých 10 procent.

There are FritzMarks from different sources. The last row is Price (1 USD=37 Kč).

FMark Intel P4
1.5 GHz
Intel P4
2GHz
AMDTBird
1.4GHz
AMDTBird
1.533
AMDTBird
 1.6
AMD XP 1800+
hash Mb FMark kN/s FMark kN/s FMark kN/s FMark kN/s FMark kN/s FMark kN/s

16

581

879

808

1211

  890

1325

925

1385

       

32

651

941

837

1214

  913

1322

950

1369

       

64

651

930

837

1198

913

1309

937

1335

1049 1493    

128

585

838

   

  890

1273

890

1267

    1027 1523

184

576

824

   

878

1250

           

256

           

817

1170

925 1326    

512

           

817

1170

       
cena/Price
CPU Kč
8.000 30.000 6.200 doplním

Překonáte-li tedy různé nástrahy AMD procesorů jako je chlazení a nekompatibilty, pak na šachy je ThunderBird stále optimální volbou.

A surprise - TBird 1400 is for chess quicker as the famous P4 2GHz. But this is valid only for chess. AMD are bad compatible and you can expect probles with games... And not only games, Windows ME is with TBird unusable. The "blue dead" occured sometimes in a day.

Tabulka také ukazuje, že od určité velikosti už nemá smysl přidávat další RAM pro hash tabulky. Pokud Vás tento problém zajímá, podívejte se CCC fórum. Strhla se tam kolem obrovská diskuse dokonce za účasti špičkových programátorů, ale jasný závěr jsem z toho nevypozoroval.
Jsou na vině hash kolize? Je FritzMark špatně naprogramován a s jinými pozicemi by to tak nedopadlo? Kdo ví.

A big discussions are about hash.


Ještě o růstu síly s MHz
Another ELO/MHz test

Nová ELO listina SSDF z 10.2001 testovala nejsilnější programy kromě AMD K6 450MHz také na TBirdu 1200 MHz.

The new SSDF rating list gives top programs on 450 and 1200 MHz. This is very good material for calculations and results.

program

AMD TBird 1200 MHz

AMD K6/2 450 MHz

Difference

DeepFritz 2726 2654 72
Gambit Tiger 2720 2640 80
ChessTiger 2703 2632 71
Shredder 2699 2600 99
Gandalf 2653 2532 121
průměrně/average     88.6

Výpočet "konstanty dvojnásobné rychlosti"
The koeficient of doubled speed

ELO2 = ELO1 + K * log2 (MHz2/MHz1)    =>    K = 88.6 / log2 (1200/450) = 63.

Toto číslo je dost vysoké a napomohl mu značně vybočující Gandalf. Bez Gandalfa je průměrný růst jen 80.5 a konstanta 57.

This number is realtive high (compare previsous article). Without Gandalf is difference 80.5 and keficient 57.

Nad touto mou tabulkou se rozpoutala na CCS fóru živá diskuse. Samozřejmě závisí na tempu hry, některé programy profitují z výkonu počítače více a jiné méně. A aby to nebylo tak tak jednoduché, některým programům sedí více AMD, jiným Intel.
Vaškovi Kotěšovcovi se zase moc nelíbí logaritmická aproximace závislosti ELA na rychlosti, ale ta se používá běžně a postupný posuv k oblasi nasycení se kompenzuje právě koeficientem K, který každý rok trochu klesá.
Tabulce je také vytýkáno, že zanedbává typy procesorů, vliv RAM a rychlejší disky nových strojů SSDF. Myslím však, že vliv je velmi malý, jak ukazují předchozí tabulky.

There are discussions about this table. The CPU type, RAM and quicker HDDs are ignored here. But the influence of this factors is very low - see previous tables.


Burchamovy benchmarky /Burcham's benchmark

K. Burcham kburcham@adelphia.net uveřejnil na CCC fóru zajímavé benchmarky většiny procesorů.
Použil fritzmark Fritz 6a (ten se provádí v motorem 5.32), na dvouprocesorové DeepJuniora (6), pokaždé 128 M RAM
Dejte mu vědět, pokud se číslo na vešem stroji podtatně liší.

K. Burcham kburcham@adelphia.net published on CCC forum benchmarks with most CPUs.
Fritzmark Fritz 6a (with engine 5.32) is used, for multiprosesors DeepJunior (6), always 128 M RAM

p3  1000 mhz  880 kns
amd 1000 mhz  880 kns
amd 1200 mhz 1050 kns
p4  1700 mhz 1210 kns
amd 1400 mhz 1230 kns
p4  1800 mhz 1250 kns
amd 1533 mhz 1350 kns
p4  1900 mhz 1350 kns
amd 1600 mhz 1400 kns
p4  2000 mhz 1425 kns

2 x 1000 mhz 1600 kns p3 and amd
2 x 1700 mhz 2150 kns xeon
2 x 1533 mhz 2350 kns amd mp
2 x 2000 mhz 2550 kns xeon
2 x 2000 mhz 3000 kns amd mp

Odhad pro 10 mikronové /Estimation for new 10 micron CPUs.

amd 1800 mhz 1580 kns
amd 2000 mhz 1750 kns
amd 2500 mhz 2100 kns
amd 3000 mhz 2600 kns
amd 4000 mhz 3500 kns


Rychlé procesory 02/2002
Quick CPUs 02/2002

Tabulka uvádí SYSmark2000, Win98SE, GeForce2, 1024x768x32, který je převzat z www.TECCannel.de .
Ceny jsou v Kč koncové včetně DPH poskytla je firma ABI a KM-Elba. Komentář dole.

Výrobce Procesor Frekvence MHz Paměť

SysMark

Cena včetně DPH
AMD Athlon XP 2000+ PC266 291 15 200
AMD Athlon XP 1900+ PC266 278 12 000
AMD Athlon XP 1800+ PC266 271 8 650
Intel Pentium 4 2200 PC266 250 32 200
AMD Athlon XP 1400 PC266 245 6 000
Intel Pentium 4 2200 PC800 237 32 200
Intel Pentium 4 2000A PC266 236 19 750
Intel Pentium 4 2000 PC800 226 19 750
Intel Pentium 4 2000A PC800 225 19 750
Intel Pentium 4 2000 PC266 222 19 750
Intel Pentium 4 1900 PC800 218 14 500
Intel Pentium III Tualatin 1200 PC133 217 10 200
Intel Celeron Tualatin 1300 PC133 211 6 080
AMD Duron 1200 PC266 204 3 900
Intel Pentium 4 1800 PC800 200 11 570
Intel Pentium 4 1700 PC800 193 10 540
Intel Pentium 4 1600 PC800 187 9 370
Intel Pentium 4 1500 PC800 181 8 700
Intel Pentium III 1000 PC800 176 7 670
Intel Pentium 4 1400 PC800 170 8 600
Intel Pentium 4 1300 PC800 162 8 500

V poměru cena /výkon jasně vedopu AMDéčka, což není žádné tajemství. Je ale také známo, že jde o čipy spíš pro odborníky, kteří si dovedou poradit s jejich mouchami - přes technické problémy, přehřívání (a s tím spojená hlučnost ventilátorů) až po poměrně časté nekompatibility softwaru. Windows ME je na AMD procesoru prakticky neprovozovatelný a nejlépe je zůstat u Win 987SE. Špičkové šachové programy však běží se zárukou všechny - pokud stavíte speciál na korespondenční šach, nebudete v tom hluku spát a máte dobrého dodavatele, stojí to za úvahu, protože úspora je to značná.

V opačném případě je dobrým tipem zbrusu nová řada Celeronů s jádrem Tualatin a technologií 0.13 mikronů. Pokud byste chtěli tento čip osadit do starší základní desky, třeba místo Celeronu 800 MHz, máte ve většině případů smůlu. Zase se změnilo nějaké napájecí napětí nebo co a musíte měnit i celou základní desku.

Paměti. Nejlevnější jsou klasické SDRAMy, které se nyní značí podle frekvence PC133. Nejdražší RAMBUSy od Intelu (PC800) se zdaleka neprosadily tak, jak výrobce očekával, zejména kvůli vysoké ceně. Proto je dnes nejrozšířenější kompromisní řešení tzv DDRAM, což jsou SDRAM se zvojenou (Double) rychlostí přenosu dat (PC266). Ty v testu Pentia 4 2200 MHz dokonce z nějakého záhadného důvodu lehce předčily RAMBUS. Každá z těchto pamětí vyžaduje patřičnou základní desku, jen některé umožní osadit nebo dokonce kombinovat dva typy.


AMD vs Intel

Velmi zajímavý web, kde hrály šachy dva konkurenční procesory. Po 8 kolech byl pokus uzavřen, výsledky jsou v tabulce.

Závěry:
1. Intel je lepší, jak také odpovídá jeho taktování. Podle mého by bylo zajímavější nasadit proti AMD 2000+ opravdu Intel 2GHz.
2. Fritz je výrazněji optimalizován pro Intel, zatímco u Shreddera je závislost výrazně menší.
3. Shredder je v dané konstalaci trochu lepší než Fritz, což ovšem nebylo předmětem pokusu.

An interesting web with chess match on Intel vs AMD CPUs. After 8 rounds was this experiment finished, see table.

Results:
1. Intel is better - that's given with frequency. Comapring AMD 2000+ with Intel 2GHz would be more interesting.
2. Fritz is more depended on Intel, Shredder is not enough.
3. Offf topics - Shredder was a little better.

Intel x AMD AMD 2x Athlon MP 2000+ (reálně kolem 1667 MHz)
Fritz Shredder
Intel 2x Xeon 2.4 GHz Fritz 94 : 80 65.5 : 75.5
Shredder 72.5 : 69.5 79 : 72

http://www.heise.de/ct/schachduell/
Podrobnosti o mainboardech /More about used Mainboards http://www.heise.de/ct/schachduell/kontrahenten.shtml


Novinky v procesorech 08/2002
CPU news 08/2002

1. Compaq má iPAQy řady 39xx s procesorem XScale PXA250(jádro V5) 400 MHz (místo starého StrongArm 206MHz). Ten kromě vyšší rychlosti má také rozšířenou výkonnou instrukční sadu, které však není využita ani systémem Pocket PC2002, ani Pocket Fritzem. Z důvodu kompatibility. V oboru PC je tento stav dávno znám, například teprve Fritz 7 využil rozšíření instrukční sady MMX, které přinesl už procesor Pentium 166 MHz MMX.

2. Ostatně i výkon nových Pentií 4 je právě vázán s rozšířením instrukční sady SSE2. Vlajková loď P4 2.53 GHz překonává Athlona 2200+ až o 15 procent v Sysmarku2002. Ovšem ten je už optimalizován na SSE2. Použijeme-li starší neoptimalizované programy (a takové jsou zatím i všechny šachové), tak v Sysmarku98 překoná toto Pentium dokonce i Athlon 2100+.

3. AMD. Nový zmíněný Athlon XP 2200+ má upravené optiamlizované jádro, které by mělo méně hřát (68W, 2100+ měl 72W). Ale prakticky, zřejmě díky menší ploše, hřeje podstatně víc než 2100+ a stává se velkým problémem ho vůbec uchladit. A tak někteří příznivci utekli k Pentiu 4 2.53 GHz a jiní čekají na konec roku, kdy bude slavnostně uveden Opteron s úctyhodnými parametry. Cache L1/L2 128M/1Gbyte, integrovaný DDR řadič, rozšíření SSE2, ale také 64 bitový provoz x86-64. A také možnost víceprocesorového provozu, který byl u Athlonů jen pro speciální verze.

1. Compaq has iPAQ serie 39xx with XSCale CPU 400 MHz. The new CPU has an expanded instruction set, but for compatibility reason it's not used both by system Pocket PC2002 and Pocket Fritz. In PC world an usual situation.

2. The new Pentium 4 2.53 GHz has expandend set SSE2. With this set used (SysMark 2002) P4 beats Athlon 2200+, but without this set (Sysmark98 and of course chess soft) is even below Athlon 2100+.

3. The new Athlon 2200+ has new core theoretically with low power (68W, 2100+ was 72W), but in praxis it heats more than 2100+ and it's a big problem to cool it. Some peaples escaped to P4 and some are waiting for Opteron. Cache L1/L2 128M/1Gbyte, integrated DDR controller, extension SSE2, but also 64 bit extension x86-64. In additin every Opteron wil be able to run in multiCPU board.


Celerony 1.8- 2 GHz nejsou na šachy moc vhodné
Celeron 1.8- 2 GHz are not very good for chess

Vypadalo to jako bomba, Celeron s moderním jádrem P4, ale malá cache L1 značně degraduje výkon. Celeron Tualatin 1.3-1.4 GHz, jehož výroba pomalu končí, má lepší FritzMark.

The small L1 cache is very bad for chess, Celeron Tualatin 1.3-1.4GHz with PIII kern has better FritzMark.

http://h-j-s-.bei.t-online.de/page5.html


Procesory 2003
CPUs 2003

I v roce 2003 se očekává překotný vývoj a mnoho novinek.

AMD

Vývoj v Athlonech bude z XP2800+ pokračovat na 3200+, 3400+ a podle optimistů až 4000+.
To je ovšem poměrné číslo, skutečný takt skončí na 2-2.5 GHz. U modelu Barton by měla cache stoupnout z 256 na 512k.
U příležitosti CeBitu bude představen Athlon 64 (Calwhammer) s 64 bitovým kódem, 1M cache, FSB ještě není stanoven (333, 400 nebo 533 MHz, zřejmě jak se podaří). Paměti DDR 400MHz.

Intel

Všechny nové P4 už s Hyper-Threadingem.
Staré mainboardy už budou zase nepoužitelné, protože FSB stoupne z 533 na 800 MHz.
Skončí se na frekvenci 3,6 (optimistický odhad 4,0) GHz. Cache zůstane na 512k.
Zase někdy kolem CeBitu se ale objeví Prescott (snad pod jménem Pentium 5?). 0,09mikronová technologie zajistí menší spotřebu při FSB 800MHz, novou multimediální sadu instrukcí SSE3, pravdpodobně 1M cache.
Kupodivu není jisté, zda bude podporován 64 bitový kód.

FritzMarky dnes

Žlutě je vyznačeno doporučení pro šachy z hlediska poměru cena/výkon v únoru 2003

CPU GHz FritzMark kN/s procent orientační cena s DPH únor 2003 Kč
P4 3,06 1309 119 doplním
XP2800+ 2.25 1230 112 doplním
XP2600+ 2.083 1160 105 11.900,-
XP2400+ 2.00 1096 100 8.300,-
P4 2.67 1066 97 13.800,-
XP2100+ 1.73 962 88 4.800.-
XP2000+ 1.67 941 86 4.100,-
XP1900+ 1.6 915 83 3.800,-
P4 2.26 880 80 8.500,-
XP1800+ 1.53 880 80 3.400,-
XP1700+ 1.46 822 75 2.450,-
P4 2.00 777 71 7.700,-
Athlon1400 1.4 770 70 už není v cenících
Celeron Tualatin 1.5 760 69 2.400,-
P4 1.8 659 60 6.800,-
Duron1300 1.3 638 58 1700,-
P3 1.0 546 50 5.000,-

24.06.03
Ještě procesory 2003
More CPUs 2003

Novinky v pololetí

Intel

Nové modely P4 mají všechny Hyper-Threading, sběrnici FSB 800 MHz a jsou dodávány na frekvencích 2.4 2.6 2.8 a 3.0 GHz. Vhodné paměti DDR-400 jsou k těmto procesorům s FSB 800 MHz nejlépe vyladěny. Základní desky potřebují chipset 865 nebo dražší novinku 875.
Za velkou výhodu je udáváno, že nový Prescott (alias Pentium 5), který přijde koncem roku, bude kompatibilní s těmito základními deskami. To je ovšem spíš reklamní slogan, znalci dobře vědí, že během pár měsíců přijde nová vlastnost, která už kompatibilní nebude - zkrátka ať se vám to líbí nebo ne s procesorem se dnes mění skoro automaticky i základní deska.

Chcete-li levnější Celeron, vyhněte se modelům 1.7 a 1.8 GHz s jádrem P4. Buď lze sáhnout po starším 1.3 GHz s velmi kvalitním trojkovým jádrem Tualatin (FritzMArk vyšší než u 1.7 GHz), nebo začněte až na 2.0GHz s vylepšeným jádrem Northwood.

AMD

Nový s velkým halasem ohlašovaný Athlon XP 3200+ je propadák.
Běží na novém jádru Barton s cache L2 512k (oproti starému jádru Thoroughbred se 256k, modely 2600,2700 a 2800+) s FSB 400 (starší "Bartony" XP 2800+ a 3000+ běžely na FSB 333MHz).
Ne, že by to byl špatný procesor, ale ohlašovaný výkonový růst se nekoná.
Není to až takové překvapení, vždyť XP 3000+ byl vnitřně taktován na 2167 MHz a u 3200+ s vnitřním taktem 2200 MHz je přírůstek nepatrný.
AMD je ze všech stran kritizována za označení 3200+, které neodpovídá skutečnosti.
Firma už zřejmě žije Opterony s podporou 64 bitové architektury, jejichž první modely (Opteron 1.4GHz - 1.6GHz - 1.8GHz) ovšem nejsou výkonově nic moc a jsou srovnatelné nejvýš s XP 2100+. Výkon vyženou až nové 64 bitové aplikace v 64 bitových systémech.

XP rating Athlon Barton FSB 400, 512k L2 Athlon Barton FSB 333, 512k L2 Athlon T-bred FSB 333, 256k L2 Athlon T-bred FSB 266, 256k L2
3200+ 2200 MHz      
3000+   2167 MHz    
2800+   2083 MHz 2250 MHz  
2700+     2167 MHz  
2600+     2083 MHz 2133 MHz
2500+   1833 MHz    
2400+       2200 MHz
2200+       1800 MHz
2100+       1733MHz
2000+       1667MHz
1900+       1600 MHz
1800+       1533 MHz
1700+       1467 MHz

 

Benchmarky Business Winstone 2002 Multimedia creation Winstone 2003
Intel P4 3 GHz 33.6 49
AMD Athlon 3200+ XP 38.1 40.3

18.08.03
Procesory 2003/2004
CPUs 2003/2004

AMD Roadmap

desktop Q3 2003 Q4 2003 Q1 2004
1500 USD 3400+ 3400+/64 3700+/64
1000 USD 3200+ 3200+ 3400+/64
800 USD 3000+ 3000+ 3200+, 3100+/64

Nový Athlon 64 přijde nejdřív ve výkonné verzi 3400+ a teprve později jako 3100+.
Taktování: 3700+ na 2,4 GHz, 3400+ na 2 GHz, 3200+ (Barton) 2,2 GHz

Intel Roadmap

desktop Q3 2003 Q4 2003 Q1 2004
1500 USD 3,2 GHz 3,4 GHz/Prescott 3,6 GHz /Prescott
1300 USD 3 GHz 3,2 GHz /Prescott 3,4 GHz /Prescott
1000 USD 2,6 GHz 3 GHz 3,2 GHz /Prescott

Nové jádro Prescott má větší cache a nové instrukce pro SSE2 (multimedia) a Hyper-Threading. Zatím není jasné, zda bude ještě označen jako Pentium 4 nebo už jako Pentium 5.
Rýsuje se nové jádro Tejas (indiánsky přítel), snad už jako Pentium 6. Uvedení plánováno na 2. pololetí 2004.

Code name Northwood P4 Prescott P4/P5?? Tejas P5/P6??
L2 cache 512k 1024k 1024k
L1 instr 12k 12k 16k
L1 data 8k 16k 16k
Technology 130 nm 90 nm 90/65 nm
FSB real 100/133/200 200 MHz 200/266
FSB effective 400/533/800 800 MHz 800/1066
Takt 1,6-3,2 GHz 3,0-3,6?? GHz 4,4 GHz - ??

24.06.03
FritzMarky a moderní CPU
FritzMarks and new CPUs

http://www.beepworld.de/members39/computerschach2/chessmarks.htm

Updatoval jsem také svou českou stránku s nejnovějším přehledem CPU.


24.09.03
Test 64bitových CPU šachovými programy
The 64bit CPUs and chess software

Testovali jsme nové 64bit procesory od AMD a také P4 3.2 GHz pomocí Shreddera 7.04 (průměrné kN/s v zahájení, měřeno od 1. do 2. minuty výpočtu) a Fritze 8 (fritzmark, 64MB hashtable). Plánujeme zařazovat tento test do recenzí procesoru pravidelně. Vysledky jsou zde:
http://www.pctuning.cz/Default.aspx?CatID=75&LayId=2&ArtId=18348&ChapID=3813
Zdroj www.pctuning.cz .


12.10.03
Přehled procesorů pro stolní a mobilní počítače

1. Stolní počítače
Procesory pro stolní počítače jsou na veřejnosti dobře známé.

1.1 Intel
Firma Intel dominuje světu PC – vyráběla řadu x86 (8086, 8088, 286, 386SX, 386, 486SX, 486, 486 DX2) a Pentium (ve verzi 1až 4, od verze 2 existují odlehčené levné modely Celeron).
Klony těchto procesorů nejméně od 386 vyrábí firma AMD, její nové modely Athlon (v odlehčené verzi Duron) jsou už kompatibilní, ale samostatně vyvinuté.
Několik dalších výrobců x86 kompatibilních, například Cyrix/IBM nebo VIA (C3 - studené Pentium nevyžadující aktivní ventilátor).

1.2 Motorola
Výrobce Motorola ovládl prakticky všechen ostatní trh (Atari, Commodore, Amiga, NeXT a hlavně Apple Macintosh).
Její původní modely 6800 a 6500 nakonec vyústily do slavné řady 680xx. Byla na svou dobu výkonná (rakety Pershing) a programátory v assembleru velmi oblíbená (logická čistá sada instrukcí s úplným adresovým prostorem, žádné segmenty a překrývání). Nyní vyrábí Motorola řadu procesorů PowerPC pro Apple Macintosh.

1.3 Ostatní nekompatibilní
Ostatní výrobci dosáhli jen zlomek trhu se speciálními aplikacemi.
SGI (Silicon Graphics) pro grafické pracovní stanice.
MIPS - vyzrálé, téměř dokonalé jádro procesoru pro velmi výkonné pracovní stanice, které se však na trhu příliš neprosadily.

2. Mobilní počítače – PDA, telefony
Zde je situace mezi uživateli méně známá a právě tato část je hlavním důvodem publikace. Rozdělení sil a trhu v podstatě kopíruje situaci ze stolních počítačů.

2.1 Mobilní x86
Samozřejmě prvním nápadem bylo miniaturizovat strukturu x86 – vzhledem k velkému množství programů ze světa PC a znalostem programátorů.
Téměř každý nahoře uvedený výrobce sice vyrábí „mobilní“ verze svých procesorů, tím je ale myšlena varianta pro notebooky sice s malou spotřebou, ale pořád ještě příliš velkých rozměrů (kvůli chlazení).
Atari svého času vyráběl dnes už legendární subnotebook Portfolio s procesorem 80c88, ale to už je minulostí.
AMD dotáhl podobnou snahu až k modelu 5x86 na 133 MHz (model Elan SC520 použitý v Nokia Communicatorech mimo 9210). Tím ale éra kompatibility s PC skončila.

2.2 Motorola
Motorola použila své slavné jádro 68000 pro výrobu mobilního procesoru DragonBall, který je spojen se slavnou řadou PDA Palm. Bohužel dost se šetřilo na frekvenci (dlouho 16 a 33 MHz, nzní max 66 MHz), proto poslední model Palm Tungsten T přešel k Intelskému čipu.

2.3 Intel
Intel nespoléhal na minulé verze a vyvinul speciální 32 bitový RISC procesor ARM.
Ten se proslavil nejdříve v průkopnických kapesních počítačích Psion (5mx, Revo).
Po příchodu PocketPC (rychle se prosadily právě pod tlakem dvojice Intel a Microsoft) byl Intel schopen poskytnout inovovaný StrongARM na fantastické frekvenci 206 MHz (SA –1110) a v roce 2002 dát na trh nový model XScale s frekvencí až 400 MHz. Tento model už má rozšířenou instrukční sadu s verzemi MMX a SSE.
Pro PDA se stal XScale standardem stejně jako Pentium pro PC.
Poslední modely pro PDA jsou PXA 255, 260 a 263.
PXA 800F by měl vytvořit podobný standard pro chytré mobilní telefony.
Jádro ARM vyrábí licenčně několik dalších výrobců, jako Texas Instrumentes (model OMAP 1510).

2.4 Ostatní
MIPS má na základě svých zkušeností velmi kvalitní mobilní procesor, ale stejně jako ve stolních počítačích se jí příliš nedaří. Licenci zakoupil AMD a začal vyrábět řadu Au (1000, 1100, 1500 na 500 MHz). Budoucnost toho systému je spojena se snahou prosadit nový standard PDA založený na Linuxu.
Hitashi se prosadila se 32 bitovým procesorem SH3 (HP Jordana, Casio Cassiopeia), ale nástup Intelu zřejmě další vývoj ukončil.


25.04.04
Jak bude vypadat nové PC za rok?

Chystáte-li koupi nového PC, snad vás bude zajímat, co převratného se chystá v roce 2004

1. BTX
Staré casy, zdroje a mainbordy standardu ATX nevyhovují z mnoha hledisek.
Chystá se standard BTX (Balanced Technology eXtended).
- nový konketor zdroje 24 pinů, který zase utáhne všechno (dnes jsou přídavky pro P4 i výkonné grafické karty).
- chladící kanál
- odpadnou COM a Game porty, místo toho 4xUSB2 a vícekanálový zvukový výstup
- konektor pro SATA disky jako základní standard, starý IDE konektor jen pro CD/DVD

2. PCI-Express
Také koncepce PCI /AGP už nevyhovuje rychlostí, přestože AGP zrychlila ze 1x na 8x a snížilo se její napájecí napětí (důsledek, není AGP karta jako AGP karta, zdaleka nejsou kompatibilní).
Nově se zavede opět jednotný standard rozhraní PCI-Express.
AGP sloty na BTX boardech zmizí (a grafické karty AGP čeká stejně smutný osud jako před lety nechvalně proslavený VESA standard), PCI budou v omezené míře zachovány kvůli zpětné kompatibilitě.

3. Nový slot pro Prescotta
První verze Intelské varianty P4 s jádrem Prescott se příliš nevydařily, byly totiž uvedeny předčasně jako reakce na náskok AMD.
Příliš se hřejí a s výkonem to není slavné.
Pořádné Prescotty budou mít nový soket, místo současného 478 celých 775 vývodů (LGA-775-Socet, LGA=Large Grid Array).
A hlavně už nemají mít piny (u poslední 478 verze je jeho narovnání náročným úkolem, který sotva zvládnete bez lupy), ale jen jakési ploché kontaky. No uvidíme, jak to bude fungovat a co s nedoteky...
Intel také v tichosti chystá pro Xeony 64-bitové rozšíření, jaké už nabídl AMD.

4. AMD
AMD už má 64 bitový Athlon 64, ale i zde místo 754 nožiček chystají novou verzi s 939 vývody.
První verze Athlon 64 3500+ (2.2GHz) by měla být v květnu, do roka by měla poskočit až na 4200+ (2.8 GHz).


09.06.04
Výkon mobilních procesorů Centrino

Kupujete-li notebook, snad Vás zarazí, že procesor Intel Centrino je taktován někde na 1.5 GHz.
Jak je to s výkonem proti stolním PC, které se blíží ke 3 GHz?

Nedávno nám na školení předváděli, že Centrino je bomba. Na polovičních frekvencích se hravě vyrovná strojům s klasickým P4 kolem 3 GHz. Koneckonců Intel kvapně ukončil svůj nepovedený přehřívající se Prescott, zrušil také jeho následovníka a urychleně připraví novou verzi stolního Pentia M založené právě na jádru Centrina. Přitom se moc nehřeje...

Mimochodem, Prescott a celá ta větev je z USA, zatímco nová koncepce je z vývojových laboratoří v Izraeli. Takže budeme mít brzo židovská Pentia. Nemyslím to nijak hanlivě, naopak jako značku kvality. Koneckonců když se podíváte na mistry světa v šachu, jen málokterý neměl podobný původ...
Jediný problém Centrina je velmi vysoká cena - stojí skoro 2x tolik, než AMD 3000+.

Výpis Fritzmarků

CPU               KN/s       
DualXeon 3,565    2953 kn/s  
Athlon64 2.2 3400 1405 kn/s  
PIV-3.06/3,7GHz   1374 Kn/s  
DualXeon 3,565    1326 kn/s  
Athlon64 "3200+"  1333 KN/s  
Ahtlon64 3400+    1334 KN/s  
Ath.XP 2500/2400  1270 KN/s  
PIV-3.0/3.4 Ghz   1258 Kn/s  
Ahtlon64 3000+    1195 KN/s  
Centrino 1.7 GHz  1166 KN/s  
PIV-3.06          1148 Kn/s  
Ath.XP 2500/2200  1130 KN/s  
Centrino 1.6 GHz  1096 KN/s
AMD XP 2700+/2167 1080 kN/s  
AMD XP 2600+/2083 1061 kN/s  
PIV 2.80          1049 kN/s  
AMD-Barton 2.0    1030 KN/s  
Centrino 1.50     1025 kN/s  
P4-2.67           1018 kN/s  
AMD XP 2400+/2000 1007 KN/s  
P4-2.53            895 Kn/s  
P4-2.4             893 Kn/s  
AMD XP 2200+/1800  902 kN/s  
Centrino 1.30      872 kN/s  
AMD XP 2100+/1733  871 kN/s  

28.12.04
Hyper-Threading a DeepJunior 9
Hyper-Threading and DeepJunior 9

1. Co je HT /What's HT

HT (Hyper-Threading) je technologie Intelu, kdy v jednom procesoru P4 jsou jakoby dva. Střídavě se odpojují a připojují ke sběrnici a tak vlastně levně napodobují dvouprocesorový systém. Při odpojení totiž nespí, ale mohou vnitřně pokračovat ve výpočtu.
Analogie s dvouprocesorovým systémem není úplná, k využití HT je třeba určitých úprav. Proto není automaticky jisté, že stávající deep verze šachových programů dokážíHT využít.
Já sám a pár známých nadšenců jsme se několikrát snažili otestovat, jak to vlastně s HT je. Výsledky však byly vždy velmi vágní, nejisté, nereprodukovatelné.
Můj nový vánoční test s nejnovějším DeepJuniorem 9 snad trochu poodkryje tajemství HT v šachových programech.

HT (Hyper-Threading) is an Intel technology. In one processor chip are internaly two Pentiums 4. They alternately switch on and off to PC system bus and so the multiprocessor system is emulated for a low price. Switched-off the CPUs doesn't sleep but it can internally run.
But the analogy with multiCPU sytem is not full and a multiprocessor software should to be a little adapted. So it's not sure the currently distributed deep-engines can use HT feature.
I and some my friends sometimes started HT tests, but the results were unclear.
Maybe my new X-mas test could a little clear the all matter.

2. Podmínky testu /How I tested

Hardware Pentium 4, 3 GHz, Asus P4P800 mainboard, 2x256 DDR dual channel
Software Windows XP Pro SP2, Junior 9, DeepJunior 9, Fritz GUI 24

HT jsem vypínal a zapínal v BIOSu, jako kontrola sloužila indikace threads v parametrech Deep Juniora, která se skutečně správně měnila na 1 a 2.
Zatížení procesoru jsem informativně sledoval ve správci, ale při ostrém testu jsem ho vypnul.

HT was switched on and off in BIOS Setup, Deep Junior really gives in parameters threads=1 and threads=2.
The CPU loading was checked for information in Task Manager, but for test runs it was shutdowned.

V testu BS2830 jsem vyhledal několik pozic jasné taktické povahy, které Junior řeší v řádu desítek vteřin.
Rychlejší řešení by vneslo systematickou chybu, dlouhé řešení by test zbytečně zdržovalo.
Rychlý průběh umožnil každou pozici projet několikrát (s mazáním hash tabulek), takže výsledky jsou perfektně reprodukovatelné.
Velmi důležité bylo kromě času měření zapsat také počet prozkoumaných pozic (v milionech M), které program k nalezení řešení musel prozkoumat.

In BS2830 I have found some positions of clearly tactical nature which are solved in tens seconds.
The more quick solution times could bring the error, the loner times would be unnecessarily delay.
Such a solution times allowed repeat every positin sometimes (with hash clear, of course), so all is perfectly reproducible.
I have noticed also the number of positions (in mega -M) needed to finding solution.

3. Výsledky /Result

    Junior 9 hash=192M (default) Deep Junior 9 hash=192M (default)
  BS 2830 HT on (BIOS)
CPU using 50 percent
HT off (BIOS)
CPU using 100 percent
HT on (BIOS)
CPU using 100 percent
HT off (BIOS)
CPU using 100 percent
1 Chalifman - Gavrikov 1.Bd2! 25 s /42 M 25 s /42M 24 s /37 M 26 s /33 M
2 Alechin - Rabinovic 1.Bb2! 14 s /23M 15 s /23M 13 s /22M 16 s /16M
3 Bednorz - Spinath 1.Ne6! 33s /49M 33s /49M 37s /49M 36s /38M
4 Nimcovic - Alapin 1.0-0-0! 55s /83M 56s /83M 40s /52M 55s /71M
5 Timman - Korcnoy 1.Nxf7! 6s /10M 6s /10M 4s /3.7M 8s /11M

4. Komentář /Comments

4.1 Non-deep engines

Pro ne-deep motory se podle očekávání výsledky příliš neliší. Občas bez HT přibyde nějaká ta vteřina (případy 2,4).
To ale není vlastností motoru, spíš bych to přičetl režii systému, kde přece jen běží nějaké procesy na pozadí, které s HT on mohou zabrat trochu méně času.
Hlášení o 50 procentním využití CPU je jen kosmetika, systém prostě "vidí" nevyužitou CPU.

For non-deep engines there are no big differences. Sometimes with HT off the solution is one second longer (cases 2,4), but it is not the engine delay.
I think the reason are Windows background processes, which are a litte bit better optimized with HT on.
The 50 percent CPU using is cosmetics only, system sees one nonused CPU.

4.2 Deep engines

Prohlédnete-li jen zběžně časy řešení, uvidíte příčiny rozpaků při různých předchozích testech.
Někdy je ne-deep motor rychlejší než deep (3).
Někdy je HT off i pro deep motor výhodnější, než HT on (3).
Nejčastější je přece jen očekávaná situace, kdy deep motor s HT on ukáže určitou převahu.
Co se tam vlastně děje?
Zapomeňte na chvíli na časy a prohlédněte si počet prozkoumaných pozic nutných k nalezení řešení.
Vždy se liší a pro HT on bývají často vyšší.
To je důkaz, že program pracuje pokaždé s jiným algoritmem a spolu s indikací CPU load=100 procent napovídá, že motor opravdu s HT on spouší dva thready.
Jenže správa a koordinace obou threadů je náročná, takže HT on algoritmus je méně kvalitní a spotřebuje víc pozic.
Právě to částečně znehodnocuje zrychlení výpočtu, které s HT přece jen není tak velké jako u čistě dvouprocesorového systému.

The times are different for different positions, so this is the reason of past tests confusion.
Sometimes the non-deep engine is quicker (3).
Sometimes the HT off is better as HT on (3 again).
But in the most cases - as expected - deep version with HT on has a small advantage.
What happened?
Forget times now and look the MegaKnots needed to find solution.
They are always different and for HT on are usually higher.
That's proof, the engine uses a different algorhithm for HT on and HT off. And because of CPU using=100 percent, the two threads are surely started with HT on.
But the 2-threads management is difficult and the algorhithm for HT on is not effective enough and it needs some extra MegaKnots.
And this compensates a quicker HT computing. The HT speed is lower as pure two CPU system.

5. Shrnutí /Summary

Deep Junior využívá HT a spouští dva paralelní propočty, ovšem jejich správa vede k méně efektivnímu algoritmu a v souhrnu není výsledný efekt příliš výrazný.

Deep Junior with HT on starts two paralel calculations, but his managment gives usualy a less effective algorithm and so the result is not visible enough.


07.04.05
Specializovaný Axon test CPU
Special CPU Axon text

Axon test je speciální benchmark procesoru, složený z takového instrukčního mixu 16 a 32 bitových instrukcí, který odpovídá šachovým motorům.
V podstatě jde o motor, řešící šachový problém.
Test běží na počítači řádově jen minutu, poté vydá číselný výsledek, který je možné na webu porovnat s celou řadou jiných měření.

Axon test is a special chess benchmark - a special chess engine solving some problems. So the instruction mix is characteristic for chess.
The run is only minute and as result you get a number.

http://www.geocities.com/sedatchess/ both download test and see a lot of results


09.09.05
Axon benchmarky (Sedat)
Axon benchamrks (Sedat)

AMD Athlon 64 FX-55 2.60 GHz  (00:00:24.4 sec.)   [3774488 pps.]   PowX= 11.759
AMD Athlon 64 3800+ 2.40 GHz  (00:00:25.8 sec.)   [3569671 pps.]   PowX= 11.121
AMD Athlon 64 X2 4600+2.40GHz (00:00:26.3 sec.)   [3501806 pps.]   PowX= 10.910
AMD Athlon 64 FX-53 2.40 GHz  (00:00:26.4 sec.)   [3488542 pps.[   PowX= 10.868
AMD Athlon 64 3700+ 2.40 GHz  (00:00:26.4 sec.)   [3488542 pps.]   PowX= 10.868
AMD Athlon 64 3400+ 2.40 GHz  (00:00:26.5 sec.)   [3475377 pps.]   PowX= 10.827
AMD Athlon 64 3400+ 2.20 GHz  (00:00:28.6 sec.)   [3220192 pps.]   PowX= 10.032
AMD Athlon 64 3200+ 2.20 GHz  (00:00:28.6 sec.)   [3220192 pps.]   PowX= 10.032
AMD Opteron 248 2.20 GHz      (00:00:29.0 sec.)   [3175776 pps.]   PowX= 9.894
Intel M760, Dell XPS 2.0 GHz  (00:00:29.2 sec.)   [3154024 pps.]   PowX= 9.826
AMD Athlon 64 3000+ 2.01 GHz  (00:00:31.4 sec.)   [2933041 pps.]   PowX= 9.138
AMD Ahtlon XP 2800+ 2250 MHz  (00:00:31.6 sec.)   [2914478 pps.]   PowX= 9.080
AMD Athlon 64 3000+ 2000 MHz  (00:00:31.7 sec.)   [2905284 pps.]   PowX= 9.051
AMD Dual Opteron 246 2.00 GHz (00:00:32.0 sec.)   [2878047 pps.]   PowX= 8.966
AMD Athlon XP 2700+ 2.17 GHz  (00:00:32.8 sec.)   [2807851 pps.]   PowX= 8.748
AMD Athlon MP 2800+ 2133 MHz  (00:00:33.3 sec.)   [2765691 pps.]   PowX= 8.616
Intel Centrino Datron 1.73 GHz(00:00:33.7 sec.)   [2732863 pps.]   PowX= 8.514
Pentium 4 CPU EE 3.2 GHz      (00:00:33.8 sec.)   [2724778 pps.]   PowX= 8.489
AMD Athlon XP 2600+ 2083 MHz  (00:00:33.8 sec.)   [2724778 pps.]   PowX= 8.489
AMD Athlon XP 3000+ 2100 MHz  (00:00:33.9 sec.)   [2716740 pps.]   PowX= 8.464
P4 3.20 GHz Dell Precision 360(00:00:34.1 sec.)   [2700806 pps.]   PowX= 8.414
AMD Athlon XP 2800+ 2083 MHz  (00:00:34.0 sec.)   [2714986 pps.]   PowX= 8.376
AMD Athlon XP 2400+ 2.00 GHz  (00:00:35.6 sec.)   [2587008 pps.]   PowX= 8.060
AMD Athlon MP 2400+ 2.00 GHz  (00:00:35.6 sec.)   [2587008 pps.]   PowX= 8.060
Pentium 4 CPU 3.06 GHz        (00:00:35.5 sec.)   [2594296 pps.]   PowX= 8.082
AMD Athlon MP 2400+ 2.00 GHz  (00:00:36.3 sec.)   [2537121 pps.]   PowX= 7.904
AMD Sempron 2800+  2.00 GHz   (00:00:36.9 sec.)   [2495867 pps.]   PowX= 7.776
Pentium 4 CPU 3.00 GHz        (00:00:37.1 sec.)   [2482412 pps.]   PowX= 7.734
Pentium 4 CPU 2.80 GHz        (00:00:37.7 sec.)   [2442904 pps.]   PowX= 7.611
AMD Fujitsu-Siemens 2600+     (00:00:38.7 sec.)   [2379780 pps.]   PowX= 7.414
AMD Athlon XP  2500+ 1833 MHz (00:00:38.8 sec.)   [2373647 pps.]   PowX= 7.395
Dual Intel Xeon 2.80 GHz      (00:00:38.8 sec.)   [2373647 pps.]   PowX= 7.395
AMD Mobile 2600+ 2000 MHz     (00:00:39.0 sec.)   [2361474 pps.]   PowX= 7.357
Pentium 4 CPU 2.8 HT Laptop   (00:00:39.3 sec.)   [2343448 pps.]   PowX= 7.301
AMD Athlon XP 2200+ 1800 MHz  (00:00:39.4 sec.)   [2337500 pps.]   PowX= 7.282
Intel Pentium 4HT 2800 MHz    (00:00:39.6 sec.)   [2325694 pps.]   PowX= 7.245
AMD Dual Opteron 242 1.60 GHz (00:00:39.8 sec.)   [2314007 pps.]   PowX= 7.209
Dual Mobile Pentium 4 2.66 GHz(00:00:40.6 sec.)   [2268411 pps.]   PowX= 7.067
Intel Celeron CPU 2.70 GHz    (00:00:40.6 sec.)   [2268411 pps.]   PowX= 7.067
Dual Mobile Pentium 4 2.66 GHz(00:00:40.9 sec.)   [2251772 pps.]   PowX= 7.015
AMD Athlon XP 2200+ 1800 MHz  (00:00:41.5 sec.)   [2219217 pps.]   PowX= 6.914
Pentium 4 CPU 2.6 GHz         (00:00:41.0 sec.)   [2251452 pps.]   PowX= 6.897
Intel Centrino 1.70 GHz       (00:00:41.8 sec.)   [2203289 pps.]   PowX= 6.864
AMD Athlon XP 2500+ 1833 MHz  (00:00:42.1 sec.)   [2187589 pps.]   PowX= 6.815
Pentium 4 CPU 2.53 GHz        (00:00:42.5 sec.)   [2167000 pps.]   PowX= 6.751
Pentium 4 CPU 2.40 GHz        (00:00:44.1 sec.)   [2088378 pps.]   PowX= 6.506
Intel Centrino 1.6 GHz        (00:00:44.5 sec.)   [2069607 pps.]   PowX= 6.448
AMD Dual Opteron 240 1.4 GHz  (00:00:44.7 sec.)   [2060347 pps.]   PowX= 6.419
AMD Sempron 2300+ 1.58 GHz    (00:00:45.0 sec.)   [2046611 pps.]   PowX= 6.376
AMD Athlon MP 1800+ 1.53 GHz  (00:00:47.0 sec.)   [1964032 pps.]   PowX= 6.084
Intel Centrino 1.50 GHz       (00:00:47.9 sec.)   [1922703 pps.]   PowX= 5.990
AMD Athlon XP 1900 1.6 GHz    (00:00:48.4 sec.)   [1902841 pps.]   PowX= 5.928
Mobile Pentium 4 2.40 GHz     (00:00:50.4 sec.)   [1827331 pps.]   PowX= 5.693
AMD Athlon XP 1800+ 1524 MHz  (00:00:51.4 sec.)   [1791780 pps.]   PowX= 5.582
AMD Duron 1.30 GHz            (00:00:54.0 sec.)   [1705509 pps.]   PowX= 5.313
Pentium 4 CPU 2.00 GHz        (00:00:55.7 sec.)   [1653456 pps.]   PowX= 5.151
AMD MobileXP 2600+ 2.13 GHz   (00:00:55.7 sec.)   [1653456 pps.]   PowX= 5.151
Dual Pentium 4 CPU 2.80 GHz   (00:00:57.7 sec.)   [1596144 pps.]   PowX= 4.972
Intel Celeron CPU 1.80 GHz    (00:00:58.2 sec.)   [1582431 pps.]   PowX= 4.930
Pentium 4 CPU 1.80 GHz        (00:00:58.3 sec.)   [1579717 pps.]   PowX= 4.921
Intel Celeron CPU 1.30 GHz    (00:00:59.6 sec.)   [1545260 pps.]   PowX= 4.814
Celeron 2000 MHz, Maxdata     (00:01:01.8 sec.)   [1490251 pps.]   PowX= 4.643
Pentium 4 CPU 1.70 GHz        (00:01:02.0 sec.)   [1485443 pps.]   PowX= 4.628
Intel Celeron CPU 1.70 GHz    (00:01:02.3 sec.)   [1478290 pps.]   PowX= 4.605
Pentiun 4 CPU 1.80 GHz        (00:01:03.5 sec.)   [1450354 pps.]   PowX= 4.518
Intel Celeron CPU 1.70 GHz    (00:01:04.4 sec.)   [1430085 pps.]   PowX= 4.455
Intel Celeron CPU 1.20 GHz    (00:01:05.0 sec.)   [1416884 pps.]   PowX= 4.414
AMD Athlon 1202 MHz           (00:01:06.9 sec.)   [1376644 pps.]   PowX= 4.289
AMD Duron Morgan 1.0 GHz      (00:01:11.0 sec.)   [1297148 pps.]   PowX= 4.041
Pentium III 933 MHz           (00:01:23.0 sec.)   [1112163 pps.]   PowX= 3.481
GenuineIntel 928 MHz          (00:01:23.4 sec.)   [1104286 pps.]   PowX= 3.440
AMD Athlon 1001 MHz           (00:01:26.2 sec.)   [1068416 pps.]   PowX= 3.328
Pentium III 900 MHz           (00:01:26.6 sec.)   [1063481 pps.]   PowX= 3.313
Dual Pentium III 800 MHz      (00:01:26.6 sec.)   [1063481 pps.]   PowX= 3.313
AMD Athlon 950 MHz            (00:01:26.7 sec.)   [1062255 pps.]   PowX= 3.309
Intel Celeron 900 MHz         (00:01:27.8 sec.)   [1048946 pps.]   PowX= 3.268
AMD Duron 1000 MHz            (00:01:27.9 sec.)   [1047753 pps.]   PowX= 3.264
Dual Pentium III 733 MHz      (00:01:35.0 sec.)   [971679  pps.]   PowX= 3.042
AMD Athlon 700 MHz            (00:01:45.5 sec.)   [907364  pps.]   PowX= 2.826
Pentium III 650 MHz           (00:01:46.2 sec.)   [867208  pps.]   PowX= 2.701
Intel Celeron 633 MHz         (00:01:54.6 sec.)   [803643  pps.]   PowX= 2.503
Pentium III 600 MHz           (00:02:01.0 sec.)   [761136  pps.]   PowX= 2.371
Pentium III 550 MHz           (00:02:17.5 sec.)   [669800  pps.]   PowX= 2.086
Intel Celeron 466 MHz         (00:02:30.0 sec.)   [615396  pps.]   PowX= 1.921
Pentium III 450 MHz           (00:02:45.0 sec.)   [559451  pps.]   PowX= 1.743
Intel Celeron 433 MHz         (00:02:49.8 sec.)   [542388  pps.]   PowX= 1.689
Celeron 400 MHz, Acer Notebook(00:02:56.0 sec.)   [524486  pps.]   PowX= 1.637
AMD-K6 3D 350 MHz             (00:03:23.0 sec.)   [453682  pps.]   PowX= 1.413
Pentium 233 Mhz               (00:03:57.6 sec.)   [387615  pps ]   PowX= 1.207
Pentium II 300 MHz            (00:04:10.8 sec.)   [367214  pps.]   PowX= 1.144
Intel Celeron 266 Mhz         (00:04:30.6 sec.)   [340345  pps.]   PowX= 1.060
Cyrix x686 200 MHz            (00:04:47.6 sec.)   [320965  pps.]   PowX= 1.000
Pentium  100 MHz              (00:04:57.4 sec.)   [309675  pps.]   PowX= 0.964
Pentium  75 MHz               (00:05:00.0 sec.)   [306991  pps.]   PowX= 0.956
Intel 80486 33 MHz            (00:05:59.8 sec.)   [255968  pps.]   PowX= 0.797

18.04.06
Technologie - 64bit a reverzní HT
64bit CPU and reverse-HT

Dvouprocesorové stroje

Během posledních dvou let jsem několika nadšencům rozmluvil pořízení dvouprocesorového stroje. Argumenty stojí za to zopakovat.
Aby se takový stroj "vyplatil", musíte ho osadit špičkovými procesory s nejvyšší frekvencí, kde je cena neodpovídající zvýšení výkonu.
Dále potřebný mainboard je několikanásobně dražší, než normální jednoprocesorový.
A jaký je výsledek?
Šachové programy se nezrychlí dvakrát, jak by se mohlo zdát. Práci je totiž potřeba mezi ty procesory rozdělit, například je podělit tahy, který bude každý zpracovávat.
A když se netrefíte (to byste předem museli znát sílu těch tahů..), tak je jeden procesor hotov a čeká na druhý.
U nejlepších Deep-verzí je nárůst 20, nejvýš snad 30 procent výkonu místo 100 procent.
Pointa: Během tří měsíců se frekvence nejvyššího procesoru o těch 30 procent zvýší taky je to vyhozených dvacet tisíc.

64bitové stroje

64bitové stroje, to je jiné kafe. Michael Koppel uvádí výsledky svých měření

               32 bit 64 bit Faktor
Zappa 1.1       385   619   1,61
Rybka 1.1       80    127   1,59
Naum 1.9i       829   954   1,15
Glaurung 1.0.2  432   450   1,04
Scorpio 1.7     834   816   0,98

Dobře napsaný 64bitový program se zrychlí zhruba o 60 procent.
Nigel Robson hlásí zrychlení Zap!Chess 64bit o 75 procent!

Co to obnáší?
Především musíte mít 64bitový procesor. AMD i Intel už mají 64bitovou většinu produkce, dokonce i nové Celerony.
K tomu 64bitová Windows. Ty už jsou také celkem běžně, ale ne v české verzi http://e-shop.asbis.cz/default.asp?cls=spresenttrees&strid=326567  

Taková investice je mnohem rozumnější, než dvouprocesorový stroj.

Reverzní HT?

HT - hyperthreading je pokus nahradit dvouprocesorové stroje jedním čipem, kde jsou dva procesory jakoby uvnitř.
Náhrada to není dokonalá, protože se procesory musí "odpojovat od nožiček" a to jsou další čekací časy.
Testy HT a Deep verze šachových programů končily vždy rozpačitě, vysvětlení najdete o něco výš.

Nyní se objevuje zcela nový pojem, AMD vymýšlí něco jako reverzní-HT neboli anti-HT.
V principu by mělo víc procesorů napodobit jeden rychlejší tím, že by si samy rozebraly kód a zpracovávaly by ho paralelně.
http://www.cdr.cz/a/novinky/starsi/885  (článek AMD asi kutí „HyperThreading naruby“)
Názory se různí, jsou i takoví, kteří to považují za kachnu a nesmysl.
Rozhodně něco podobného funguje v každém procesoru od 486, které mají více CPU a snaží se o spekulativní výpočet kódu dopředu.
No a použití na šachovou hru? I kdyby to začalo fungovat, tak rozdělit šachový propočet automaticky lépe,
než to dokázali programátoři v Deep verzích, se zdá být prakticky nemožné.


12.08.06
Procesory Core 2 Duo

Core2Duo je nová řada procesorů od Intelu, která málo hřeje a má super výkon.
Celá větev Pentium 4, vyvinutá v USA, nebyla příliš vydařená. Výpočetní výkon nesplnil očekávání, zato to ale s rezervou vynahradil výkon teplotní..
Izraelská pobočka Intelu se proto před časem vrátila k vydařenému jádru Pentium III a začala znovu.
Výsledkem byly skvělé mobilní řady jako například známé Centrino. Ty byly tak dobré, že nakonec celou koncepci P4 v podstatě zahodili a má ji nahradit nové jádro Core 2 Duo. K němu patří nové základní desky s čipsetem 965.
S nákupem je třeba ale ještě trochu počkat, než se vychytají mouchy a klesnou dost vysoké ceny.

První malý šachový benchmark uvádí "Jean-Paul" http://216.25.93.108/forum/viewtopic.php?topic_view=threads&p=43436&t=5651

Arena + TogaII 1.2.1, FEN: 8/8/4B3/8/8/3K4/p2p4/kN1N4 w - - 0 5, mate in 3

1.Core 2 Duo E6600 at 3.6Ghz (+M13) Depth 20 in 00m37s!!
2.Core 2 Duo E6300 at 2.94Ghz (+M13) Depth 20 in 00m44s
3.Core 2 Duo E6700 (+M13) Depth 20 in 00m51s
4. AMD 4000+ (San Diego) at 2.80 GHz,2GB (+M13) Depth 20 in 00m57s
5.Opteron 165 at 2.8ghz+2GB (+M13) Depth 20 in 00m59s
6.AMD 3400+ Newcastle at 2.6Ghz,1GB (+M13) Depth 20 in 01m03s
7.XPS M1210,Core 2 Duo T7400 2.16ghz Merom ES, 2GB (+M13) Depth 20 in 01m05s (was only on 1Ghz)
8. Pentium-M(dothan) @2.4ghz 1gb ram (+M13) Depth 20 in 01m10s
9.Dell XPS Gen2 laptop 2.26 Pentium M + 1.256Gb (+M13) Depth 21 in 01m15s
10.Amd 3400+ Newcastle at 2.4Ghz,512Mb (+M13) Depth 20 in 01m22s (65Mb HT)
11.Pentimum 4 3.0e (presscott) Overclocked @ 3.679Ghz (+M13) Depth 20 in 01m33s
12. Athlon 64 3000+ Newcastle @ 2.4Ghz (+M13) Depth 21 in 02m56s
13.Amd t-bird 1.2ghz (+M13) Depth 21 in 04m18s
14.AMD ML-30 512mb (+M13) Depth 21 in 07m53s


22.09.06
Plaťte za MHz -  update

Na několik dotazů jsem updatoval článek plaťte za MHz ze začátku této rubriky.
Originál byl ze začátku roku 2001, kdy byla nabídka CPU relativně jednoduchá a průhledná.
Dnes platí úměrnost frekvence a rychlosti v principu také, ale jen mezi stejnými řadami procesorů.

Ono se totiž ukázalo, že zvyšovat frekvenci je stále obtížnější (přehřívání) a tak se rychlost zvyšuje také vnitřní optimalizací.
Přepočty mezi různými řadami jsou v dokumentaci a specifikacích výrobců.
Pár nejdůležitějších případů.

1. Procesory Intel Pentium 3/4 a příslušné Celerony jsou základem, kde úměrnost v principu platí.
Pentium 4 se od Celeronu liší (kromě několika tisíc korun ceny) vyšší vnitřní keší.
V některých datově náročných programech (převody videa) je nárůst výkonu markantní.
Ale šachové programy mezi ně nepatří a P4 proti Celeronu nepředstavuje velký pokrok.

2. Procesory AMD mají vlastní přepočet, který je ale přímo v názvu.
Například  Athlon64 3200+/2.0 GHz doslova říká, že procesor firmy AMD běží na 2GHz,
ale vylepšená vnitřní struktura mu dává výkon srovnatelný s klasickým Intelem 3,2 GHz (to plus znamená ještě trochu víc..).

3. Mobilní Intely a Core2Duo
U mobilních procesorů Intel z notebooků (např. Centrino) je dávno znám experimentální odhad, kdy se frekvence násobí skoro 2x.
Koneckonců Intel nedávno konečně přiznal to, co se dlouho vědělo, že totiž celá větev Pentium 4 je nepovedená cesta.
P4 jsou minulostí, na základě mobilního jádra byla vyvinuta i pro stolní PC řada Core2Duo, chladná a rychlá.
Zde platí 2x také pro neDeep programy.

Tyto odhady můžete zhruba ověřit na výše uvedeném článku o Axon benchmarcích.

64 bitový program běžící na Windows XP 64 bit běží skoro dvakrát tak rychle, je-li dobře napsán.
Chystám se k otestování Deep programů na Core2Duo.


7.1.2007
Konec P4

Asi jste si všimli, že v letošním roce skončila existence Pentia 4. Slavné jméno, které nás provázelo řadu let společně s notoricky známým logem Intel Inside.
Bývá zvykem, že vývoj se odvíjí od produktu k produktu, Pentium 4 však takto nekončí. Letos se ukázalo, že celá jeho technologie Netbusrt je vlastně zcela slepou vývojovou větví.
Někteří zasvěcení ví, že současné Core je spíše inspirováno Pentiem 3, stejně jako v době existence Pentia 4 mobilní procesory Pentium M.
Pentium 4 a celou Netburst technologii tak lze zařadit jako jeden z největších technických omylů vůbec.

http://technet.idnes.cz/nejvetsi-technologicke-propadaky-roku-2006-f1u-/hardware.asp?c=A070102_124420_hardware_NYV


6.6.2007
64 bitové motory - souhrnná informace

Aspekty

1. Hardware
Je nutný novější procesor s 64 bitovým rozšířením.

AMD má rozšíření jménem AMD64, které drží prvenství
U Intelu se jmenuje EMT64 a od jara 2006 ho mají většinou i levné Celerony. V poslední době se mluví o Intel64.
Jsou prakticky kompatibilní.

2. OS Windows
Pro spouštění 64 bitových aplikací je nutný 64 bitový operační systém.

32 bitový systém (Windows XP Pro, Vista) 64 bitový systém (Windows XP Pro 64, Vista 64)
32 bitové aplikace 32 bitové aplikace i 64 bitové aplikace

Pod 64 bitovým OS tedy spustíme vše.
Proč se tedy nedodává a neinstaluje standardně?
Protože (hlavně XP Pro 64) je to pořád tak trochu bastl.
Chybí některé ovladače (nerozběhnete webové kamery, TV karty a jinou exotiku, zejména neznačkovou) a taky velmi dlouho chyběly nástroje na hlubší proniknutí do systému, zejména antiviry.
To už se zdá být pomalu překonáno.
Proto se 64 bitový systém často používá na pokusy a na PC se ponechává i 32 bitový na práci - systém s dvojím bootováním.

3. Rychlost 64 bit aplikací
Výrazné zrychlení není automaticky garantováno!

Někteří programátoři se domnívali, že když mají motor třeba v C++, tak stačí zakoupit nový překladač, zvolit parametr /64 a je vyřešeno.
Někdy bohužel není.

Marc Uniacke dal bezelstně v 10/2006 k testování svého Hiarcse X54 UCI/64bit, ale od té doby další 64bitová verze nebyla. Naměřili mu totiž zrychlení 2.5 procenta.
Tutéž chybu udělala ChessBase s lehce předraženým DeepFritzem 10. Vedle multiprocesorů byl ohlášen i běh na 64bitech. Ale problém asi zjistili sami, dokonce natolik včas, že mohli začít mlžit a nakonec se zdálo, že ani žádnou 64bitovou verzi neslibovali. Vysoká cena ovšem zůstala.

Záleží na vnitřní stavbě programu. Pokud je reprezentace šachovnice klasická matice 8x8 (nebo 10x8) v bajtech, pak je věc skoro ztracená. Tahy se totiž provádějí většinou přičítáním/odčítáním, kde 64bitová aritmetika nemá skoro žádný význam.
Chytřejší autoři modernějších programů použili tzv. bitboardovou reprezentaci, kdy šachovnice je modelována řadou 64 bitových masek. Například jedna pro bílé pěšce, druhá pro černé atd.
Tahy a testy se provádějí logickými operacemi nad těmito maskami. Ty se ale na 64bitovém stroji provádějí najednou, takže důležité opakované sekvence generování tahů běží dvakrát rychleji.
Skvělá je především Rybka a Zap!Chess, běžící o 30-40 procent rychleji.

4. GUI a motor

V tomto bodě panuje nejvíc pověr a mýtů. Ve skutečnosti se věc liší podle typu motoru.
UCI motor je samostatná nezávislá konzolová EXE aplikace, komunikující s GUI textovými příkazy přes rouru standardního vstupu a výstupu. Koneckonců můžete si ho spustit a ovládat z příkazové řádky, což je nejjednodušší šachové GUI.
ChessBase nativní motor ENG je přejmenovaná dynamicky linkovaná knihovna DLL, tedy v principu součást GUI.

U 32bitových aplikací měly CB nativní navrch právě díky užšímu výkonově vyladěnému propojení.
V době náběhu 64bitů se ovšem karta obrací.
Kdo četl pozorně bod 2. už mu asi svítá.

64 bitový UCI motor lze bez problémů spustit z 32 bitového GUI, např. Arény, Fritze, CB9.
64 bitový CB nativní motor vyžaduje naopak i 64 bitové GUI.

Po pravdě řečeno, 64 bitový CBnativní existuje jen jeden - Zap!Chess z dubna 2006 nedávno oslavil roční výročí.
Na DVD se k němu dodávala experimentální 64bitová verze Fritz GUI takové kvality, že na 3 počítačích ze 4 nešla vůbec spustit.
Service Pack to sice spravil, ale od té doby na to v Hamburku kašlou. Žádný nový 64 bitový program zatím není na obzoru.


07.08.2007
Quad a Xeon

Dostal jsem četné dotazy na téma PC s  quadem a osmi jádry.

1. Chcete-li počítač se 4 jádry, pak jsou výhodnější normální Quady (rozmezí 6600, 2.4GHz,  6000Kč -- 6800, 2.93 GHz, 22.000 Kč).
Jednak jsou levnější samy o sobě a jednak stačí základní deska za normální cenu.

2. Chcete-li počítač s 8 jádry, pak si ale Intel dobře pohlídal,  aby se musela použít serverová technologie, která je výrazně dražší.
Procesor musejí být Xeony (rozmezí 5310, 1.6GHz, 5.500Kč -- 5355, 2.66GHz, 17.000 Kč) a také základní deska, zdroj a bedna vyjdou řádově třikrát dráž, než u obyčejného PC.

http://www.tecchannel.de/server/prozessoren/455565/index.html   příklad 8 jádrového stroje
http://www.intel.com/design/servers/boards/s5000PSL/index.htm  základní deska Intel S5000PSL


22.10.2007
Hloubka propočtu a ELO
Plies and ELO

Gerhard Sonnabend (Loop-Support)


Loop vs Loop

Tiefe  Tiefe  Ergebnis                    Elo-Diff.   Zeitverbrauch
     vs                                 (lt. ELO-Stat)   (Faktor)
...................................................................
6  vs  5      107.0 - 33.0  (+90 =34 -16)   +204          n/a
-------------------------------------------------------------------
7  vs  6      106.5 - 33.5  (+85 =43 -12)   +201          n/a
-------------------------------------------------------------------
8  vs  7       99.5 - 40.5  (+75 =49 -16)   +156         2.292
-------------------------------------------------------------------
9  vs  8      101.0 - 39.0  (+77 =48 -15)   +165         2.300
-------------------------------------------------------------------
10 vs  9       96.5 - 43.5  (+61 =71 -08)   +138         2.288
-------------------------------------------------------------------
11 vs 10       97.5 - 42.5  (+69 =57 -14)   +144         2.310
-------------------------------------------------------------------
12 vs 11       90.0 - 50.0  (+54 =72 -14)   +102         2.256
-------------------------------------------------------------------

Rybka vs Rybka

Tiefe  Tiefe  Ergebnis                    Elo-Diff.   Zeitverbrauch
     vs                                 (lt. ELO-Stat)   (Faktor)
...................................................................
6  vs  5      107.0 - 33.0  (+84 =46 -10)   +204         1.740
-------------------------------------------------------------------
7  vs  6       99.0 - 41.0  (+72 =54 -14)   +153         1.900
-------------------------------------------------------------------
8  vs  7      100.5 - 39.5  (+71 =59 -10)   +162         1.853
-------------------------------------------------------------------
9  vs  8       91.5 - 48.5  (+59 =65 -16)   +110         1.770
-------------------------------------------------------------------

22.10.2007
Velikost hash tabulek a kN/s
Hash tables size and kN/s

Otázka na optimální velikost hash tabulek je jedna z nejčastějších.
Je fakt, že kdyby věc byla evidentní a existoval matematický vzorec nebo kdyby to bylo maximum možné, tak by se motory prostě nastavovaly samy.
Ale neznám žádný, který by tak činil.

Dá se pozorovat, že se vzrůstající velikostí hash tabulek klesá rychlost propočtu v kN/s.
Názorně to lze předvést ve Fritz 7, jehož FritzMark je spojen se zavedeným motorem a reaguje na změny nastavené hash velikosti.
Dostanete třeba toto (Core2Duo 6320 with 1G RAM)

32M 1380 kN/s
256M 1334 kN/s
512M 1274 kN/s
789M 1257 kN/s

Pozor! Fritz9/10Mark už je samostatný program, který má svou hash a na změnu hash zavedeného motoru nijak nereaguje.

Proč vlastně rychlost klesá?
Především z principu hash tabulek by klesat neměla. Hash číslo, odvozené "semletím" (hashováním) pozice totiž svou částí slouží k přímému adresování hash tabulek, což závislost vylučuje. Hlavní příčinou shora uvedeného stavu je pravděpodobně vnitřní paměťová cache procesoru, která je až 3x rychlejší než RAM. No a pro malé hash tabulky se to celé odehraje v cachi, zatímco pro větší se musí swapovat do hlavní RAM. Něco podobného, jak swapování RAM na harddisk, když přeženete velikost hash tabulek. Ale to je dobře známo.

A protože cache u jednotlivých procesorů se liší velikostí, stupni, strategiemi plnění, je výše popsaný jev těžko nějak exaktně postižitelný.
A konečně k tomu přispívá fakt, že v některých pozicích s transpozicemi je pokles kN/s více než bohatě kompenzován hash efektem, v jiných bez transpozic kompenzován není.

1. Searching in bigger hash tables does not technically consume more time.
Actually tables are not searched, but directly addressed with a part of hash code.

2. But regardless a little reduction of kN/s is observed in praxis. The main reason is probably CPU cache swapping to main RAM in bigger hash tables size.

3. Fritz7Mark is connected with loaded engine and his hash table size,
so it can be used to demonstration of reduction of kN/s with increased hash size.

Fritz 7 (2001) it can be observed in FritzMark.
On Core2Duo 6320 with 1G RAM I have the following values

32M 1380 kN/s
256M 1334 kN/s
512M 1274 kN/s
789M 1257 kN/s

Contrariwise Fritz9/10Mark is a standalone program with his own hash tables and it is not connected with loaded engine.

Thanks to Tord Romstad (Glarung),  Ernest Bonnem (Fr), Gerd Isenberg (Isichess).

http://f23.parsimony.net/forum50826/messages/174247.htm


02.12.07
Fritz benchmarky
Fritz benchmarks

Fritz benchmarky na špičkovém hardwaru v čele se 32CPU serverem HP.

Fritz benchmarks on top hardware ahead of 32CPU HP server.

http://www.jens.tauchclub-krems.at/diverses/Schach/fritz9_benchmarks.html


10.02.08
Deep Fritz benchmarky na Tom's hw
Deep Fritz benchmarks on Tom's hw

http://www.tomshardware.com/2008/02/08/intel_skulltrail_part_3/page14.html


10.02.08
Co běží pod 64 bity
What runs in Win64

http://f23.parsimony.net/forum50826/messages/178401.htm


30.03.2008
Síla Deep verze
Strength of Deep version

Vyplatí se investovat téměř dvojnásobnou částku do  DeepHiarcs 12.

První zprávy hovořily o jakémsi 60 procentním zrychlení na 8 jádrech, což mi připadalo reálné.
Ale autor měl zřejmě na mysli, že o 60 procent zlepšil efektivnost deep algoritmu proti předchozí verzi.

Na http://www.hiarcs.com/pcuci_faq.htm#strongerMP  uvádí pro Deep Hiarcs 12 skvělé hodnoty.

Na dvou jádrech (Core2Duo) účinnost 1.8, což odpovídá ELO +50.
Na čtyř jádrech  (Quad) účinnost 3.0, což odpovídá ELO +90.
Na osmi jádrech  účinnost 6.0, což odpovádá ELO +130.

Pokud se to v praxi potvrdí, je to ve světě MP motorů opravdu bomba.

Děkuji Ivanu Cibiri za rychlé upozornění.


09.04.08
Hiarcs 12 MP efektivita

Po řadě rozpačitých dřívějších pokusů s Deep a MP verzemi jsem opět po delší době zkusil měření.
Místo hyperthreadingu jsem použil plnohodnotné dva thready  s Core2Duo 6320, 1G RAM.
Jako motor jsem vzal zbrusu nový Hiarcs 12 UCI MP, který má předběžnou pověst velmi účinného "využívače" více jader.
Testoval jsem pod Win XP Pro, Fritz 11 GUI, 128M hash.
Mezi testy samozřejmě vymazány hash tabulky a také samoučící soubor hiarcs12mp.lrn, který se v nové verzi netvoří u motoru, ale v adresáři Documents and Settings/<jméno>/Data aplikací/Hiarcs Chess.

K testování jsem vybral dvě pozice, kde motor potřebuje k nalezení řešení desítky vteřin. Méně by vneslo systematickou chybu, delší časy nic moc nepřinášejí a zbytečně prodlužují testování.








5rk1/1r1qbnnp/R2p2p1/1p1Pp3/1Pp1P1N1/2P1B1NP/5QP1/5R1K w - - 0 1

1. Dxf7, vyřešeno je-li indikováno s hodnocením >3.00
 








r1bn1rk1/pp3p1p/6p1/2bR2N1/2B2B2/q1P1P3/2Q2PPP/4K2R w K - 0 1

1.Jxh7, vyřešeno při indikaci s hodnocením >2.00
 

2 thready cca 600kN/s 1 thread cca 300 kN/s 2 thready cca 600kN/s 1 thread cca 300 kN/s
sec sec sec sec
15 21 26 16
14 21 16 16
12 21 11 16
12 21 37 16
12 21 16 16
14 21 15 16
15 21 11 16
11 21 13 16
15 21 28 16
27 21 12 16

průměr 10 měření 14,7 sec

průměr 10 měření  21 sec průměr 10 měření  18,5 sec průměr 10 měření  16 sec!

Závěry

1. Jednoprocesorový Hiarcs analyzuje "čistě", výsledky jsou téměř stoprocentně reprodukovatelné v každém průchodu.

2. DeepHiarcs naopak zřejmě využívá při rozdělování práce do značné míry náhodné veličiny, protože výsledky i u jedné pozice kolísají.
Od skvělých časů s téměř teoreticky maximálním urychlením (11/21 sekund) až po výsledek horší než u single verze.

3. Velmi kolísá i statistický výsledek od pozice k pozici.
Charakter obou pozic vypadá dost podobný, ale výsledek se přesto diametrálně liší.
Zatímco v první pozici snadno opakovaně prokážete růst výkonnosti až o 40 procent, ve druhé pozici použití dvou jader očividně spíš škodí.

Měření efektivity proto není možné provést za pár hodin otestováním desítek pozic.
Skutečná hodnota by musela být určena měřením stovek až tisíců pozic a ještě lépe sehráním velkého množství partií.


08.09.09
Efektivita 2 a 4 jader 2009
Efficiency of 2 and 4 threads  2009

Nová aktuální data 2009.
Zdroj CEGT Blitz 40/4 2GHz http://www.husvankempen.de/nunn/blitz.htm

Engine

1CPU

2CPU

4CPU

Dif1-2

Dif2-4

Dif1-4

Rybka 3.0x64

3112

3154

3196

42

42

84

Naum 4.0 x64

n/a

3057

3095

n/a

38

n/a

Deep Frifz 11

2938

2975

3024

37

49

86

Slockfish 1.4 x64

2902

2936

3006

34

70

104

Zappa MX II x64

2911

2958

3023

47

65

112

Hiarcs 12.1

2841

2913

2972

72

59

131

Shredder WM Bonn

2912

2948

3011

36

63

99

Deep Sjeng 3.0 x64

2861

2911

2959

50

48

98

Bright 0.4a

2819

2877

2926

58

49

107

Loop M1

2817

2857

2886

40

29

69

average

2901

2959

3010

46

51

99


06.06.10
FireMark

Je mnoho rychlostních testů procesorů, tzv benchmarků.
Pro odhad výkonu šachových programů je samozřejmě nejvěrohodnější test, který je založen na šachovém propočtu.
Dlouholetou klasikou je FritzMark, ale ten bohužel neumí detekovat víc než 8 jader, což v poslední době vadí.
Zajímavou náhradou je motor Fire. Následuje návod k použití.

There are a lot of CPU benchmarks.
But for estimation of  chess programs'  performance we need benchmarks based on chess computing.
FritzMark is a long years classic, but unfortunately it doesn't recognize more then 8 threads. Last time it is a serious problem.
The interesting new benchmark tool is the Fire engine.
How to use it?

1. Run Fire

Free download http://www.chesslogik.com/Fire.htm 
On 64bit systems run the 64bit Fire.

 You can immediately see the number of threads include hyperthreading ones.

2. Enter the command

The number is running time, here 50 second is entered.
Press ENTER.

3. The result


After the given time the benchmark 1935 kN/s is indicated.