Šachy a procesory
|
Velký test CPU/Big CPU test - BS2001 na TBirdech - P4 nebo TBird? - Ještě o růstu síly s MHz/Another ELO/MHz test - Burchamovy benchmarky /Burcham's benchmarks - Rychlé procesory 02/2002 - Intel vs AMD - Novinky CPU 08/2002 - Procesory 2003 - CPUs 2003/04 - Přehled procesorů pro stolní a mobilní počítače - Jak bude vypadat PC v roce 2004 - Centrino - Hyperthreading - Axon CPU test - 64 bit and reverse HT - Core2Duo - 64bit - 8 jader - Plies and ELO - Hash tables size and kN/s - Fritz benchmarks - Fritz benchmarks om Tom's hw - What runs under 64 bits - DeepHiarcs12 - Efektivita H12 - Efektivita 2 a 4 jader - FireMark
Pan Liebert
provedl velké srovnávací měření, jak se chovají moderní
šachové programy na moderních procesorech.
Potvrdila se známá věc, že rychlost programu je podstatně
(prakticky lineárně) závislá na taktování -
to je číslo udávané v MHz. Naopak závislost na
jednotlivých typech procesorů je minimální a při
stejném taktování málokdy činí víc než 10 procent výkonu.
Navíc se jednotlivé programy liší v tom, na kterém čipu
běží rychleji.
Klasický
výrobce Intel dodává nyní standardní plný
typ Pentium III s vysokým výkonem, ale
značnou cenou.
Jako odlehčená alternativa je populární Celeron
s malou keší, který však výkonem v obecných aplikacích
značně zaostává.
V testu není zahrnuto pro šachy absolutně nevhodné Pentium
II. Bylo cenově srovnatelné s Pentiem III a přitom
vzhledem k pomalé keši na něm šachové programy běžely
často pomaleji, než na Celeronu.
V testu také chybí Pentium 4 - příliš nový
a drahý čip! Navíc se proslýchá, že půjde o slepou větev
vývoje stejně jako svého času Pentium Pro.
Výrobce
levných a výkonných napodobenin už od modelů 486.
V testu je pro zajímavost zařazena poslední verze odvozená z
Pentia - K6/3.
V testu chybí modely K7, které jsou málo
perspektivní a přitom dražší než Durony.
Vlajkovou lodí je nyní plný procesor Athlon,
kterým poprvé v historii na čas předběhl AMD Intel ve
výkonu procesoru.
Velmi zajímavý je odlehčený typ Duron. Na
rozdíl od slabého Celeronu se jeho výkon od Athlonu až tak
neliší.
Procesory AMD nejsou vždy stoprocentně kompatibilní a s
některými programy mohou být potíže. Když přišly před
časem rychlé K6/2, od 400 MHz přestávaly fungovat Windows95,
což byla vada dosti podstatná a samozřejmě se rychle
vyřešila záplatou do Windows. Nyní se zase proslýchá, že
velké potíže jsou s Windows Me, které často tuhnou ("Modrá
smrt"). Microsoft zatím svou vinu popírá.
Pro každý
program a procesor bylo změřeno několik šachových testů a
při nich stanovena průměrná rychlost programu v počtu pozic
za sekundu. Tento ukazatel byl ještě přepočítán na
jednotnou frekvenci, protože stejně taktované stroje nebyly k
dispozici. V tabulce je uvedena relativní rychlost propočtu
programu, jako základ 100 byl vždy brán Celeron. Vítězové
jsou vyznačeni žlutě, K6/3 mimo soutěž.
V posledním řádku je pro zajímavost uvedena cena procesoru
750MHz bez DPH, platná začátkem roku 2001.
software/procesor | AMD K6/3 | Celeron | Pentium III | Duron | Athlon |
DeepFritz | 93 | 100 | 108 | 92 | 99 |
Hiarcs 7.32 | 110 | 100 | 113 | 103 | 110 |
Nimzo 8 | 132 | 100 | 109 | 103 | 108 |
Junior 6a | 110 | 100 | 103 | 103 | 105 |
Gandalf 4.32h | 136 | 100 | 139 | 125 | 130 |
Goliath Light 2 | 147 | 100 | 119 | 117 | 135 |
Shredder 5 | 120 | 100 | 106 | 99 | 103 |
Gambit Tiger | 113 | 100 | 104 | 98 | 103 |
750 MHz Price/Kč | 2500 (550MHz) | 5000 | 8000 | 3000 | 4500 |
Staré procesory
nejsou špatné - dost překvapuje vynikající výsledek K6/3,
založený ještě z velké části na klasickém jádru Pentia.
Bohužel jeho taktování končí někde na 550 MHz, což je pro
modernizaci nebo nový stroj příliš málo.
Pokud nebudete hledět na cenu, nejlepším řešením je čisté
Pentium III, které u většiny programů dá při stejném taktu
o něco vyšší výkon.
Na cenu ale hledět jistě budete. Proto při koupi šachového
PC z poměru MHz/Kč suverénně vítězí Duron společnosti AMD.
Rozdíly v rychlosti jsou nepatrné. Je ověřeno, že moderní
šachové programy pod Windows98 SE nemají s AMD žádné
potíže.
Má-li však být počítač nasazen i jinak, celá věc
přestává být jednoduchá. Na "AMD-éčkách" mají
totiž potíže některé jiné programy, údajně dokonce i
Windows Me.
In the table are
relative speeds (Celeron = 100) of some important chess programs
in a small chess benchmark.
The speed is very low depended on the CPU type, even the old AMD
K6 would be very good, but it ends on 550 MHz. But the speed is
very depended on frequency, so pay for MHz and not for CPU type.
Unfortunately AMDs Duron, Athlon are not very compatible,
especially I have to strongly warn for AMD/WinME combination.
Autor testu
bohužel nevěnuje pozornost takzvanému čipsetu, který je dnes
(vedle procesoru) klíčovým prvkem základní desky a při
vyrovnaném výkonu procesorů často rozhoduje o rychlosti
počítače. Mimo jiné má na starost komunikaci procesoru s
pamětmi, diskem a grafickou kartou.
Rozdíly ve výkonu mezi špičkovým čipsetem (klasický Intel
BX nebo moderní Intel 815E) a některými levnějšími typy
společností ALI nebo VIA může být až 10 procent, což je v
řádové shodě s naměřenými rozdíly rychlostí. To by tedy
mohlo ještě trochu výsledky zamíchat. Hlavní závěr o
malém vlivu výrobce a typu procesoru však bezesporu platí.
září/september 2001
Silný český korespondenční šachista měnil nedávno hardware z velmi slušného AMD T-Bird 800 MHz na špičkové AMD T-Bird 1.4GHz. Při této příležitosti provedl testy BS2001, zajímavé hned dvojnásobně. Jednak ukazují sílu (a vyrovnanost) současné absolutní špičky a jednak vypovídají o tom, kolik ELO bodů můžete za těch Kč 17.000+ získat.
A strong czech correspondence player updated his hardware and he made a small interesting test.
T-Bird 800MHz | T-Bird 1400 MHz | plus | celkem total | |||
Nimzo 8 | 2612 | 11 | 2641 | 13 | 29 | 2626.5 |
Junior 7 | 2610 | 12 | 2643 | 14 | 33 | 2626.5 |
Shredder 5.32 | 2600 | 10 | 2645 | 12 | 45 | 2622.5 |
Gambit Tiger 2 | 2575 | 9 | 2649 | 14 | 74 | 2612 |
Hiarcs 7.32 | 2600 | 11 | 2613 | 11 | 13 | 2606.5 |
Fritz 6 | 2570 | 8 | 2614 | 11 | 44 | 2592 |
Tiger 14 | 2575 | 9 | 2600 | 10 | 25 | 2587.5 |
Vedle ELA je vždy uveden počet
vyřešených úloh.
ELO und number of solved position are given.
Dnešní špička je neobyčejně vyrovnaná a velmi záleží na použití programu.
Třeba Nimzo 8, o kterém se na základě hraných partií tvrdí, že se vyloženě nepovedl. Při analýze nezvyklých pozic korespondenčního šachu a studií však může prokázat větší službu než turnajová hvězda Fritz, který skončil na chvostu tabulky. Není také vyloučeno, že při volbě jiných pozic by se pořadí zamíchalo. První místo dělil také nový Junior 7 a potvrdil tak dobou pověst mezi korespondenčními šachisty, o které byla několikrát řeč v Novinkách. Z vlastní zkušenosti však mohu potvrdit, že na koncovky se Junior ale vyloženě nehodí.
Today's top programs are very level-headed. It depens on using. For example Nimzo 8 not considered as successful tournament version has excellent analytical ability and here he placed as first.
Docela překvapilo, jak velmi kolísá u jednotlivých programů efekt nového procesoru. U Hiarcsu s +13 je skoro zanedbatelný, neuvěřitelně zato vylétl GambitTiger s +74. Průměrný vzrůst síly je 37.5 bodu. Důležitým koeficientem je přírůstek ELA při zdvojnásobení rychlosti.
There are surprisingly big differences in using increased CPU power. Hiarcs only +13 and in contrast GambiTiger +74. Average growing is 37.5. The important koeficient gives an ELO increment for doubled frequency.
ELO2 = ELO1 + K * log2 (MHz2/MHz1) => K = 37.5 / log2 (1400/800) = 46.5
Zatímco u klasických programů dobře platilo "zlaté" číslo 100, dnes ve špičkové oblasti je pravdou spíš 50 než 70, jak se často udává.
A classical "gold" rule (doubled MHz = +100 ELO) should be today changed to around a half.
Aktuální FritzMarky pro v současné době špičkové procesory obou konkurenčních výrobců zaslalo několik diskutujících na CCC fórum, zde krátké shrnutí. V prvním sloupci je nejlevnější z nové řady "opravdových" Pentií 4. TBird v posledním sloupci je 1.4GHz přetaktovaný o necelých 10 procent.
There are FritzMarks from different sources. The last row is Price (1 USD=37 Kč).
FMark | Intel P4 1.5 GHz |
Intel P4 2GHz |
AMDTBird 1.4GHz |
AMDTBird 1.533 |
AMDTBird 1.6 |
AMD XP 1800+ | ||||||
hash Mb | FMark | kN/s | FMark | kN/s | FMark | kN/s | FMark | kN/s | FMark | kN/s | FMark | kN/s |
16 |
581 |
879 |
808 |
1211 |
890 |
1325 |
925 |
1385 |
||||
32 |
651 |
941 |
837 |
1214 |
913 |
1322 |
950 |
1369 |
||||
64 |
651 |
930 |
837 |
1198 |
913 |
1309 |
937 |
1335 |
1049 | 1493 | ||
128 |
585 |
838 |
890 |
1273 |
890 |
1267 |
1027 | 1523 | ||||
184 |
576 |
824 |
878 |
1250 |
||||||||
256 |
817 |
1170 |
925 | 1326 | ||||||||
512 |
817 |
1170 |
||||||||||
cena/Price CPU Kč |
8.000 | 30.000 | 6.200 | doplním |
Překonáte-li tedy různé nástrahy AMD procesorů jako je chlazení a nekompatibilty, pak na šachy je ThunderBird stále optimální volbou.
A surprise - TBird 1400 is for chess quicker as the famous P4 2GHz. But this is valid only for chess. AMD are bad compatible and you can expect probles with games... And not only games, Windows ME is with TBird unusable. The "blue dead" occured sometimes in a day.
Tabulka také ukazuje, že od
určité velikosti už nemá smysl přidávat další RAM pro
hash tabulky. Pokud Vás tento problém zajímá, podívejte se
CCC fórum. Strhla se tam kolem obrovská diskuse dokonce za
účasti špičkových programátorů, ale jasný závěr jsem z
toho nevypozoroval.
Jsou na vině hash kolize? Je FritzMark špatně naprogramován a
s jinými pozicemi by to tak nedopadlo? Kdo ví.
A big discussions are about hash.
Ještě
o růstu síly s MHz
Another ELO/MHz test
Nová ELO listina SSDF z 10.2001 testovala nejsilnější programy kromě AMD K6 450MHz také na TBirdu 1200 MHz.
The new SSDF rating list gives top programs on 450 and 1200 MHz. This is very good material for calculations and results.
program | AMD TBird 1200 MHz |
AMD K6/2 450 MHz |
Difference |
DeepFritz | 2726 | 2654 | 72 |
Gambit Tiger | 2720 | 2640 | 80 |
ChessTiger | 2703 | 2632 | 71 |
Shredder | 2699 | 2600 | 99 |
Gandalf | 2653 | 2532 | 121 |
průměrně/average | 88.6 |
Výpočet "konstanty
dvojnásobné rychlosti"
The koeficient of doubled speed
ELO2 = ELO1 + K * log2 (MHz2/MHz1) => K = 88.6 / log2 (1200/450) = 63.
Toto číslo je dost vysoké a napomohl mu značně vybočující Gandalf. Bez Gandalfa je průměrný růst jen 80.5 a konstanta 57.
This number is realtive high (compare previsous article). Without Gandalf is difference 80.5 and keficient 57.
Nad touto mou tabulkou se
rozpoutala na CCS fóru živá diskuse. Samozřejmě závisí na
tempu hry, některé programy profitují z výkonu počítače
více a jiné méně. A aby to nebylo tak tak jednoduché,
některým programům sedí více AMD, jiným Intel.
Vaškovi Kotěšovcovi se zase moc nelíbí logaritmická
aproximace závislosti ELA na rychlosti, ale ta se používá
běžně a postupný posuv k oblasi nasycení se kompenzuje
právě koeficientem K, který každý rok trochu klesá.
Tabulce je také vytýkáno, že zanedbává typy procesorů,
vliv RAM a rychlejší disky nových strojů SSDF. Myslím však,
že vliv je velmi malý, jak ukazují předchozí tabulky.
There are discussions about this table. The CPU type, RAM and quicker HDDs are ignored here. But the influence of this factors is very low - see previous tables.
Burchamovy benchmarky /Burcham's benchmark
K. Burcham kburcham@adelphia.net uveřejnil na CCC fóru zajímavé
benchmarky většiny procesorů.
Použil fritzmark Fritz 6a (ten se provádí v motorem 5.32), na
dvouprocesorové DeepJuniora (6), pokaždé 128 M RAM
Dejte mu vědět, pokud se číslo na vešem stroji podtatně
liší.
K. Burcham kburcham@adelphia.net published on CCC forum benchmarks with
most CPUs.
Fritzmark Fritz 6a (with engine 5.32) is used, for multiprosesors
DeepJunior (6), always 128 M RAM
p3 1000 mhz 880 kns
amd 1000 mhz 880 kns
amd 1200 mhz 1050 kns
p4 1700 mhz 1210 kns
amd 1400 mhz 1230 kns
p4 1800 mhz 1250 kns
amd 1533 mhz 1350 kns
p4 1900 mhz 1350 kns
amd 1600 mhz 1400 kns
p4 2000 mhz 1425 kns
2 x 1000 mhz 1600 kns p3 and amd
2 x 1700 mhz 2150 kns xeon
2 x 1533 mhz 2350 kns amd mp
2 x 2000 mhz 2550 kns xeon
2 x 2000 mhz 3000 kns amd mp
Odhad pro 10 mikronové /Estimation for new 10 micron CPUs.
amd 1800 mhz 1580 kns
amd 2000 mhz 1750 kns
amd 2500 mhz 2100 kns
amd 3000 mhz 2600 kns
amd 4000 mhz 3500 kns
Rychlé
procesory 02/2002
Quick CPUs 02/2002
Tabulka uvádí SYSmark2000, Win98SE,
GeForce2, 1024x768x32, který je převzat z www.TECCannel.de .
Ceny jsou v Kč koncové včetně DPH poskytla je firma ABI a KM-Elba.
Komentář dole.
Výrobce | Procesor | Frekvence MHz | Paměť | SysMark |
Cena včetně DPH |
AMD | Athlon XP | 2000+ | PC266 | 291 | 15 200 |
AMD | Athlon XP | 1900+ | PC266 | 278 | 12 000 |
AMD | Athlon XP | 1800+ | PC266 | 271 | 8 650 |
Intel | Pentium 4 | 2200 | PC266 | 250 | 32 200 |
AMD | Athlon XP | 1400 | PC266 | 245 | 6 000 |
Intel | Pentium 4 | 2200 | PC800 | 237 | 32 200 |
Intel | Pentium 4 | 2000A | PC266 | 236 | 19 750 |
Intel | Pentium 4 | 2000 | PC800 | 226 | 19 750 |
Intel | Pentium 4 | 2000A | PC800 | 225 | 19 750 |
Intel | Pentium 4 | 2000 | PC266 | 222 | 19 750 |
Intel | Pentium 4 | 1900 | PC800 | 218 | 14 500 |
Intel | Pentium III Tualatin | 1200 | PC133 | 217 | 10 200 |
Intel | Celeron Tualatin | 1300 | PC133 | 211 | 6 080 |
AMD | Duron | 1200 | PC266 | 204 | 3 900 |
Intel | Pentium 4 | 1800 | PC800 | 200 | 11 570 |
Intel | Pentium 4 | 1700 | PC800 | 193 | 10 540 |
Intel | Pentium 4 | 1600 | PC800 | 187 | 9 370 |
Intel | Pentium 4 | 1500 | PC800 | 181 | 8 700 |
Intel | Pentium III | 1000 | PC800 | 176 | 7 670 |
Intel | Pentium 4 | 1400 | PC800 | 170 | 8 600 |
Intel | Pentium 4 | 1300 | PC800 | 162 | 8 500 |
V poměru cena /výkon jasně vedopu AMDéčka, což není žádné tajemství. Je ale také známo, že jde o čipy spíš pro odborníky, kteří si dovedou poradit s jejich mouchami - přes technické problémy, přehřívání (a s tím spojená hlučnost ventilátorů) až po poměrně časté nekompatibility softwaru. Windows ME je na AMD procesoru prakticky neprovozovatelný a nejlépe je zůstat u Win 987SE. Špičkové šachové programy však běží se zárukou všechny - pokud stavíte speciál na korespondenční šach, nebudete v tom hluku spát a máte dobrého dodavatele, stojí to za úvahu, protože úspora je to značná.
V opačném případě je dobrým tipem zbrusu nová řada Celeronů s jádrem Tualatin a technologií 0.13 mikronů. Pokud byste chtěli tento čip osadit do starší základní desky, třeba místo Celeronu 800 MHz, máte ve většině případů smůlu. Zase se změnilo nějaké napájecí napětí nebo co a musíte měnit i celou základní desku.
Paměti. Nejlevnější jsou klasické SDRAMy, které se nyní značí podle frekvence PC133. Nejdražší RAMBUSy od Intelu (PC800) se zdaleka neprosadily tak, jak výrobce očekával, zejména kvůli vysoké ceně. Proto je dnes nejrozšířenější kompromisní řešení tzv DDRAM, což jsou SDRAM se zvojenou (Double) rychlostí přenosu dat (PC266). Ty v testu Pentia 4 2200 MHz dokonce z nějakého záhadného důvodu lehce předčily RAMBUS. Každá z těchto pamětí vyžaduje patřičnou základní desku, jen některé umožní osadit nebo dokonce kombinovat dva typy.
Velmi zajímavý web, kde hrály šachy dva konkurenční procesory. Po 8 kolech byl pokus uzavřen, výsledky jsou v tabulce.
Závěry:
1. Intel je lepší, jak také odpovídá jeho taktování. Podle
mého by bylo zajímavější nasadit proti AMD 2000+ opravdu
Intel 2GHz.
2. Fritz je výrazněji optimalizován pro Intel, zatímco u
Shreddera je závislost výrazně menší.
3. Shredder je v dané konstalaci trochu lepší než Fritz, což
ovšem nebylo předmětem pokusu.
An interesting web with chess match on Intel vs AMD CPUs. After 8 rounds was this experiment finished, see table.
Results:
1. Intel is better - that's given with frequency. Comapring AMD
2000+ with Intel 2GHz would be more interesting.
2. Fritz is more depended on Intel, Shredder is not enough.
3. Offf topics - Shredder was a little better.
Intel x AMD | AMD 2x Athlon MP 2000+ (reálně kolem 1667 MHz) | ||
Fritz | Shredder | ||
Intel 2x Xeon 2.4 GHz | Fritz | 94 : 80 | 65.5 : 75.5 |
Shredder | 72.5 : 69.5 | 79 : 72 |
http://www.heise.de/ct/schachduell/
Podrobnosti o mainboardech /More about used Mainboards http://www.heise.de/ct/schachduell/kontrahenten.shtml
Novinky
v procesorech 08/2002
CPU news 08/2002
1. Compaq má iPAQy řady 39xx s procesorem XScale PXA250(jádro V5) 400 MHz (místo starého StrongArm 206MHz). Ten kromě vyšší rychlosti má také rozšířenou výkonnou instrukční sadu, které však není využita ani systémem Pocket PC2002, ani Pocket Fritzem. Z důvodu kompatibility. V oboru PC je tento stav dávno znám, například teprve Fritz 7 využil rozšíření instrukční sady MMX, které přinesl už procesor Pentium 166 MHz MMX.
2. Ostatně i výkon nových Pentií 4 je právě vázán s rozšířením instrukční sady SSE2. Vlajková loď P4 2.53 GHz překonává Athlona 2200+ až o 15 procent v Sysmarku2002. Ovšem ten je už optimalizován na SSE2. Použijeme-li starší neoptimalizované programy (a takové jsou zatím i všechny šachové), tak v Sysmarku98 překoná toto Pentium dokonce i Athlon 2100+.
3. AMD. Nový zmíněný Athlon XP 2200+ má upravené optiamlizované jádro, které by mělo méně hřát (68W, 2100+ měl 72W). Ale prakticky, zřejmě díky menší ploše, hřeje podstatně víc než 2100+ a stává se velkým problémem ho vůbec uchladit. A tak někteří příznivci utekli k Pentiu 4 2.53 GHz a jiní čekají na konec roku, kdy bude slavnostně uveden Opteron s úctyhodnými parametry. Cache L1/L2 128M/1Gbyte, integrovaný DDR řadič, rozšíření SSE2, ale také 64 bitový provoz x86-64. A také možnost víceprocesorového provozu, který byl u Athlonů jen pro speciální verze.
1. Compaq has iPAQ serie 39xx with XSCale CPU 400 MHz. The new CPU has an expanded instruction set, but for compatibility reason it's not used both by system Pocket PC2002 and Pocket Fritz. In PC world an usual situation.
2. The new Pentium 4 2.53 GHz has expandend set SSE2. With this set used (SysMark 2002) P4 beats Athlon 2200+, but without this set (Sysmark98 and of course chess soft) is even below Athlon 2100+.
3. The new Athlon 2200+ has new core theoretically with low power (68W, 2100+ was 72W), but in praxis it heats more than 2100+ and it's a big problem to cool it. Some peaples escaped to P4 and some are waiting for Opteron. Cache L1/L2 128M/1Gbyte, integrated DDR controller, extension SSE2, but also 64 bit extension x86-64. In additin every Opteron wil be able to run in multiCPU board.
Celerony 1.8- 2 GHz nejsou
na šachy moc vhodné
Celeron 1.8- 2 GHz are not very good for chess
Vypadalo to jako bomba, Celeron s moderním jádrem P4, ale malá cache L1 značně degraduje výkon. Celeron Tualatin 1.3-1.4 GHz, jehož výroba pomalu končí, má lepší FritzMark.
The small L1 cache is very bad for chess, Celeron Tualatin 1.3-1.4GHz with PIII kern has better FritzMark.
http://h-j-s-.bei.t-online.de/page5.html
I v roce 2003 se očekává překotný vývoj a mnoho novinek.
AMD
Vývoj v Athlonech bude z XP2800+
pokračovat na 3200+, 3400+ a podle optimistů až 4000+.
To je ovšem poměrné číslo, skutečný takt skončí na 2-2.5
GHz. U modelu Barton by měla cache stoupnout z 256 na 512k.
U příležitosti CeBitu bude představen Athlon 64 (Calwhammer)
s 64 bitovým kódem, 1M cache, FSB ještě není stanoven (333,
400 nebo 533 MHz, zřejmě jak se podaří). Paměti DDR 400MHz.
Intel
Všechny nové P4 už s Hyper-Threadingem.
Staré mainboardy už budou zase nepoužitelné, protože FSB
stoupne z 533 na 800 MHz.
Skončí se na frekvenci 3,6 (optimistický odhad 4,0) GHz. Cache
zůstane na 512k.
Zase někdy kolem CeBitu se ale objeví Prescott (snad
pod jménem Pentium 5?). 0,09mikronová technologie zajistí
menší spotřebu při FSB 800MHz, novou multimediální sadu
instrukcí SSE3, pravdpodobně 1M cache.
Kupodivu není jisté, zda bude podporován 64 bitový kód.
FritzMarky dnes
Žlutě je vyznačeno doporučení pro šachy z hlediska poměru cena/výkon v únoru 2003
CPU | GHz | FritzMark kN/s | procent | orientační cena s DPH únor 2003 Kč |
P4 | 3,06 | 1309 | 119 | doplním |
XP2800+ | 2.25 | 1230 | 112 | doplním |
XP2600+ | 2.083 | 1160 | 105 | 11.900,- |
XP2400+ | 2.00 | 1096 | 100 | 8.300,- |
P4 | 2.67 | 1066 | 97 | 13.800,- |
XP2100+ | 1.73 | 962 | 88 | 4.800.- |
XP2000+ | 1.67 | 941 | 86 | 4.100,- |
XP1900+ | 1.6 | 915 | 83 | 3.800,- |
P4 | 2.26 | 880 | 80 | 8.500,- |
XP1800+ | 1.53 | 880 | 80 | 3.400,- |
XP1700+ | 1.46 | 822 | 75 | 2.450,- |
P4 | 2.00 | 777 | 71 | 7.700,- |
Athlon1400 | 1.4 | 770 | 70 | už není v cenících |
Celeron Tualatin | 1.5 | 760 | 69 | 2.400,- |
P4 | 1.8 | 659 | 60 | 6.800,- |
Duron1300 | 1.3 | 638 | 58 | 1700,- |
P3 | 1.0 | 546 | 50 | 5.000,- |
24.06.03
Ještě procesory 2003
More CPUs 2003
Novinky v pololetí
Intel
Nové modely P4 mají všechny
Hyper-Threading, sběrnici FSB 800 MHz a jsou dodávány na
frekvencích 2.4 2.6 2.8 a 3.0 GHz. Vhodné paměti DDR-400 jsou
k těmto procesorům s FSB 800 MHz nejlépe vyladěny. Základní
desky potřebují chipset 865 nebo dražší novinku 875.
Za velkou výhodu je udáváno, že nový Prescott
(alias Pentium 5), který přijde koncem roku, bude kompatibilní
s těmito základními deskami. To je ovšem spíš reklamní
slogan, znalci dobře vědí, že během pár měsíců přijde
nová vlastnost, která už kompatibilní nebude - zkrátka ať
se vám to líbí nebo ne s procesorem se dnes mění skoro
automaticky i základní deska.
Chcete-li levnější Celeron, vyhněte se modelům 1.7 a 1.8 GHz s jádrem P4. Buď lze sáhnout po starším 1.3 GHz s velmi kvalitním trojkovým jádrem Tualatin (FritzMArk vyšší než u 1.7 GHz), nebo začněte až na 2.0GHz s vylepšeným jádrem Northwood.
AMD
Nový s velkým halasem
ohlašovaný Athlon XP 3200+ je propadák.
Běží na novém jádru Barton s cache L2 512k
(oproti starému jádru Thoroughbred se 256k, modely 2600,2700 a
2800+) s FSB 400 (starší "Bartony" XP 2800+ a 3000+
běžely na FSB 333MHz).
Ne, že by to byl špatný procesor, ale ohlašovaný výkonový
růst se nekoná.
Není to až takové překvapení, vždyť XP 3000+ byl vnitřně
taktován na 2167 MHz a u 3200+ s vnitřním taktem 2200 MHz je
přírůstek nepatrný.
AMD je ze všech stran kritizována za označení 3200+, které
neodpovídá skutečnosti.
Firma už zřejmě žije Opterony s podporou 64
bitové architektury, jejichž první modely (Opteron 1.4GHz - 1.6GHz
- 1.8GHz) ovšem nejsou výkonově nic moc a jsou srovnatelné
nejvýš s XP 2100+. Výkon vyženou až nové 64 bitové
aplikace v 64 bitových systémech.
XP rating | Athlon Barton FSB 400, 512k L2 | Athlon Barton FSB 333, 512k L2 | Athlon T-bred FSB 333, 256k L2 | Athlon T-bred FSB 266, 256k L2 |
3200+ | 2200 MHz | |||
3000+ | 2167 MHz | |||
2800+ | 2083 MHz | 2250 MHz | ||
2700+ | 2167 MHz | |||
2600+ | 2083 MHz | 2133 MHz | ||
2500+ | 1833 MHz | |||
2400+ | 2200 MHz | |||
2200+ | 1800 MHz | |||
2100+ | 1733MHz | |||
2000+ | 1667MHz | |||
1900+ | 1600 MHz | |||
1800+ | 1533 MHz | |||
1700+ | 1467 MHz |
Benchmarky | Business Winstone 2002 | Multimedia creation Winstone 2003 |
Intel P4 3 GHz | 33.6 | 49 |
AMD Athlon 3200+ XP | 38.1 | 40.3 |
18.08.03
Procesory 2003/2004
CPUs 2003/2004
desktop | Q3 2003 | Q4 2003 | Q1 2004 |
1500 USD | 3400+ | 3400+/64 | 3700+/64 |
1000 USD | 3200+ | 3200+ | 3400+/64 |
800 USD | 3000+ | 3000+ | 3200+, 3100+/64 |
Nový Athlon 64
přijde nejdřív ve výkonné verzi 3400+ a teprve později jako
3100+.
Taktování: 3700+ na 2,4 GHz, 3400+ na 2 GHz, 3200+ (Barton) 2,2
GHz
desktop | Q3 2003 | Q4 2003 | Q1 2004 |
1500 USD | 3,2 GHz | 3,4 GHz/Prescott | 3,6 GHz /Prescott |
1300 USD | 3 GHz | 3,2 GHz /Prescott | 3,4 GHz /Prescott |
1000 USD | 2,6 GHz | 3 GHz | 3,2 GHz /Prescott |
Nové jádro
Prescott má větší cache a nové instrukce pro SSE2 (multimedia)
a Hyper-Threading. Zatím není jasné, zda bude ještě označen
jako Pentium 4 nebo už jako Pentium 5.
Rýsuje se nové jádro Tejas (indiánsky přítel), snad už
jako Pentium 6. Uvedení plánováno na 2. pololetí 2004.
Code name | Northwood P4 | Prescott P4/P5?? | Tejas P5/P6?? |
L2 cache | 512k | 1024k | 1024k |
L1 instr | 12k | 12k | 16k |
L1 data | 8k | 16k | 16k |
Technology | 130 nm | 90 nm | 90/65 nm |
FSB real | 100/133/200 | 200 MHz | 200/266 |
FSB effective | 400/533/800 | 800 MHz | 800/1066 |
Takt | 1,6-3,2 GHz | 3,0-3,6?? GHz | 4,4 GHz - ?? |
24.06.03
FritzMarky a moderní CPU
FritzMarks and new CPUs
http://www.beepworld.de/members39/computerschach2/chessmarks.htm
Updatoval jsem také svou českou stránku s nejnovějším přehledem CPU.
24.09.03
Test 64bitových CPU šachovými programy
The 64bit CPUs and chess software
Testovali jsme nové 64bit
procesory od AMD a také P4 3.2 GHz pomocí Shreddera
7.04 (průměrné kN/s v zahájení, měřeno
od 1. do 2. minuty výpočtu) a Fritze 8
(fritzmark, 64MB hashtable). Plánujeme zařazovat tento test do
recenzí procesoru pravidelně. Vysledky jsou zde:
http://www.pctuning.cz/Default.aspx?CatID=75&LayId=2&ArtId=18348&ChapID=3813
Zdroj www.pctuning.cz .
12.10.03
Přehled procesorů pro stolní a mobilní počítače
1. Stolní
počítače
Procesory pro stolní počítače jsou na veřejnosti dobře
známé.
1.1 Intel
Firma Intel dominuje světu PC – vyráběla řadu x86 (8086,
8088, 286, 386SX, 386, 486SX, 486, 486 DX2) a Pentium
(ve verzi 1až 4, od verze 2 existují odlehčené levné modely
Celeron).
Klony těchto procesorů nejméně od 386 vyrábí firma AMD,
její nové modely Athlon (v odlehčené verzi Duron)
jsou už kompatibilní, ale samostatně vyvinuté.
Několik dalších výrobců x86 kompatibilních, například Cyrix/IBM
nebo VIA (C3 - studené Pentium nevyžadující
aktivní ventilátor).
1.2 Motorola
Výrobce Motorola ovládl prakticky všechen ostatní trh (Atari,
Commodore, Amiga, NeXT a hlavně Apple Macintosh).
Její původní modely 6800 a 6500 nakonec vyústily do slavné
řady 680xx. Byla na svou dobu výkonná (rakety
Pershing) a programátory v assembleru velmi oblíbená (logická
čistá sada instrukcí s úplným adresovým prostorem,
žádné segmenty a překrývání). Nyní vyrábí Motorola
řadu procesorů PowerPC pro Apple Macintosh.
1.3 Ostatní
nekompatibilní
Ostatní výrobci dosáhli jen zlomek trhu se speciálními
aplikacemi.
SGI (Silicon Graphics) pro grafické pracovní stanice.
MIPS - vyzrálé, téměř dokonalé jádro procesoru pro velmi
výkonné pracovní stanice, které se však na trhu příliš
neprosadily.
2. Mobilní
počítače – PDA, telefony
Zde je situace mezi uživateli méně známá a právě tato
část je hlavním důvodem publikace. Rozdělení sil a trhu v podstatě
kopíruje situaci ze stolních počítačů.
2.1 Mobilní
x86
Samozřejmě prvním nápadem bylo miniaturizovat strukturu x86
– vzhledem k velkému množství programů ze světa PC a
znalostem programátorů.
Téměř každý nahoře uvedený výrobce sice vyrábí
„mobilní“ verze svých procesorů, tím je ale myšlena
varianta pro notebooky sice s malou spotřebou, ale pořád
ještě příliš velkých rozměrů (kvůli chlazení).
Atari svého času vyráběl dnes už
legendární subnotebook Portfolio s procesorem
80c88, ale to už je minulostí.
AMD dotáhl podobnou snahu až k modelu 5x86 na 133 MHz (model
Elan SC520 použitý v Nokia Communicatorech mimo 9210). Tím
ale éra kompatibility s PC skončila.
2.2 Motorola
Motorola použila své slavné jádro 68000 pro výrobu
mobilního procesoru DragonBall, který je spojen se
slavnou řadou PDA Palm. Bohužel dost se
šetřilo na frekvenci (dlouho 16 a 33 MHz, nzní max 66 MHz),
proto poslední model Palm Tungsten T přešel k Intelskému
čipu.
2.3 Intel
Intel nespoléhal na minulé verze a vyvinul speciální 32
bitový RISC procesor ARM.
Ten se proslavil nejdříve v průkopnických kapesních
počítačích Psion (5mx, Revo).
Po příchodu PocketPC (rychle se prosadily právě pod
tlakem dvojice Intel a Microsoft) byl Intel schopen poskytnout
inovovaný StrongARM na fantastické frekvenci
206 MHz (SA –1110) a v roce 2002 dát na trh nový model XScale
s frekvencí až 400 MHz. Tento model už má rozšířenou
instrukční sadu s verzemi MMX a SSE.
Pro PDA se stal XScale standardem stejně jako Pentium pro PC.
Poslední modely pro PDA jsou PXA 255, 260 a 263.
PXA 800F by měl vytvořit podobný standard pro chytré
mobilní telefony.
Jádro ARM vyrábí licenčně několik dalších výrobců, jako
Texas Instrumentes (model OMAP 1510).
2.4 Ostatní
MIPS má na základě svých zkušeností
velmi kvalitní mobilní procesor, ale stejně jako ve stolních
počítačích se jí příliš nedaří. Licenci zakoupil AMD a
začal vyrábět řadu Au (1000, 1100, 1500 na 500 MHz).
Budoucnost toho systému je spojena se snahou prosadit nový
standard PDA založený na Linuxu.
Hitashi se prosadila se 32 bitovým procesorem
SH3 (HP Jordana, Casio Cassiopeia), ale nástup
Intelu zřejmě další vývoj ukončil.
25.04.04
Jak bude vypadat nové PC za rok?
Chystáte-li koupi nového PC, snad vás bude zajímat, co převratného se chystá v roce 2004
1. BTX
Staré casy, zdroje a mainbordy standardu ATX nevyhovují z
mnoha hledisek.
Chystá se standard BTX (Balanced Technology eXtended).
- nový konketor zdroje 24 pinů, který zase utáhne všechno (dnes
jsou přídavky pro P4 i výkonné grafické karty).
- chladící kanál
- odpadnou COM a Game porty, místo toho 4xUSB2 a vícekanálový
zvukový výstup
- konektor pro SATA disky jako základní standard, starý IDE
konektor jen pro CD/DVD
2. PCI-Express
Také koncepce PCI /AGP už nevyhovuje rychlostí,
přestože AGP zrychlila ze 1x na 8x a snížilo se její
napájecí napětí (důsledek, není AGP karta jako AGP karta,
zdaleka nejsou kompatibilní).
Nově se zavede opět jednotný standard rozhraní PCI-Express.
AGP sloty na BTX boardech zmizí (a grafické karty AGP čeká
stejně smutný osud jako před lety nechvalně proslavený VESA
standard), PCI budou v omezené míře zachovány kvůli zpětné
kompatibilitě.
3. Nový
slot pro Prescotta
První verze Intelské varianty P4 s jádrem Prescott se
příliš nevydařily, byly totiž uvedeny předčasně jako
reakce na náskok AMD.
Příliš se hřejí a s výkonem to není slavné.
Pořádné Prescotty budou mít nový soket, místo současného
478 celých 775 vývodů (LGA-775-Socet, LGA=Large Grid Array).
A hlavně už nemají mít piny (u poslední 478 verze je jeho
narovnání náročným úkolem, který sotva zvládnete bez lupy),
ale jen jakési ploché kontaky. No uvidíme, jak to bude
fungovat a co s nedoteky...
Intel také v tichosti chystá pro Xeony 64-bitové rozšíření,
jaké už nabídl AMD.
4. AMD
AMD už má 64 bitový Athlon 64, ale i zde místo 754
nožiček chystají novou verzi s 939 vývody.
První verze Athlon 64 3500+ (2.2GHz) by měla být v květnu, do
roka by měla poskočit až na 4200+ (2.8 GHz).
09.06.04
Výkon mobilních procesorů Centrino
Kupujete-li
notebook, snad Vás zarazí, že procesor Intel Centrino je
taktován někde na 1.5 GHz.
Jak je to s výkonem proti stolním PC, které se blíží ke 3
GHz?
Nedávno nám na školení předváděli, že Centrino je bomba. Na polovičních frekvencích se hravě vyrovná strojům s klasickým P4 kolem 3 GHz. Koneckonců Intel kvapně ukončil svůj nepovedený přehřívající se Prescott, zrušil také jeho následovníka a urychleně připraví novou verzi stolního Pentia M založené právě na jádru Centrina. Přitom se moc nehřeje...
Mimochodem,
Prescott a celá ta větev je z USA, zatímco nová koncepce je z
vývojových laboratoří v Izraeli. Takže budeme mít brzo
židovská Pentia. Nemyslím to nijak hanlivě, naopak jako
značku kvality. Koneckonců když se podíváte na mistry světa
v šachu, jen málokterý neměl podobný původ...
Jediný problém Centrina je velmi vysoká cena - stojí skoro 2x
tolik, než AMD 3000+.
Výpis Fritzmarků
CPU KN/s DualXeon 3,565 2953 kn/s Athlon64 2.2 3400 1405 kn/s PIV-3.06/3,7GHz 1374 Kn/s DualXeon 3,565 1326 kn/s Athlon64 "3200+" 1333 KN/s Ahtlon64 3400+ 1334 KN/s Ath.XP 2500/2400 1270 KN/s PIV-3.0/3.4 Ghz 1258 Kn/s Ahtlon64 3000+ 1195 KN/s Centrino 1.7 GHz 1166 KN/s PIV-3.06 1148 Kn/s Ath.XP 2500/2200 1130 KN/s Centrino 1.6 GHz 1096 KN/s AMD XP 2700+/2167 1080 kN/s AMD XP 2600+/2083 1061 kN/s PIV 2.80 1049 kN/s AMD-Barton 2.0 1030 KN/s Centrino 1.50 1025 kN/s P4-2.67 1018 kN/s AMD XP 2400+/2000 1007 KN/s P4-2.53 895 Kn/s P4-2.4 893 Kn/s AMD XP 2200+/1800 902 kN/s Centrino 1.30 872 kN/s AMD XP 2100+/1733 871 kN/s
28.12.04
Hyper-Threading a DeepJunior 9
Hyper-Threading and DeepJunior 9
1. Co je HT /What's HT
HT (Hyper-Threading) je
technologie Intelu, kdy v jednom procesoru P4 jsou jakoby dva.
Střídavě se odpojují a připojují ke sběrnici a tak
vlastně levně napodobují dvouprocesorový systém. Při
odpojení totiž nespí, ale mohou vnitřně pokračovat ve
výpočtu.
Analogie s dvouprocesorovým systémem není úplná, k využití
HT je třeba určitých úprav. Proto není automaticky jisté,
že stávající deep verze šachových programů dokážíHT
využít.
Já sám a pár známých nadšenců jsme se několikrát
snažili otestovat, jak to vlastně s HT je. Výsledky však byly
vždy velmi vágní, nejisté, nereprodukovatelné.
Můj nový vánoční test s nejnovějším DeepJuniorem 9 snad
trochu poodkryje tajemství HT v šachových programech.
HT (Hyper-Threading) is an Intel
technology. In one processor chip are internaly two Pentiums 4.
They alternately switch on and off to PC system bus and so the
multiprocessor system is emulated for a low price. Switched-off
the CPUs doesn't sleep but it can internally run.
But the analogy with multiCPU sytem is not full and a
multiprocessor software should to be a little adapted. So it's
not sure the currently distributed deep-engines can use HT
feature.
I and some my friends sometimes started HT tests, but the results
were unclear.
Maybe my new X-mas test could a little clear the all matter.
2. Podmínky testu /How I tested
Hardware Pentium
4, 3 GHz, Asus P4P800 mainboard, 2x256 DDR dual channel
Software Windows XP Pro SP2, Junior 9,
DeepJunior 9, Fritz GUI 24
HT jsem vypínal a zapínal v
BIOSu, jako kontrola sloužila indikace threads v parametrech
Deep Juniora, která se skutečně správně měnila na 1 a 2.
Zatížení procesoru jsem informativně sledoval ve správci,
ale při ostrém testu jsem ho vypnul.
HT was switched on and off in BIOS
Setup, Deep Junior really gives in parameters threads=1 and
threads=2.
The CPU loading was checked for information in Task Manager, but
for test runs it was shutdowned.
V testu BS2830 jsem vyhledal
několik pozic jasné taktické povahy, které Junior řeší v
řádu desítek vteřin.
Rychlejší řešení by vneslo systematickou chybu, dlouhé
řešení by test zbytečně zdržovalo.
Rychlý průběh umožnil každou pozici projet několikrát (s
mazáním hash tabulek), takže výsledky jsou perfektně
reprodukovatelné.
Velmi důležité bylo kromě času měření zapsat také počet
prozkoumaných pozic (v milionech M), které program k nalezení
řešení musel prozkoumat.
In BS2830 I have found some
positions of clearly tactical nature which are solved in tens
seconds.
The more quick solution times could bring the error, the loner
times would be unnecessarily delay.
Such a solution times allowed repeat every positin sometimes (with
hash clear, of course), so all is perfectly reproducible.
I have noticed also the number of positions (in mega -M) needed
to finding solution.
3. Výsledky /Result
Junior 9 hash=192M (default) | Deep Junior 9 hash=192M (default) | ||||
BS 2830 | HT on (BIOS) CPU using 50 percent |
HT off (BIOS) CPU using 100 percent |
HT on (BIOS) CPU using 100 percent |
HT off (BIOS) CPU using 100 percent |
|
1 | Chalifman - Gavrikov 1.Bd2! | 25 s /42 M | 25 s /42M | 24 s /37 M | 26 s /33 M |
2 | Alechin - Rabinovic 1.Bb2! | 14 s /23M | 15 s /23M | 13 s /22M | 16 s /16M |
3 | Bednorz - Spinath 1.Ne6! | 33s /49M | 33s /49M | 37s /49M | 36s /38M |
4 | Nimcovic - Alapin 1.0-0-0! | 55s /83M | 56s /83M | 40s /52M | 55s /71M |
5 | Timman - Korcnoy 1.Nxf7! | 6s /10M | 6s /10M | 4s /3.7M | 8s /11M |
4. Komentář /Comments
4.1 Non-deep engines
Pro ne-deep motory se podle
očekávání výsledky příliš neliší. Občas bez HT
přibyde nějaká ta vteřina (případy 2,4).
To ale není vlastností motoru, spíš bych to přičetl režii
systému, kde přece jen běží nějaké procesy na pozadí,
které s HT on mohou zabrat trochu méně času.
Hlášení o 50 procentním využití CPU je jen kosmetika,
systém prostě "vidí" nevyužitou CPU.
For non-deep engines there are no
big differences. Sometimes with HT off the solution is one second
longer (cases 2,4), but it is not the engine delay.
I think the reason are Windows background processes, which are a
litte bit better optimized with HT on.
The 50 percent CPU using is cosmetics only, system sees one
nonused CPU.
4.2 Deep engines
Prohlédnete-li jen zběžně
časy řešení, uvidíte příčiny rozpaků při různých
předchozích testech.
Někdy je ne-deep motor rychlejší než deep (3).
Někdy je HT off i pro deep motor výhodnější, než HT on (3).
Nejčastější je přece jen očekávaná situace, kdy deep
motor s HT on ukáže určitou převahu.
Co se tam vlastně děje?
Zapomeňte na chvíli na časy a prohlédněte si počet
prozkoumaných pozic nutných k nalezení řešení.
Vždy se liší a pro HT on bývají často vyšší.
To je důkaz, že program pracuje pokaždé s jiným algoritmem a
spolu s indikací CPU load=100 procent napovídá, že motor
opravdu s HT on spouší dva thready.
Jenže správa a koordinace obou threadů je náročná, takže
HT on algoritmus je méně kvalitní a spotřebuje víc pozic.
Právě to částečně znehodnocuje zrychlení výpočtu, které
s HT přece jen není tak velké jako u čistě
dvouprocesorového systému.
The times are different for
different positions, so this is the reason of past tests
confusion.
Sometimes the non-deep engine is quicker (3).
Sometimes the HT off is better as HT on (3 again).
But in the most cases - as expected - deep version with HT on has
a small advantage.
What happened?
Forget times now and look the MegaKnots needed to find solution.
They are always different and for HT on are usually higher.
That's proof, the engine uses a different algorhithm for HT on
and HT off. And because of CPU using=100 percent, the two threads
are surely started with HT on.
But the 2-threads management is difficult and the algorhithm for
HT on is not effective enough and it needs some extra MegaKnots.
And this compensates a quicker HT computing. The HT speed is
lower as pure two CPU system.
5. Shrnutí /Summary
Deep Junior využívá HT a spouští dva paralelní propočty, ovšem jejich správa vede k méně efektivnímu algoritmu a v souhrnu není výsledný efekt příliš výrazný.
Deep Junior with HT on starts two paralel calculations, but his managment gives usualy a less effective algorithm and so the result is not visible enough.
07.04.05
Specializovaný Axon test CPU
Special CPU Axon text
Axon test je speciální benchmark
procesoru, složený z takového instrukčního mixu 16 a 32
bitových instrukcí, který odpovídá šachovým motorům.
V podstatě jde o motor, řešící šachový problém.
Test běží na počítači řádově jen minutu, poté vydá
číselný výsledek, který je možné na webu porovnat s celou
řadou jiných měření.
Axon test is a special chess
benchmark - a special chess engine solving some problems. So the
instruction mix is characteristic for chess.
The run is only minute and as result you get a number.
http://www.geocities.com/sedatchess/ both download test and see a lot of results
09.09.05
Axon benchmarky (Sedat)
Axon benchamrks (Sedat)
AMD Athlon 64 FX-55 2.60 GHz (00:00:24.4 sec.) [3774488 pps.] PowX= 11.759 AMD Athlon 64 3800+ 2.40 GHz (00:00:25.8 sec.) [3569671 pps.] PowX= 11.121 AMD Athlon 64 X2 4600+2.40GHz (00:00:26.3 sec.) [3501806 pps.] PowX= 10.910 AMD Athlon 64 FX-53 2.40 GHz (00:00:26.4 sec.) [3488542 pps.[ PowX= 10.868 AMD Athlon 64 3700+ 2.40 GHz (00:00:26.4 sec.) [3488542 pps.] PowX= 10.868 AMD Athlon 64 3400+ 2.40 GHz (00:00:26.5 sec.) [3475377 pps.] PowX= 10.827 AMD Athlon 64 3400+ 2.20 GHz (00:00:28.6 sec.) [3220192 pps.] PowX= 10.032 AMD Athlon 64 3200+ 2.20 GHz (00:00:28.6 sec.) [3220192 pps.] PowX= 10.032 AMD Opteron 248 2.20 GHz (00:00:29.0 sec.) [3175776 pps.] PowX= 9.894 Intel M760, Dell XPS 2.0 GHz (00:00:29.2 sec.) [3154024 pps.] PowX= 9.826 AMD Athlon 64 3000+ 2.01 GHz (00:00:31.4 sec.) [2933041 pps.] PowX= 9.138 AMD Ahtlon XP 2800+ 2250 MHz (00:00:31.6 sec.) [2914478 pps.] PowX= 9.080 AMD Athlon 64 3000+ 2000 MHz (00:00:31.7 sec.) [2905284 pps.] PowX= 9.051 AMD Dual Opteron 246 2.00 GHz (00:00:32.0 sec.) [2878047 pps.] PowX= 8.966 AMD Athlon XP 2700+ 2.17 GHz (00:00:32.8 sec.) [2807851 pps.] PowX= 8.748 AMD Athlon MP 2800+ 2133 MHz (00:00:33.3 sec.) [2765691 pps.] PowX= 8.616 Intel Centrino Datron 1.73 GHz(00:00:33.7 sec.) [2732863 pps.] PowX= 8.514 Pentium 4 CPU EE 3.2 GHz (00:00:33.8 sec.) [2724778 pps.] PowX= 8.489 AMD Athlon XP 2600+ 2083 MHz (00:00:33.8 sec.) [2724778 pps.] PowX= 8.489 AMD Athlon XP 3000+ 2100 MHz (00:00:33.9 sec.) [2716740 pps.] PowX= 8.464 P4 3.20 GHz Dell Precision 360(00:00:34.1 sec.) [2700806 pps.] PowX= 8.414 AMD Athlon XP 2800+ 2083 MHz (00:00:34.0 sec.) [2714986 pps.] PowX= 8.376 AMD Athlon XP 2400+ 2.00 GHz (00:00:35.6 sec.) [2587008 pps.] PowX= 8.060 AMD Athlon MP 2400+ 2.00 GHz (00:00:35.6 sec.) [2587008 pps.] PowX= 8.060 Pentium 4 CPU 3.06 GHz (00:00:35.5 sec.) [2594296 pps.] PowX= 8.082 AMD Athlon MP 2400+ 2.00 GHz (00:00:36.3 sec.) [2537121 pps.] PowX= 7.904 AMD Sempron 2800+ 2.00 GHz (00:00:36.9 sec.) [2495867 pps.] PowX= 7.776 Pentium 4 CPU 3.00 GHz (00:00:37.1 sec.) [2482412 pps.] PowX= 7.734 Pentium 4 CPU 2.80 GHz (00:00:37.7 sec.) [2442904 pps.] PowX= 7.611 AMD Fujitsu-Siemens 2600+ (00:00:38.7 sec.) [2379780 pps.] PowX= 7.414 AMD Athlon XP 2500+ 1833 MHz (00:00:38.8 sec.) [2373647 pps.] PowX= 7.395 Dual Intel Xeon 2.80 GHz (00:00:38.8 sec.) [2373647 pps.] PowX= 7.395 AMD Mobile 2600+ 2000 MHz (00:00:39.0 sec.) [2361474 pps.] PowX= 7.357 Pentium 4 CPU 2.8 HT Laptop (00:00:39.3 sec.) [2343448 pps.] PowX= 7.301 AMD Athlon XP 2200+ 1800 MHz (00:00:39.4 sec.) [2337500 pps.] PowX= 7.282 Intel Pentium 4HT 2800 MHz (00:00:39.6 sec.) [2325694 pps.] PowX= 7.245 AMD Dual Opteron 242 1.60 GHz (00:00:39.8 sec.) [2314007 pps.] PowX= 7.209 Dual Mobile Pentium 4 2.66 GHz(00:00:40.6 sec.) [2268411 pps.] PowX= 7.067 Intel Celeron CPU 2.70 GHz (00:00:40.6 sec.) [2268411 pps.] PowX= 7.067 Dual Mobile Pentium 4 2.66 GHz(00:00:40.9 sec.) [2251772 pps.] PowX= 7.015 AMD Athlon XP 2200+ 1800 MHz (00:00:41.5 sec.) [2219217 pps.] PowX= 6.914 Pentium 4 CPU 2.6 GHz (00:00:41.0 sec.) [2251452 pps.] PowX= 6.897 Intel Centrino 1.70 GHz (00:00:41.8 sec.) [2203289 pps.] PowX= 6.864 AMD Athlon XP 2500+ 1833 MHz (00:00:42.1 sec.) [2187589 pps.] PowX= 6.815 Pentium 4 CPU 2.53 GHz (00:00:42.5 sec.) [2167000 pps.] PowX= 6.751 Pentium 4 CPU 2.40 GHz (00:00:44.1 sec.) [2088378 pps.] PowX= 6.506 Intel Centrino 1.6 GHz (00:00:44.5 sec.) [2069607 pps.] PowX= 6.448 AMD Dual Opteron 240 1.4 GHz (00:00:44.7 sec.) [2060347 pps.] PowX= 6.419 AMD Sempron 2300+ 1.58 GHz (00:00:45.0 sec.) [2046611 pps.] PowX= 6.376 AMD Athlon MP 1800+ 1.53 GHz (00:00:47.0 sec.) [1964032 pps.] PowX= 6.084 Intel Centrino 1.50 GHz (00:00:47.9 sec.) [1922703 pps.] PowX= 5.990 AMD Athlon XP 1900 1.6 GHz (00:00:48.4 sec.) [1902841 pps.] PowX= 5.928 Mobile Pentium 4 2.40 GHz (00:00:50.4 sec.) [1827331 pps.] PowX= 5.693 AMD Athlon XP 1800+ 1524 MHz (00:00:51.4 sec.) [1791780 pps.] PowX= 5.582 AMD Duron 1.30 GHz (00:00:54.0 sec.) [1705509 pps.] PowX= 5.313 Pentium 4 CPU 2.00 GHz (00:00:55.7 sec.) [1653456 pps.] PowX= 5.151 AMD MobileXP 2600+ 2.13 GHz (00:00:55.7 sec.) [1653456 pps.] PowX= 5.151 Dual Pentium 4 CPU 2.80 GHz (00:00:57.7 sec.) [1596144 pps.] PowX= 4.972 Intel Celeron CPU 1.80 GHz (00:00:58.2 sec.) [1582431 pps.] PowX= 4.930 Pentium 4 CPU 1.80 GHz (00:00:58.3 sec.) [1579717 pps.] PowX= 4.921 Intel Celeron CPU 1.30 GHz (00:00:59.6 sec.) [1545260 pps.] PowX= 4.814 Celeron 2000 MHz, Maxdata (00:01:01.8 sec.) [1490251 pps.] PowX= 4.643 Pentium 4 CPU 1.70 GHz (00:01:02.0 sec.) [1485443 pps.] PowX= 4.628 Intel Celeron CPU 1.70 GHz (00:01:02.3 sec.) [1478290 pps.] PowX= 4.605 Pentiun 4 CPU 1.80 GHz (00:01:03.5 sec.) [1450354 pps.] PowX= 4.518 Intel Celeron CPU 1.70 GHz (00:01:04.4 sec.) [1430085 pps.] PowX= 4.455 Intel Celeron CPU 1.20 GHz (00:01:05.0 sec.) [1416884 pps.] PowX= 4.414 AMD Athlon 1202 MHz (00:01:06.9 sec.) [1376644 pps.] PowX= 4.289 AMD Duron Morgan 1.0 GHz (00:01:11.0 sec.) [1297148 pps.] PowX= 4.041 Pentium III 933 MHz (00:01:23.0 sec.) [1112163 pps.] PowX= 3.481 GenuineIntel 928 MHz (00:01:23.4 sec.) [1104286 pps.] PowX= 3.440 AMD Athlon 1001 MHz (00:01:26.2 sec.) [1068416 pps.] PowX= 3.328 Pentium III 900 MHz (00:01:26.6 sec.) [1063481 pps.] PowX= 3.313 Dual Pentium III 800 MHz (00:01:26.6 sec.) [1063481 pps.] PowX= 3.313 AMD Athlon 950 MHz (00:01:26.7 sec.) [1062255 pps.] PowX= 3.309 Intel Celeron 900 MHz (00:01:27.8 sec.) [1048946 pps.] PowX= 3.268 AMD Duron 1000 MHz (00:01:27.9 sec.) [1047753 pps.] PowX= 3.264 Dual Pentium III 733 MHz (00:01:35.0 sec.) [971679 pps.] PowX= 3.042 AMD Athlon 700 MHz (00:01:45.5 sec.) [907364 pps.] PowX= 2.826 Pentium III 650 MHz (00:01:46.2 sec.) [867208 pps.] PowX= 2.701 Intel Celeron 633 MHz (00:01:54.6 sec.) [803643 pps.] PowX= 2.503 Pentium III 600 MHz (00:02:01.0 sec.) [761136 pps.] PowX= 2.371 Pentium III 550 MHz (00:02:17.5 sec.) [669800 pps.] PowX= 2.086 Intel Celeron 466 MHz (00:02:30.0 sec.) [615396 pps.] PowX= 1.921 Pentium III 450 MHz (00:02:45.0 sec.) [559451 pps.] PowX= 1.743 Intel Celeron 433 MHz (00:02:49.8 sec.) [542388 pps.] PowX= 1.689 Celeron 400 MHz, Acer Notebook(00:02:56.0 sec.) [524486 pps.] PowX= 1.637 AMD-K6 3D 350 MHz (00:03:23.0 sec.) [453682 pps.] PowX= 1.413 Pentium 233 Mhz (00:03:57.6 sec.) [387615 pps ] PowX= 1.207 Pentium II 300 MHz (00:04:10.8 sec.) [367214 pps.] PowX= 1.144 Intel Celeron 266 Mhz (00:04:30.6 sec.) [340345 pps.] PowX= 1.060 Cyrix x686 200 MHz (00:04:47.6 sec.) [320965 pps.] PowX= 1.000 Pentium 100 MHz (00:04:57.4 sec.) [309675 pps.] PowX= 0.964 Pentium 75 MHz (00:05:00.0 sec.) [306991 pps.] PowX= 0.956 Intel 80486 33 MHz (00:05:59.8 sec.) [255968 pps.] PowX= 0.797
18.04.06
Technologie - 64bit a reverzní HT
64bit CPU and reverse-HT
Dvouprocesorové stroje
Během posledních dvou let jsem několika nadšencům
rozmluvil pořízení dvouprocesorového stroje.
Argumenty stojí za to zopakovat.
Aby se takový stroj "vyplatil", musíte ho osadit špičkovými procesory s nejvyšší
frekvencí, kde je cena neodpovídající zvýšení výkonu.
Dále potřebný mainboard je několikanásobně dražší, než normální
jednoprocesorový.
A jaký je výsledek?
Šachové programy se nezrychlí dvakrát, jak by se mohlo zdát. Práci je totiž
potřeba mezi ty procesory rozdělit, například je podělit tahy,
který bude každý zpracovávat.
A když se netrefíte (to byste předem museli znát
sílu těch tahů..), tak je jeden procesor hotov a čeká na druhý.
U nejlepších Deep-verzí je nárůst 20, nejvýš snad 30 procent výkonu
místo 100 procent.
Pointa: Během tří měsíců se frekvence nejvyššího procesoru o těch 30 procent
zvýší taky je to vyhozených dvacet tisíc.
64bitové stroje
64bitové stroje, to je jiné kafe. Michael Koppel uvádí výsledky svých měření
32 bit 64 bit Faktor
Zappa 1.1 385 619
1,61
Rybka 1.1 80 127
1,59
Naum 1.9i 829 954
1,15
Glaurung 1.0.2 432 450 1,04
Scorpio 1.7 834 816 0,98
Dobře napsaný 64bitový program se zrychlí zhruba
o 60 procent.
Nigel Robson hlásí zrychlení Zap!Chess 64bit o 75 procent!
Co to obnáší?
Především musíte mít 64bitový procesor.
AMD i Intel už mají 64bitovou většinu produkce, dokonce i nové
Celerony.
K tomu 64bitová Windows. Ty už jsou také celkem běžně, ale ne v
české verzi
http://e-shop.asbis.cz/default.asp?cls=spresenttrees&strid=326567
Taková investice je mnohem rozumnější, než dvouprocesorový stroj.
Reverzní HT?
HT - hyperthreading je pokus nahradit
dvouprocesorové stroje jedním čipem, kde jsou dva procesory jakoby uvnitř.
Náhrada to není dokonalá, protože se procesory musí "odpojovat od nožiček" a to
jsou další čekací časy.
Testy HT a Deep verze šachových programů končily vždy rozpačitě, vysvětlení najdete o
něco výš.
Nyní se objevuje zcela nový pojem, AMD vymýšlí
něco jako reverzní-HT neboli anti-HT.
V principu by mělo víc procesorů napodobit jeden rychlejší tím, že by si samy
rozebraly kód a zpracovávaly by ho paralelně.
http://www.cdr.cz/a/novinky/starsi/885 (článek
AMD asi kutí „HyperThreading naruby“)
Názory se různí, jsou i takoví, kteří to považují za kachnu a nesmysl.
Rozhodně něco podobného funguje v každém procesoru od 486, které mají více CPU a
snaží se o spekulativní výpočet kódu dopředu.
No a použití na šachovou hru? I kdyby to začalo fungovat, tak rozdělit šachový
propočet automaticky lépe,
než to dokázali programátoři v Deep verzích, se zdá být prakticky nemožné.
Core2Duo je nová řada procesorů od Intelu, která málo hřeje a má super výkon.
Celá větev Pentium 4, vyvinutá v USA, nebyla příliš vydařená. Výpočetní výkon
nesplnil očekávání, zato to ale s rezervou vynahradil výkon teplotní..
Izraelská pobočka Intelu se proto před časem vrátila k vydařenému jádru Pentium
III a začala znovu.
Výsledkem byly skvělé mobilní řady jako například známé Centrino. Ty byly tak
dobré, že nakonec celou koncepci P4 v podstatě zahodili a má ji nahradit nové
jádro Core 2 Duo. K němu patří nové základní desky s čipsetem 965.
S nákupem je třeba ale ještě trochu počkat, než se vychytají mouchy a klesnou
dost vysoké ceny.
První malý šachový benchmark uvádí "Jean-Paul" http://216.25.93.108/forum/viewtopic.php?topic_view=threads&p=43436&t=5651
Arena + TogaII 1.2.1, FEN: 8/8/4B3/8/8/3K4/p2p4/kN1N4 w - - 0 5, mate in 3
1.Core 2 Duo E6600 at 3.6Ghz (+M13) Depth 20 in 00m37s!!
2.Core 2 Duo E6300 at 2.94Ghz (+M13) Depth 20 in 00m44s
3.Core 2 Duo E6700 (+M13) Depth 20 in 00m51s
4. AMD 4000+ (San Diego) at 2.80 GHz,2GB (+M13) Depth 20 in 00m57s
5.Opteron 165 at 2.8ghz+2GB (+M13) Depth 20 in 00m59s
6.AMD 3400+ Newcastle at 2.6Ghz,1GB (+M13) Depth 20 in 01m03s
7.XPS M1210,Core 2 Duo T7400 2.16ghz Merom ES, 2GB (+M13) Depth 20 in 01m05s
(was only on 1Ghz)
8. Pentium-M(dothan) @2.4ghz 1gb ram (+M13) Depth 20 in 01m10s
9.Dell XPS Gen2 laptop 2.26 Pentium M + 1.256Gb (+M13) Depth 21 in 01m15s
10.Amd 3400+ Newcastle at 2.4Ghz,512Mb (+M13) Depth 20 in 01m22s (65Mb HT)
11.Pentimum 4 3.0e (presscott) Overclocked @ 3.679Ghz (+M13) Depth 20 in
01m33s
12. Athlon 64 3000+ Newcastle @ 2.4Ghz (+M13) Depth 21 in 02m56s
13.Amd t-bird 1.2ghz (+M13) Depth 21 in 04m18s
14.AMD ML-30 512mb (+M13) Depth 21 in 07m53s
22.09.06
Plaťte za MHz - update
Na několik dotazů jsem updatoval článek plaťte za MHz ze začátku této
rubriky.
Originál byl ze začátku roku 2001, kdy byla nabídka CPU relativně jednoduchá a
průhledná.
Dnes platí úměrnost frekvence a rychlosti v principu také, ale jen mezi
stejnými řadami procesorů.
Ono se totiž ukázalo, že zvyšovat frekvenci je stále obtížnější (přehřívání)
a tak se rychlost zvyšuje také vnitřní optimalizací.
Přepočty mezi různými řadami jsou v dokumentaci a specifikacích výrobců.
Pár nejdůležitějších případů.
1. Procesory Intel Pentium 3/4 a příslušné Celerony
jsou základem, kde úměrnost v principu platí.
Pentium 4 se od Celeronu liší (kromě několika tisíc korun ceny) vyšší vnitřní
keší.
V některých datově náročných programech (převody videa) je nárůst výkonu
markantní.
Ale šachové programy mezi ně nepatří a P4 proti Celeronu nepředstavuje velký
pokrok.
2. Procesory AMD mají vlastní přepočet, který je ale přímo v
názvu.
Například Athlon64 3200+/2.0 GHz doslova říká, že procesor firmy AMD běží
na 2GHz,
ale vylepšená vnitřní struktura mu dává výkon srovnatelný s klasickým Intelem
3,2 GHz (to plus znamená ještě trochu víc..).
3. Mobilní Intely a Core2Duo
U mobilních procesorů Intel z notebooků (např. Centrino) je dávno znám
experimentální odhad, kdy se frekvence násobí skoro 2x.
Koneckonců Intel nedávno konečně přiznal to, co se dlouho vědělo, že totiž celá
větev Pentium 4 je nepovedená cesta.
P4 jsou minulostí, na základě mobilního jádra byla vyvinuta i pro stolní PC řada
Core2Duo, chladná a rychlá.
Zde platí 2x také pro neDeep programy.
Tyto odhady můžete zhruba ověřit na výše uvedeném článku o Axon benchmarcích.
64 bitový program běžící na Windows XP 64 bit běží skoro
dvakrát tak rychle, je-li dobře napsán.
Chystám se k otestování Deep programů na Core2Duo.
7.1.2007
Konec P4
Asi jste si všimli, že v letošním roce skončila existence Pentia 4. Slavné
jméno, které nás provázelo řadu let společně s notoricky známým logem Intel
Inside.
Bývá zvykem, že vývoj se odvíjí od produktu k produktu, Pentium 4 však takto
nekončí. Letos se ukázalo, že celá jeho technologie Netbusrt je vlastně zcela
slepou vývojovou větví.
Někteří zasvěcení ví, že současné Core je spíše inspirováno Pentiem 3, stejně
jako v době existence Pentia 4 mobilní procesory Pentium M.
Pentium 4 a celou Netburst technologii tak lze zařadit jako jeden z největších
technických omylů vůbec.
6.6.2007
64 bitové motory - souhrnná informace
Aspekty
1. Hardware
Je nutný novější procesor s 64 bitovým rozšířením.
AMD má rozšíření jménem AMD64, které drží prvenství
U Intelu se jmenuje EMT64 a od jara 2006 ho mají většinou i levné Celerony. V
poslední době se mluví o Intel64.
Jsou prakticky kompatibilní.
2. OS Windows
Pro spouštění 64 bitových aplikací je nutný 64 bitový operační systém.
32 bitový systém (Windows XP Pro, Vista) | 64 bitový systém (Windows XP Pro 64, Vista 64) |
32 bitové aplikace | 32 bitové aplikace i 64 bitové aplikace |
Pod 64 bitovým OS tedy spustíme vše.
Proč se tedy nedodává a neinstaluje standardně?
Protože (hlavně XP Pro 64) je to pořád tak trochu bastl.
Chybí některé ovladače (nerozběhnete webové kamery, TV karty a jinou exotiku,
zejména neznačkovou) a taky velmi dlouho chyběly nástroje na hlubší proniknutí
do systému, zejména antiviry.
To už se zdá být pomalu překonáno.
Proto se 64 bitový systém často používá na pokusy a na PC se ponechává i 32
bitový na práci - systém s dvojím bootováním.
3. Rychlost 64 bit aplikací
Výrazné zrychlení není automaticky garantováno!
Někteří programátoři se domnívali, že když mají motor třeba v C++, tak stačí
zakoupit nový překladač, zvolit parametr /64 a je vyřešeno.
Někdy bohužel není.
Marc Uniacke dal bezelstně v 10/2006 k testování svého Hiarcse X54 UCI/64bit,
ale od té doby další 64bitová verze nebyla. Naměřili mu totiž zrychlení 2.5
procenta.
Tutéž chybu udělala ChessBase s lehce předraženým DeepFritzem 10. Vedle
multiprocesorů byl ohlášen i běh na 64bitech. Ale problém asi zjistili sami,
dokonce natolik včas, že mohli začít mlžit a nakonec se zdálo, že ani žádnou
64bitovou verzi neslibovali. Vysoká cena ovšem zůstala.
Záleží na vnitřní stavbě programu. Pokud je reprezentace šachovnice klasická
matice 8x8 (nebo 10x8) v bajtech, pak je věc skoro ztracená. Tahy se totiž
provádějí většinou přičítáním/odčítáním, kde 64bitová aritmetika nemá skoro
žádný význam.
Chytřejší autoři modernějších programů použili tzv. bitboardovou
reprezentaci, kdy šachovnice je modelována řadou 64 bitových masek. Například
jedna pro bílé pěšce, druhá pro černé atd.
Tahy a testy se provádějí logickými operacemi nad těmito maskami. Ty se ale na
64bitovém stroji provádějí najednou, takže důležité opakované sekvence
generování tahů běží dvakrát rychleji.
Skvělá je především Rybka a Zap!Chess, běžící o 30-40 procent
rychleji.
4. GUI a motor
V tomto bodě panuje nejvíc pověr a mýtů. Ve skutečnosti se věc liší podle
typu motoru.
UCI motor je samostatná nezávislá konzolová EXE aplikace, komunikující s
GUI textovými příkazy přes rouru standardního vstupu a výstupu. Koneckonců
můžete si ho spustit a ovládat z příkazové řádky, což je nejjednodušší šachové
GUI.
ChessBase nativní motor ENG je přejmenovaná dynamicky linkovaná knihovna
DLL, tedy v principu součást GUI.
U 32bitových aplikací měly CB nativní navrch právě díky užšímu výkonově
vyladěnému propojení.
V době náběhu 64bitů se ovšem karta obrací.
Kdo četl pozorně bod 2. už mu asi svítá.
64 bitový UCI motor lze bez problémů spustit z 32 bitového GUI,
např. Arény, Fritze, CB9.
64 bitový CB nativní motor vyžaduje naopak i 64 bitové GUI.
Po pravdě řečeno, 64 bitový CBnativní existuje jen jeden - Zap!Chess z dubna
2006 nedávno oslavil roční výročí.
Na DVD se k němu dodávala experimentální 64bitová verze Fritz GUI takové
kvality, že na 3 počítačích ze 4 nešla vůbec spustit.
Service Pack to sice spravil, ale od té doby na to v Hamburku kašlou. Žádný nový
64 bitový program zatím není na obzoru.
Dostal jsem četné dotazy na téma PC s quadem a osmi jádry.
1. Chcete-li počítač se 4 jádry, pak jsou výhodnější normální Quady (rozmezí
6600, 2.4GHz, 6000Kč -- 6800, 2.93 GHz, 22.000 Kč).
Jednak jsou levnější samy o sobě a jednak stačí základní deska za normální cenu.
2. Chcete-li počítač s 8 jádry, pak si ale Intel dobře pohlídal, aby se
musela použít serverová technologie, která je výrazně dražší.
Procesor musejí být Xeony (rozmezí 5310, 1.6GHz, 5.500Kč -- 5355,
2.66GHz, 17.000 Kč) a také základní deska, zdroj a bedna vyjdou řádově třikrát
dráž, než u obyčejného PC.
http://www.tecchannel.de/server/prozessoren/455565/index.html
příklad 8 jádrového stroje
http://www.intel.com/design/servers/boards/s5000PSL/index.htm základní
deska Intel S5000PSL
22.10.2007
Hloubka propočtu a ELO
Plies and ELO
Gerhard Sonnabend (Loop-Support)
Loop vs Loop Tiefe Tiefe Ergebnis Elo-Diff. Zeitverbrauch vs (lt. ELO-Stat) (Faktor) ................................................................... 6 vs 5 107.0 - 33.0 (+90 =34 -16) +204 n/a ------------------------------------------------------------------- 7 vs 6 106.5 - 33.5 (+85 =43 -12) +201 n/a ------------------------------------------------------------------- 8 vs 7 99.5 - 40.5 (+75 =49 -16) +156 2.292 ------------------------------------------------------------------- 9 vs 8 101.0 - 39.0 (+77 =48 -15) +165 2.300 ------------------------------------------------------------------- 10 vs 9 96.5 - 43.5 (+61 =71 -08) +138 2.288 ------------------------------------------------------------------- 11 vs 10 97.5 - 42.5 (+69 =57 -14) +144 2.310 ------------------------------------------------------------------- 12 vs 11 90.0 - 50.0 (+54 =72 -14) +102 2.256 ------------------------------------------------------------------- Rybka vs Rybka Tiefe Tiefe Ergebnis Elo-Diff. Zeitverbrauch vs (lt. ELO-Stat) (Faktor) ................................................................... 6 vs 5 107.0 - 33.0 (+84 =46 -10) +204 1.740 ------------------------------------------------------------------- 7 vs 6 99.0 - 41.0 (+72 =54 -14) +153 1.900 ------------------------------------------------------------------- 8 vs 7 100.5 - 39.5 (+71 =59 -10) +162 1.853 ------------------------------------------------------------------- 9 vs 8 91.5 - 48.5 (+59 =65 -16) +110 1.770 -------------------------------------------------------------------
22.10.2007
Velikost hash tabulek a kN/s
Hash tables size and kN/s
Otázka na optimální velikost hash tabulek je jedna z nejčastějších.
Je fakt, že kdyby věc byla evidentní a existoval matematický vzorec nebo kdyby
to bylo maximum možné, tak by se motory prostě nastavovaly samy.
Ale neznám žádný, který by tak činil.
Dá se pozorovat, že se vzrůstající velikostí hash tabulek klesá rychlost
propočtu v kN/s.
Názorně to lze předvést ve Fritz 7, jehož FritzMark je spojen se zavedeným
motorem a reaguje na změny nastavené hash velikosti.
Dostanete třeba toto (Core2Duo 6320 with 1G RAM)
32M 1380 kN/s
256M 1334 kN/s
512M 1274 kN/s
789M 1257 kN/s
Pozor! Fritz9/10Mark už je samostatný program, který má svou hash a na změnu hash zavedeného motoru nijak nereaguje.
Proč vlastně rychlost klesá?
Především z principu hash tabulek by klesat neměla. Hash číslo, odvozené
"semletím" (hashováním) pozice totiž svou částí slouží k přímému adresování hash
tabulek, což závislost vylučuje. Hlavní příčinou shora uvedeného stavu je
pravděpodobně vnitřní paměťová cache procesoru, která je až 3x rychlejší než
RAM. No a pro malé hash tabulky se to celé odehraje v cachi, zatímco pro větší
se musí swapovat do hlavní RAM. Něco podobného, jak swapování RAM na harddisk,
když přeženete velikost hash tabulek. Ale to je dobře známo.
A protože cache u jednotlivých procesorů se liší velikostí, stupni,
strategiemi plnění, je výše popsaný jev těžko nějak exaktně postižitelný.
A konečně k tomu přispívá fakt, že v některých pozicích s transpozicemi je
pokles kN/s více než bohatě kompenzován hash efektem, v jiných bez transpozic
kompenzován není.
1. Searching in bigger hash tables does not technically consume more time.
Actually tables are not searched, but directly addressed with a part of hash
code.
2. But regardless a little reduction of kN/s is observed in praxis. The main reason is probably CPU cache swapping to main RAM in bigger hash tables size.
3. Fritz7Mark is connected with loaded engine and his hash table size,
so it can be used to demonstration of reduction of kN/s with increased hash size.
Fritz 7 (2001) it can be observed in FritzMark.
On Core2Duo 6320 with 1G RAM I have the following values
32M 1380 kN/s
256M 1334 kN/s
512M 1274 kN/s
789M 1257 kN/s
Contrariwise Fritz9/10Mark is a standalone program with his own hash tables and it is not connected with loaded engine.
Thanks to Tord Romstad (Glarung), Ernest Bonnem (Fr), Gerd Isenberg (Isichess).
http://f23.parsimony.net/forum50826/messages/174247.htm
02.12.07
Fritz benchmarky
Fritz benchmarks
Fritz benchmarky na špičkovém hardwaru v čele se 32CPU serverem HP.
Fritz benchmarks on top hardware ahead of 32CPU HP server.
http://www.jens.tauchclub-krems.at/diverses/Schach/fritz9_benchmarks.html
10.02.08
Deep Fritz benchmarky na Tom's hw
Deep Fritz benchmarks on Tom's hw
http://www.tomshardware.com/2008/02/08/intel_skulltrail_part_3/page14.html
10.02.08
Co běží pod 64 bity
What runs in Win64
http://f23.parsimony.net/forum50826/messages/178401.htm
30.03.2008
Síla Deep verze
Strength of Deep version
Vyplatí se investovat téměř dvojnásobnou částku do DeepHiarcs 12.
První zprávy hovořily o jakémsi 60 procentním zrychlení na 8 jádrech, což mi
připadalo reálné.
Ale autor měl zřejmě na mysli, že o 60 procent zlepšil efektivnost deep
algoritmu proti předchozí verzi.
Na http://www.hiarcs.com/pcuci_faq.htm#strongerMP uvádí pro Deep Hiarcs 12 skvělé hodnoty.
Na dvou jádrech (Core2Duo) účinnost 1.8, což odpovídá ELO +50.
Na čtyř jádrech (Quad) účinnost 3.0, což odpovídá ELO +90.
Na osmi jádrech účinnost 6.0, což odpovádá ELO
+130.
Pokud se to v praxi potvrdí, je to ve světě MP motorů opravdu bomba.
Děkuji Ivanu Cibiri za rychlé upozornění.
09.04.08
Hiarcs 12 MP efektivita
Po řadě rozpačitých dřívějších pokusů s Deep a MP verzemi jsem opět po delší
době zkusil měření.
Místo hyperthreadingu jsem použil plnohodnotné dva thready s Core2Duo
6320, 1G RAM.
Jako motor jsem vzal zbrusu nový Hiarcs 12 UCI MP, který má předběžnou pověst
velmi účinného "využívače" více jader.
Testoval jsem pod Win XP Pro, Fritz 11 GUI, 128M hash.
Mezi testy samozřejmě vymazány hash tabulky a také samoučící soubor hiarcs12mp.lrn,
který se v nové verzi netvoří u motoru, ale v adresáři Documents and Settings/<jméno>/Data
aplikací/Hiarcs Chess.
K testování jsem vybral dvě pozice, kde motor potřebuje k nalezení řešení desítky vteřin. Méně by vneslo systematickou chybu, delší časy nic moc nepřinášejí a zbytečně prodlužují testování.
5rk1/1r1qbnnp/R2p2p1/1p1Pp3/1Pp1P1N1/2P1B1NP/5QP1/5R1K w - - 0 1 1. Dxf7, vyřešeno je-li indikováno s hodnocením >3.00 |
r1bn1rk1/pp3p1p/6p1/2bR2N1/2B2B2/q1P1P3/2Q2PPP/4K2R w K - 0 1 1.Jxh7, vyřešeno při indikaci s hodnocením >2.00 |
||||
2 thready cca 600kN/s | 1 thread cca 300 kN/s | 2 thready cca 600kN/s | 1 thread cca 300 kN/s | ||
sec | sec | sec | sec | ||
15 | 21 | 26 | 16 | ||
14 | 21 | 16 | 16 | ||
12 | 21 | 11 | 16 | ||
12 | 21 | 37 | 16 | ||
12 | 21 | 16 | 16 | ||
14 | 21 | 15 | 16 | ||
15 | 21 | 11 | 16 | ||
11 | 21 | 13 | 16 | ||
15 | 21 | 28 | 16 | ||
27 | 21 | 12 | 16 | ||
průměr 10 měření 14,7 sec |
průměr 10 měření 21 sec | průměr 10 měření 18,5 sec | průměr 10 měření 16 sec! |
Závěry
1. Jednoprocesorový Hiarcs analyzuje "čistě", výsledky jsou téměř stoprocentně reprodukovatelné v každém průchodu.
2. DeepHiarcs naopak zřejmě využívá při rozdělování práce do značné míry
náhodné veličiny, protože výsledky i u jedné pozice kolísají.
Od skvělých časů s téměř teoreticky maximálním urychlením (11/21 sekund) až po
výsledek horší než u single verze.
3. Velmi kolísá i statistický výsledek od pozice k pozici.
Charakter obou pozic vypadá dost podobný, ale výsledek se přesto diametrálně
liší.
Zatímco v první pozici snadno opakovaně prokážete růst výkonnosti až o 40 procent,
ve druhé pozici použití dvou jader očividně spíš škodí.
Měření efektivity proto není možné provést za pár hodin otestováním
desítek pozic.
Skutečná hodnota by musela být určena měřením stovek až tisíců pozic a ještě
lépe sehráním velkého množství partií.
08.09.09
Efektivita 2 a 4 jader 2009
Efficiency of 2 and 4 threads
2009
Nová aktuální data 2009.
Zdroj CEGT Blitz 40/4 2GHz
http://www.husvankempen.de/nunn/blitz.htm
|
1CPU |
2CPU |
4CPU |
Dif1-2 |
Dif2-4 |
Dif1-4 |
Rybka 3.0x64 |
3112 |
3154 |
3196 |
42 |
42 |
84 |
Naum 4.0 x64 |
n/a |
3057 |
3095 |
n/a |
38 |
n/a |
Deep Frifz 11 |
2938 |
2975 |
3024 |
37 |
49 |
86 |
Slockfish 1.4 x64 |
2902 |
2936 |
3006 |
34 |
70 |
104 |
Zappa MX II x64 |
2911 |
2958 |
3023 |
47 |
65 |
112 |
Hiarcs 12.1 |
2841 |
2913 |
2972 |
72 |
59 |
131 |
Shredder WM Bonn |
2912 |
2948 |
3011 |
36 |
63 |
99 |
Deep Sjeng 3.0 x64 |
2861 |
2911 |
2959 |
50 |
48 |
98 |
Bright 0.4a |
2819 |
2877 |
2926 |
58 |
49 |
107 |
Loop M1 |
2817 |
2857 |
2886 |
40 |
29 |
69 |
average |
2901 |
2959 |
3010 |
46 |
51 |
99 |
Je mnoho rychlostních testů procesorů, tzv benchmarků.
Pro odhad výkonu šachových programů je samozřejmě nejvěrohodnější test, který je
založen na šachovém propočtu.
Dlouholetou klasikou je FritzMark, ale ten bohužel neumí detekovat víc než 8
jader, což v poslední době vadí.
Zajímavou náhradou je motor Fire. Následuje návod k použití.
There are a lot of CPU benchmarks.
But for estimation of chess programs' performance we need benchmarks
based on chess computing.
FritzMark is a long years classic, but unfortunately it doesn't recognize more
then 8 threads. Last time it is a serious problem.
The interesting new benchmark tool is the Fire engine.
How to use it?
1. Run Fire
Free download http://www.chesslogik.com/Fire.htm
On 64bit systems run the 64bit Fire.
You can immediately see the number of threads include hyperthreading ones.
2. Enter the command
The number is running time, here 50 second
is entered.
Press ENTER.
3. The result
After the given time the benchmark 1935 kN/s is indicated.