Ograniczanie karty graficznej przez procesor to zagadnienie, które niejedną osobę przyprawiło o ból głowy. Dla entuzjastów komputerowych jest to jeden z najważniejszych tematów, któremu poświęcają długie dni i godziny. Dziś postanowiliśmy przyjrzeć się temu zjawisku i zweryfikować kilka opinii związanych z procesorami i kartami graficznymi. Zapraszamy do testu.
Temat skalowania karty graficznej z procesorem rozwinął się tak naprawdę kilka lat temu, kiedy to grupka osób zajęła się badaniem programu Aquamark3. Aplikacja przypominająca znane 3Dmarki skupiała się na fantazyjnym benchmarku. Działanie programu było na tyle ciekawe, że aplikacją zainteresowały się media IT i duża część społeczności hardware. Sukces aplikacji opierał się na tym, że generowała ona końcowy wynik, który przedstawiał liczbę punktów uzyskanych przez procesor i kartę graficzną. Zakładano, że wynik w stosunku 2:1 (kart graficzna, procesor) w tym benchmarku informował nas o idealnym doborze części. Nie wiemy na ile wiarygodny był wynik Aqumarka ze względów czysto technicznych. Liczba używanych gier jako benchmarków w tamtym czasie była bardzo ograniczona. Co prawda pojawiały się w testach takie tytuły jak Quake III Arena, czy Halo, jednak i one nie pozwalały wysnuwać zdecydowanych wniosków potwierdzających regułę Aquamarka3. Z czasem to gry stały się wyznacznikiem wydajności, a benchmarki typu 3Dmark i Aquamark jedynie dodatkiem do artykułów i recenzji.
Jak tłumaczyć skalowanie? Ograniczeniem karty graficznej przez procesor nazywamy sytuacje w której przyrost z przesiadki na lepszą kartę jest nieadekwatny do jej wydajności lub gdy w ogóle nie zachodzi. W tym miejscu posłużymy się przykładem. Mamy dwa modele procesorów: X (gorszy) i Y (lepszy), oraz dwie karty graficzne: A (gorsza) i B (lepsza). Konfiguracja sprzętu X i A uzyskuje w pewnej grze 80 kl/s. Dokładamy znacznie lepszą z punktu widzenia technicznego kartę graficzną o oznaczeniu B. Wynik w takiej konfiguracji wyniósł 82 kl/s. Przesiadamy się na modele Y i A. Procesor z punktu widzenia technicznego znacznie wydajniejszy od modelu X, karta graficzną A to model słabszy. Konfiguracja uzyskuje 85 kl/s. Krok drugi to montaż karty B. Wynik w konfiguracji Y-B to 100 kl/s. Wniosek nasuwa się jeden – karta B w konfiguracji z procesorem X jest przez niego ograniczana. Niestety jest to przypadek czysto abstrakcyjny, gry rządzą się swoimi prawami – doborem rozdzielczości, liczbą efektów, większym lub mniejszym wpływem procesora lub karty graficznej na wydajność.
W dzisiejszym teście postanowiliśmy połączyć dwa testy w jeden wspólny. Pierwszy to oczywiście badanie skalowania. Drugim testem, ale równie ważnym będzie ukazanie wydajności Phenoma II X4 na tle Athlona II X4 . W tej części chcemy spojrzeć na sens inwestycji w droższy układ AMD i pracę trzeciego poziomu pamięci podręcznej. Pokażemy Wam kiedy i czy w ogóle warto inwestować w Deneba.
Deneb i Propus
Deneb
Do naszej redakcji trafiły dwa modele procesorów AMD. Pierwszym z nich jest Phenom II X4 955 w rewizji C3 z jądrem Deneb. Jest to jeden z najpopularniejszych układów czterordzeniowych firmy AMD taktowany zegarem 3,2 GHz. Został wykonany w 45nm procesie technologicznym, maksymalny pobór mocy procesora nie przekracza 125 watów. AMD zaopatrzyło Deneba w 2 MB pamięci podręcznej drugiego poziomu z czego 512 kb przypada na każdy rdzeń procesora. Do tego dołożono 6 MB pamięci podręcznej trzeciego poziomu.
Propus
Drugim otrzymanym modelem jest Athlon II X4 630 z jądrem Propus. Procesor taktowany jest zegarem 2,6 GHz. Został wykonany w 45nm procesie technologicznym, podobnie jak Phenom, a maksymalny pobór mocy nie przekracza 95 watów. AMD wyposażyło Athlona w 2 MB pamięci podręcznej drugiego poziomu z czego po 512 kb przypada na każdy rdzeń jednostki. W przeciwieństwie do Deneba, nie znajdziemy tu pamięci podręcznej trzeciego poziomu.
Pamięć cache L3
Procesory K10, czy jak kto woli K10.5 skupiają się tak naprawdę na dwóch architekturach. Deneb i Propus były wyjściowymi jądrami do utworzenia takich jednostek jak Athlon II X2 (Regor), Athlon II X3 (Rana), Phenom II X2 (Callisto), Phenom II X3 (Heka). Fizycznie AII X3, PII X2, PII X3 możemy nazwać jednostkami Deneba, czy Propusa. Każdy z wymienionych procesorów posiada ukryty rdzeń/rdzenie, który możemy odblokować za pomocą funkcji ACC, lub w nowszych płytach za pomocą programów typu UCC. Czym właściwie różni się Deneb od Propusa? W 90-procentach są to te same jednostki, w takim razie czym jest te 10-procent? Jest to pamięć cache trzeciego poziomu. Ogólna zasada działania pamięci podręcznej jest prosta. Zintegrowana w procesorze ma przyspieszyć wymianę i dostęp do danych pomijając stosunkowo wolną pamięć RAM. Kontroler cache stanowi bramę dla danych pochodzących z procesora i komunikuje się z samą pamięcią podręczną, aby uzyskać do nich jak najszybszy dostęp. Rozmiar pamięci cache ma wpływ na ilość przechowywanych informacji. Poziom L1 z zasady najmniejszy, ale najbliższy procesorowi skupia w sobie najważniejsze instrukcje i dane wykonywanych operacji. Dlaczego tak ważna jest budowa piramidy w postaci cache? Pamięć podręczna dzięki swej dwu-lub trzy poziomowej budowie może skupiać ogromną ilość danych bez potrzeby dostępu do pamięci RAM. Poziomy L2 i L3 w procesorach są zazwyczaj dzielone na każdy rdzeń. Pamięć podręczna L2 i L3 gromadzi dane, które zostały już wykorzystane/wykonane w danej chwili. Te, które jeszcze nie znajdują się w pamięci podręcznej wędrują nieco dłuższą drogą m.in. spotykają się z kontrolerem pamięci i samym RAM-em, by trafić wreszcie do L2. Zastosowana pamięć L3 to trzeci poziom naszej piramidy. Właściwie po co nam pamięć podręczna trzeciego poziomu? Ilość wykonywanych operacji w układach wielordzeniowych jest tak duża, że w pewnym momencie procesor mówi: „chce jeszcze”. W tym momencie do gry wchodzi poziom L3. Rola trójki sprowadza się do roli strażnika cache przed wyruszeniem danych w długą drogę po dane zawarte w pamięci RAM o dużych opóźnieniach, które nie znalazły miejsca w znacznie szybszym cache. W tym teście postanowiliśmy sprawdzić na ile ważna jest pamięć cache trzeciego poziomu w grach 3D, jak również to, czy Deneb nie podszywa się pod Propusa.
Wybór karty
Jest on dość kontrowersyjny. W zestawieniu nie ujrzycie żadnej karty graficznej ze stajni nVidii. Zdecydowaliśmy się na taki, a nie inny wybór z dwóch powodów. Skupienie się na kartach jednego producenta pozwoli nam na łatwiejsze i precyzyjniejsze obliczenie różnic pomiędzy procesorami AMD. Sądzimy, że wybraliśmy trzy karty z różnych segmentów cenowych, które ponadto są często wybierane do tworzenia komputera z platformą AM3. Drugim argumentem był czas, który nieustannie nas gonił w związku z premierą APU Llano i trafieniu tego produktu na półkę sklepową. Chcieliśmy, aby nasz artykuł mógł jeszcze wpłynąć na kupno procesorów K10 zanim zostaną one wycofane ze sprzedaży. Między innymi, dlatego nie rozszerzaliśmy testu o większą liczbę kart graficznych – w tym innego producenta chipów.
Właściwości/Model
PowerColor Radeon HD 4770
XFX Radeon HD 5830
Sapphire Radeon HD 5850 Xtreme
Proces technologiczny
0.40nm
0.40nm
0.40nm
Liczba tranzystorów
826 mln
2150 mln
2150 mln
Liczba SP
128
224
288
Liczba ROP
16
16
32
Liczba TMU
32
56
72
Taktowanie rdzenia
750 MHz
800 MHz
725 MHz
Taktowanie pamięci
3200 MHz (efektywnie)
4000 MHz (efektywnie)
4000 MHz (efektywnie)
Ilość pamięci
512 MB
1024 MB
1024 MB
Przepustowość
51,2 GB/s
128 GB/s
128 GB/s
Możemy zdradzić, że przy planowaniu tego testu próbowaliśmy się ograniczyć do dwóch GPU: osobistego HD 4770 oraz HD 5830 firmy XFX. Splot szczęśliwych wydarzeń spowodował, że nasze testy rozszerzyliśmy o kartę firmy Sapphire HD 5850 Xtreme. Otrzymaliśmy, więc zestaw trzech kart z różnych segmentów wydajnościowych.
Platforma testowa, metodologia testów
Sprzęt
Model
Płyta główna
MSI 770-G45, bios ver. 10.7
Pamięć RAM
3 GB GoodRAM 1333 MHz, CL9
Dysk twardy
Samsung Spin Point F1 250GB 8MB
Chłodzenie
Antec Kuhler 620
Obudowa
Tacens Sagitta LUX
Monitor
Samsung B550
Zasilacz
XFX Core 550W
Do testów postanowiliśmy wykorzystać jedne z najpopularniejszych gier ostatnich kilku lat. Na pewno wielu z Was ucieszy pozycja Wiedźmina 2, który posłużył jako jeden z benchmarków. Użyte gry:
Battlefield Bad Company 2
Crysis Warhead
Colin McRae: Dirt 2
Far Cry 2
Metro 2033
Resident Evil 5
Wiedźmin 2
World in Conflict
Testy przeprowadziliśmy w następującej kolejności:
Athlon II X4 630 + HD 4770 > Phenom II X4 955 + HD 4770 > Athlon II X4 630 + HD 5830 > Phenom II X4 955 + HD 5830 > Athlon II X4 630 + HD 5850 > Phenom II X4 + HD 5850
Taktowania obu procesorów były równe i w czasie testów wynosiły 3.0 GHz.
Sterowniki:
ATI Catalyst 11.6
System operacyjny:
Windows 7 Ultimate 32-bit.
Wybór rozdzielczości wiążę się ze skalowaniem karty graficznej. W najniższej rozdzielczości – czyt. 1280×1024 wydajność w dużej mierze zależy od możliwości procesora. Wraz ze wzrostem rozdzielczości obliczanie zadań jest przekierowywane na układ graficzny. Ponadto jesteśmy pewni, że wybraliśmy ustawienia preferowane przez większość graczy. Na wszystkich wykresach umieściliśmy średnią ilość klatek/sek.
Wydajność procesora
Zaczęliśmy od testu w kultowym Battlefield Bad Company 2.
W 1280×1024 zarysowuje się wyraźna przewaga Phenoma, co ciekawe zmiana karty graficznej z HD 5830 na HD 5850 nie powoduje przyrostu klatek/sek. Analogiczna sytuacja występuje w dwóch pozostałych rozdzielczościach.
Colin McRae: Dirt 2
CM: Dirt 2 jest świetnym przykładem gry w której większa część obliczeń przypada karcie graficznej. Zarówno po przesiadce z HD 4770 na HD 5830 jak i z HD 5830 na HD 5850 odnotowujemy wyraźny przyrost FPS. Warto zauważyć, że wraz ze wzrostem rozdzielczości zacierają się różnicę pomiędzy procesorami.
Crysis Warhead
Kontynuacja gry Crysis. Jest to pierwszoosobowa gra akcji, wydana przez studio Crytek. Postanowiliśmy go włączyć do testu ze względu na wymagania, które stawia zarówno przed kartami graficznymi i procesorami. Test przeprowadziliśmy za pomocą zewnętrznego benchmarka.
Athlon i Phenom uzyskują identyczne wyniki z kartą HD 4770 w trybie mainstream i gracz. Sprawa nabiera barw wraz ze zmianą karty graficznej na HD 5830. Przy zastosowaniu mocniejszego GPU Deneb jest wydajniejszy średnio o 20% od Propusa. Przesiadka na Radeona HD 5850 potwierdza nasze przypuszczenia dotyczące cache trzeciego poziomu – w tej grze jest to element bardzo potrzebny.
Far Cry 2
Druga część Far Cry 2 przenosi nas z dżungli pierwszej części na afrykańską sawannę. Gra zbudowana została na wymagającym silniku graficznym, który wykorzystuje dwie biblioteki DirectX’a – 9 i 10. Test przeprowadziliśmy za pomocą wbudowanego benchmarka.
Kolejna gra w której HD 4770 blokuje obydwa układy CPU. Zmiana karty graficznej na HD 5830 ukazuje potencjał Athlona II i Phenoma II. Ten drugi wychodzi zwycięsko z tego pojedynku. Trzecia karta – HD 5850 nie wpływa istotnie na wydajność w parze z Athlonem II, który blokuje jej możliwości. Na Phenomie II 955 odnotowaliśmy 10-procentowy zysk wydajności w porównaniu do konfiguracji z HD 5830.
Metro 2033
Zagłada nuklearna, świat w ciemnościach, jedyną ścieżką przeżycia jest rosyjskie metro. Niezwykle ciekawa gra o wysokich wymaganiach sprzętowych. Wykorzystuje m.in. zaawansowaną tessalację, tryby SSAO i HBAO. Test przeprowadziliśmy w zewnętrznym benchmarku.
Metro 2033 pogrąża swoimi wymaganiami HD 4770. Karta w trybie medium i very high nie jest w stanie osiągnąć progu płynnej gry. Zmiana karty graficznej na XFX Radeon HD 5830 i wydajność rośnie, aż miło popatrzeć. Próg płynnej gry został przekroczony w rozdzielczości 1280×1024 na detalach „very high” oraz we wszystkich rozdzielczościach na detalach „medium”. Najwydajniejszy model karty graficznej testowany w artykule – HD 5850 nie ma problemu z przekroczeniem poziomu 25 kl/s. Procesory prezentują podobny poziom wydajności, a jedyną odskocznią od tego jest test na detalach „medium” z kartą HD 5850, gdzie Deneb uzyskuje o 2-3 kl/s lepszy wynik od Propusa.
Resident Evil 5
Phenom II zaczyna odskakiwać Athlonowi II w momencie zmiany GPU na HD 5830. Na HD 5850 przewaga Phenoma zarysowuje się coraz mocniej.
Wiedźmin 2
Przyszedł czas na perłę w koronie wśród wszystkich testowanych gier. Kontynuacja przygód Geralta z Rivii to kwintesencja grafiki w grach RPG. Jakie wyniki osiągnął nasz sprzęt podczas testów w grze znad Wisły? Spójrzmy.
Wiedźmin jest specyficzną grą pod względem wymagań sprzętowych. Phenom i Athlon nie pozwalają kartom (HD 5830, HD 5850) pokazać swojej prawdziwej mocy obliczeniowej, stąd takie, a nie inne rezultaty. Wyniki we wszystkich rozdzielczościach są do siebie zbliżone i co najważniejsze zapewniają płynną rozgrywkę.
World In Conflict
To typowy przedstawiciel gier typu RTS. Posiada ciekawy, wbudowany benchmark, który pozwolił nam na przeprowadzenie testu w kilku ustawieniach.
Wyniki w WiC przypominają nam te, które zaobserwowaliśmy przy grze Far Cry 2. Otóż Athlon II wyraźnie blokuje HD 5850 i nie jest w stanie ukazać jej pełnego potencjału w przeciwieństwie do Phenoma II, którego wydajność po przesiadce z HD 5830 wzrosła o kilka kl./sek. w każdej rozdzielczości.
Minimalna ilość klatek/sek.
W tym teście posłużyliśmy się grami w których dostrzegliśmy różnicę w minimalnej ilości klatek/sek. pomiędzy dwoma procesorami.
Crysis Warhead już wcześniej okazał się wymagającą grą dla procesora bez pamięci cache poziomu trzeciego. W tym przypadku, minimalny FPS jest adekwatny do różnic w średniej liczbie klatek/sek.
W Far Cry 2 jedyną różnicę zaobserwowaliśmy w rozdzielczości 1280×1024 na karcie HD 5850.
Sytuacja analogiczna do tej z gry Far Cry 2.
Wpływ AA i AF na wydajność procesorów
Sprawdziliśmy również wpływ efektu wygładzania krawędzi i filtrowania anizotropowego na wydajność procesorów.
Wyłączenie AA i AF ma wpływ na wydajność pomiędzy procesorami w przypadku zastosowania ich z kartami HD 4770 i HD 5830. Na HD 5850 różnicę pozostają mniejsze lub są takie same jak z włączonym AA i AF.
Po wszystkich zaprezentowanych testach procesorów przyszedł czas na wnioski:
Procesor: Athon II i Phenom II są tak samo wydajne przy kartach pokroju HD 4770 – czyli HD 4850, HD 5750, GTS 250, 8800GTS. Dopłacanie do CPU z L3 mija się z celem.
Phenom II okazuje się o około 9-procent wydajniejszy od Athlona II w rozdzielczości 1280×1024 z kartą HD 5830.
W uśrednieniu Phenom II z HD 5830 jest wydajniejszy od Athlona II i HD 5830 o 6-procent.
Athlon II w większości gier blokuje HD 5850.
Największą różnice pomiędzy procesorami zanotowaliśmy w benchmarku Crysis Warhead w rozdzielczości 1280×1024 na detalach mainstream – sięgnęła ona 16-procent na korzyść Phenoma.
Skalowanie kart graficznych
Wielu z Was na pewno stawia przed sobą pytanie, czy Athlon II i Phenom II są procesorami, które ograniczają wydajne karty graficzne pokroju HD 5850. Z myślą o Was przygotowaliśmy odrębne wykresy, które przedstawiają porównanie wszystkich kart graficznych w parze z Athlonem i Phenomem.
Athlon II X4 630 Phenom II X4 955
Kliknij na obrazek, aby go powiększyć.
Średni przyrost na Athlonie II w związku ze zmianą karty graficznej z HD 5830 na HD 5850 wyniósł 7,8-procent. Mało, zważając na poniesione koszta inwestycji w wydajniejszą kartę graficzną. Sytuacja poprawia się wraz z użytkowaniem Phenoma II, gdzie odnotowaliśmy zysk wydajności na poziomie 12-procent.
Athlon II X4 630 Phenom II X4 955
Kliknij na obrazek, aby go powiększyć.
Po wynikach w rozdzielczości 1680×1050 wnioskujemy, że coraz większa praca obliczeniowa spoczywa na układzie graficznym. Przyrost wynikający z przesiadki z HD 5830 na HD 5850 jest widoczny w przypadku obydwu procesorów.
Athlon II X4 630 Phenom II X4 955
Kliknij na obrazek, aby go powiększyć.
W 1920×1080 wydajność obu konfiguracji widocznie się poprawia. Zestaw PII i HD 5850 zyskuje po przesiadce z HD 5830 około 14-procent, a AII i HD 5830 ponad 11,5-procent.
Zmiana karty graficznej z HD 5830 na HD 5850 daje wyraźny zysk osiągów przy procesorze PII X4 955. W większości naszych benchmarków przyrost wydajności waha się od 10 do 20%. Gorzej jest w przypadku Athlona, który w 1280×1024 i 1680×1050 w wyraźny sposób blokuje HD 5850. Wydajność pary AII, HD 5850 jest mizerna i nieopłacalna jeśli popatrzymy na możliwości i cenę HD 5830.
Podsumowanie
Na koniec troszkę o samych wynikach w teście. Po pierwsze: czy nas zaskoczyły? Z jednej strony tak, z drugiej nie. Na pewno nie spodziewaliśmy się tak słabego przyrostu wydajności w parze Athlon II i HD 5850. W wielu grach nie doświadczyliśmy żadnej różnicy po zmianie karty na wydajniejszy model, a jeżeli już taką zaobserwowaliśmy stanowiła ona minimalny procent przyrostu wydajności. Kolejnym zaskoczeniem były wyniki obu procesorów w parze z Radeonem HD 4770. Karta nie była w stanie zapewnić odpowiedniej mocy obliczeniowej Phenomowi II, co sugerowało, że dopłata do lepszego CPU będzie nieopłacalna.
Pisząc zdanie: „z drugiej strony wyniki nas nie zaskoczyły” chodziło nam o przeczucia, które mieliśmy w stosunku do L3. W testach wykazaliśmy, że pamięć podręczna trzeciego poziomu pomaga w grach 3D, a szczególnie w tych, gdzie wydajność procesora liczy się najbardziej (Crysis Warhead).
Pewne jest twierdzenie, że Athlon II X4 i Phenom II X4 to udane jednostki, które interesują już od kilku dobrych lat sporą część osób lubujących wydajne procesory za stosunkowo niską cenę. Dzisiejszy artykuł miał na celu rozpoczęcie cyklu testów o temacie skalowania kart graficznych z procesorem. Wspólnie z Wami – czytelnikami, uznaliśmy że jest to jeden z najciekawszych tematów dzisiejszego świata IT. Zaczęliśmy od starych i dobrze znanych Phenomów i Athlonów II. Mamy nadzieję, że już niedługo rozpoczniemy dalszą realizacje tematu, opartą o coraz to większą ilość procesorów – SB, Llano, Bulldozer oraz kart graficznych – GTX 5XX, HD 68XX, HD 7XXX. Z niecierpliwością czekamy na Wasze pomysły i komentarze dotyczące cyklu artykułów o skalowaniu.
Wierzymy, że po tym artykule wybór procesorów K10.5 nie będzie przysłowiową drogą przez mękę, a jedynie chwilą zastanowienia i przemyślenia nad doborem odpowiedniej jednostki do karty graficznej. Mała rada: wybór procesora i karty graficznej łączcie z rozdzielczością w której zamierzacie grać. Jest to klucz do osiągnięcia jak najlepszej wydajności.
Dziękujemy za wypożyczenie kart graficznych firmom:
Dziękujemy za wypożyczenie procesorów, zasilacza oraz dysku twardego firmie:
Komentarze
Kurczę, tyle pracy, tyle istotnych informacji i ani jednego komentarza? ;/
Dziękuje za docenienie pracy. Komentarze i zapytania były, ale wyłącznie w postaci prywatnych wiadomości via gg.
bardzo ciekawe. Chetnie przeczytam o roznicach pomiedzy pentium g, i3 a i5 na lga 1155