Grafikkort

Grafikkort

Grafikkretsen har alltid funnits i den moderna datorn men dess funktion är inte densamma idag som för drygt tio år sedan. Till en början var den i princip en renodlad digital-till-analog-konverterare (förkortas DAC), precis som ljudkortet. Då var grafikkortets respektive ljudkortets uppgifter att omvandla ettor och nollor till analog synlig bild och hörbart ljud. Idag fyller grafikkortet en allt större funktion och är en avlastning för processorn i 3D-spel, avancerade bildbehandlingsprogram samt vid uppspelning av film i hög upplösning.

En specifikation för ett grafikkort kan se ut på följande sätt.

Nvidia GTX 1080

  • 8 GB minne
  • PCI-express x16 (3.0)
  • GDDR5X
  • DVI, HDMI, Displayport x3
  • GPU-hastighet: 1607 MHz
  • Minnesbandbredd: 256-bit
GTX 1080 har 8 GB minne
GTX 1080 har 8 GB minne

Det finns en uppsjö av olika grafikkort. De två största tillverkarna av diskreta (fristående) grafikkretsar är Nvidia med sina Geforce-kort och AMD med sina Radeon-kort. De olika kretsarna skiljer sig mer eller mindre från varandra. Det är oftast svårt att jämföra två modeller då det är många faktorer som spelar in för hur väl de presterar. Detta kapitel kan ge en hjälp på vägen.

PCI-express (PCIe)

Den nu gällande anslutningstypen för grafikkort är PCI-express (PCIe). Föregångarna PCI och AGP användes tidigare till grafikkort, men de har sedan länge ersatts av PCI-express. PCI är mycket långsammare än PCI-express och används därför bara till tilläggskort som till exempel ljudkort och TV-kort. På sikt kommer PCI även sluta användas för de nämnda tilläggskorten. AGP är också mycket långsammare än PCI-express och har försvunnit helt från den moderna datorn.

PCI-express-kort och -socklar finns i olika varianter där de vanligaste är PCI-express x1 och PCI-express x16. Det är lätt att se skillnad på dem eftersom de är olika långa. PCI-express x16-versionen är den enda varianten som används för grafikkort. PCI-express x1 är i stället tänkt som ersättare till PCI-anslutningen. Observera att PCI-express inte är samma anslutning som PCI-X. Den sistnämnda anslutningen användes förr i serversammanhang och har olyckligtvis ett liknande namn. 

PCI-express x1- och PCI-express x16-sockel på moderkort.
PCI-express x1- och PCI-express x16-sockel på moderkort.

Den ursprungliga PCI-express-versionen används relativt sällan idag. I skrivande stund är det PCI-express 2.0 och PCI-express 3.0 som gäller. PCI-express 2.0 är dubbelt så snabb gamla PCI-express och dess­utom både framåt- och bakåt­kompatibel. Anslutningarna är likadana, så att PCI-express-kort och -socklar av olika generationer fungerar med varandra (undantag finns men de är ovanliga).

PCI-express 3.0 ökar hastig­heten ytter­ligare. PCI-express 2.0 klarar ungefär 500 MB/s och PCI-express 3.0 klarar ungefär 1 GB/s. Det är dessa hastigheter som PCI-express x1-kort kan nå när de sätts i PCI-express x1-socklar. Grafikkort använder som tidigare nämnt PCI-express x16-sockeln (16 PCI-express-banor), vilket gör att de kan överföra data i upp till i upp till hela 32 GB/s (samman­lagt för båda riktningarna).

Obs! PCI-express 3.0-tekniken är både framåt- och bakåtkompatibel. Det innebär att ett gammalt kort kan sättas i en modern sockel och då kommer kortet att kommunicera med sin maximala hastighet. Sätts ett modernt kort i en gammal sockel kommer sockeln att strypa kortets hastighet till den som sockeln är gjord för.

De interna socklarna för PCI-express-kort är snillrikt utformade. Exempelvis kan ett kort med PCI-express x1-anslutning (t.ex. ett USB 2.0-kontrollerkort) eller PCI-express x4-anslutning (t.ex. ett USB 3.0-kontrollerkort) sättas i en PCI-express x16-port. Det kommer att se lite konstigt ut eftersom stora delar av sockeln inte används, men trots detta fungerar det.

På moderkort sitter ofta flera fysiska PCI-express x16-socklar, även om de i själva verket inte kan leverera full x16-hastighet. På moderkortet på den kommande bilden finns tre fysiska PCI-express x16-socklar. Den översta klarar full hastighet (16 banor), den mellersta klarar halv hastighet (8 banor) och den nedersta klarar en kvarts hastighet (4 banor). Detta framgår av moderkortsmanualen. På grund av denna skillnad är det viktigt att grafikkortet sätts i den översta PCI-express x16-sockeln.

Moderkortet har tre fysiska PCI-express x16-socklar men bara en av dem klarar full hastighet.
Moderkortet har tre fysiska PCI-express x16-socklar men bara en av dem klarar full hastighet.

Grafikprocessorn

Grafikprocessorn, även kallad GPU:n, är den centrala komponenten på grafikkortet (likt processorn för hela datorn). Den kan ha olika antal kärnor och vara olika snabb. Hastigheten mäts i MHz och kallas klockfrekvens.

Precis som med datorprocessorn (CPU:n) spelar arkitekturen en stor roll. En gammal grafikprocessor med högre klockfrekvens och fler kärnor är ofta sämre än en modern grafikprocessor med lägre klockfrekvens och färre kärnor.

Nvidia

Nvidia uppkallar sina processorarkitekturer efter kända fysiker. I början av 2017 baserades majoriteten av deras grafikprocessorer på arkitekturen Pascal. Föregångaren till Pascal hette Maxwell och Maxwells föregångare hette Kepler. Nvidia namnger i sin tur sina grafikprocessorer efter vilken arkitektur de bygger på. Grafikprocessorn i Geforce GTX 1070 heter GP104, där bokstaven P indikerar att det är en Pascal-processor. Grafikprocessorn i Geforce GTX 970 heter GM204, där bokstaven M på samma sätt indikerar att det är en Maxwell-processor. 

Gårdagens, dagens och morgondagens GPU-arkitekturer från Nvidia.
Gårdagens, dagens och morgondagens GPU-arkitekturer från Nvidia.

Grafikprocessorns namn brukar sällan användas i marknadsföring. Då används i stället marknadsnamnet på grafikkortet, till exempel Geforce GTX 1070. De två första siffrorna (eller den första siffan om marknadsnamnet är tresiffrigt) indikerar vilken generation grafikkortet tillhör. De två sista indikerar grafikkortets relativa prestanda inom generationen. Som exempel är GTX 1070 bättre än 1060, och GTX 1060 bättre än GTX 1050. Jämförelsen kan endast göras inom samma generation. Nvidia använder också ibland beteckningen ”Ti”, till exempel Geforce 1050 Ti, som indikerar att kortet är en kraftfullare variant av samma kort.

Obs! En ny grafikkortsgeneration innebär inte per automatik att en ny processorarkitektur börjat användas. Nvidia har en lång historia av att fortsätta med gamla processor­arkitekturer trots att de byter grafikkortsgeneration.

Ytterligare en indikation på hur kraftfullt ett Nvidia-grafikkort är visas på antal Cuda-kärnor. Ju fler Cuda-kärnor, desto fler beräkningar kan grafikprocessorn utföra samtidigt. Denna jämförelse kan endast göras inom samma generation.

Grafikkortsnamnets inledande bokstäver indikerar också vilken prestandanivå grafikkortet tillhör. Ett instegskort saknar inledande bokstäver i sitt namn eller inleder sitt namn med enbart bokstaven G. Mellanstegsgrafikkort har namn som börjar på GT eller GTS. Riktiga värstinggrafikkort har namn som börjar på GTX.

AMD

AMD kallar sin processorarkitektur GCN (Graphics Core Next). GCN finns i fyra generationer, där den senaste heter Arctic Islands och föregående generation Volcanic Islands. AMD har tyvärr inte ett lika tydligt namnschema för sina grafikprocessorer som Nvidia. Fram till senaste generationen namngavs grafikprocessorerna efter öar (t.ex. Öland och Fiji). De två senaste grafikprocessorerna (juli 2017) heter Polaris 20 och 21. Kommande arkitektur från AMD heter Vega.

AMD:s arkitekturer.
AMD:s arkitekturer.

AMD har ett lite annorlunda namngivningssystem än Nvidia. Deras grafikkort heter exempelvis Radeon R7 370. Den första siffran efter bokstaven R indikerar vilket prestandasegment grafikkortet tillhör. Ju högre siffran är, desto högre prestandasegment tillhör kortet (t.ex. är Radeon R7 bättre än Radeon R5). I de två senaste generationerna har siffran ersatts av ett ”X” för det högsta prestandasegmentet (t.ex. RX 570). Den första siffran i det tresiffriga namnslutet syftar på generationen. De två sista siffrorna i det tresiffriga namnslutet syftar på den inbördes prestandaordningen.

Även AMD blandar arkitekturer inom samma grafikkortsgeneration. I Radeon 400-serien är det endast RX-korten (t.ex. RX 470) som bygger på senaste arkitekturen.

I stället för Cuda-kärnor använder AMD Stream-processorer. Regeln är densamma som för Cuda-kärnor: ju fler Stream-processorer desto fler beräkningar kan grafikkortet utföra samtidigt. Denna jämförelse kan endast göras inom samma generation.

Varianter av samma grafikkort

Till skillnad från de vanliga datorprocessorerna som säljs direkt till konsument under tillverkarnas egna varumärken (Intel och AMD), tillverkar Nvidia och AMD sällan egna grafikkort. De tillverkar processorerna och visar referenskort som grafikkorts­tillverkarna sedan får utgå ifrån. Korten finns därför i många olika utföranden där bland annat valet av minne, kylare och bildskärmsanslutningar skiljer sig. Vissa tillverkare väljer exempelvis att ha en extra HDMI-port och prioriterar bort Displayport-anslutningen. Andra byter ut en liten kylfläns med fläkt mot en stor kylfläns utan fläkt.

Asus RX 580 Strix Top och MSI RX 580 Gaming X Plus är varianter av samma grafikkort (RX 580).
Asus RX 580 Strix Top och MSI RX 580 Gaming X Plus är varianter av samma grafikkort (RX 580).

Grafikminnet

Minnet på grafikkortet är en annan sak som skiljer mellan olika grafikkortsmodeller. Grafikprocessorns jobb är att avlasta den vanliga processorn med det grafiska arbetet. I stället för att låna minnesutrymme av det vanliga RAM-minnet har den sin egen motsvarighet. Det minnet kan variera i både storlek och hastighet.

Grafikkortstillverkarna brukar framhäva storleken på minnet. De lyfter däremot inte fram hastigheten eller bandbredden på samma sätt. Det är ganska viktigt att också leta upp denna information för att veta hur bra minnet egentligen är. Ett stort minne är givetvis en fördel eftersom det kan hantera mer data, men grafikprocessorn måste också kunna komma åt det snabbt.

Storleken

Vilken storlek på grafikminne som används varierar mycket, men standardgrafikkort brukar idag ha 2 GB till 4 GB medan prestandamodellerna har 8 GB eller mer. Informationen som lagras i minnet är exempelvis texturerna som används i spelet. Precis som med fotografier är högupplösta texturer mer detaljerade och tar mer plats. Ju större minne grafikkortet har, desto mer högupplösta kan texturerna vara. Ett stort grafikminne är alltså viktigare ju högre upplösning den inkopplade skärmen/skärmarna har.

Hastigheten

Precis som med RAM-minnen går det att få olika hastigheter på grafikkortets minnen. Enklare grafikkort använder sig ofta av DDR3-minnen medan de flesta grafikkort idag använder sig av GDDR5 som är betydligt snabbare.

Prestandakort använder sig av GDDR5X, som är en vidareutveckling av GDDR5. Det börjar även dyka upp kort med en helt ny minnesteknik: HBM. HBM är både snabbare och mer strömsnålt än GDDR5.

Minnets hastighet skrivs sällan ut, utan i stället brukar minnets så kallade data rate specificeras. Det motsvarar den dubbla klockfrekvensen eftersom moderna minnes­kretsar använder DDR-tekniken och därför kan behandla data två gånger på samma klockcykel. Mer om detta finns att läsa här.

Bussbredden

Bussbredden som anges i antalet bit kan också skilja. Tänk på grafikprocessorn och grafikminnet som två städer, vilka är förbundna med en motorväg. Antalet bilar som hinner köra däremellan under en bestämd tid beror på två saker: dels vilken hastighet som gäller och dels hur många filer vägen har. Två motorvägar med samma hastighets­gräns kan hantera olika många bilar om den ena har fler filer än den andra.

Två filer & hastighet 110 km/h. Upp till 18 bilar.
Två filer & hastighet 110 km/h. Upp till 18 bilar.
Fyra filer & hastighet 110 km/h. Upp till 36 bilar.
Fyra filer & hastighet 110 km/h. Upp till 36 bilar.

Bussbredden kan exempelvis vara 256-bit (i liknelsen 256 filer) men här brukar de allra enklaste korten spara in. Även om två modeller har lika snabbt minne kan det ena (teoretiskt) hantera dubbla mängden data på samma tid. Detta eftersom ”motorvägen” är dubbelt så bred.

Cuda och OpenCL

GPGPU står för General Purpose computing on Graphics Processing Units. Som det hörs på namnet har det att göra med att utföra traditionella processoruppgifter med grafikprocessorn. Nvidias Cuda (Compute Unified Device Architecture) och öppna OpenCL är exempel på sådana tekniker.

GPGPU-teknikerna ser till att grafikkortet kan behandla både vanlig programkod och grafik­kod (i stället för enbart grafik). Detta gör det möjligt för program som stöder GPGPU att arbeta snabbare, eftersom de kan använda både den vanliga processorn och grafik­processorn för sina beräkningar. De två processortyperna är bra på olika saker, och genom att dra nytta av båda processorerna får programmen det bästa ur två världar. Till exempel kan Adobe Creative Cloud (där bland annat Photoshop och Premiere Pro ingår) dra nytta av GPGPU-funktioner för att ge högre prestanda. Det är praktiskt för att exempelvis kunna exportera video snabbare.

Ett annat exempel där GPGPU-teknik kommit till stor nytta är vid utvinning av den populära kryptovalutan Bitcoin. Processen för att utvinna Bitcoins passar perfekt för ett grafikkort att utföra med hjälp av exempelvis OpenCL.

SLI och Crossfire

För ännu högre spelprestanda kan vissa moderkort ha flera grafikkort installerade. Denna teknik kallas SLI eller Crossfire beroende på om det är Nvidia eller AMD som ligger bakom. Tekniken går ut på att låta två eller fler likadana grafikprocessorer jobba tillsammans för att åstadkomma en ännu mer detaljerad eller mer frekvent uppdaterad bild. Detta kan göras genom att låta korten uppdatera bilden om vartannat eller låta dem ta hand om halva bilden var. Det ger en prestandaökning, men den är inte lika stor som om de två grafikkortens individuella prestanda hade adderats rakt av.

En vanlig missuppfattning är att grafikkortens minne adderas med flera grafikkort. Så är inte fallet. Två grafikkort med 4 GB minne var ger 4 GB effektivt grafikminne i en SLI- eller Crossfire-konfiguration.

Strömförbrukning

Ett kraftfullt grafikkort är alltid en fördel i gamingsammanhang. Tänk dock på att kraftfulla grafikkort drar mycket ström. I takt med att strömförbrukningen ökar gör värmeutvecklingen det också. Det leder till att kortet måste ha en effektiv kylare. Fundera därför först över vad datorn ska användas till och välj därefter ett passande grafikkort.

Dagens prestandagrafikkort behöver separat strömmatning. Den vanligaste kontakten för detta kallas PCI-express-power och har sex eller åtta poler fördelat på två rader. Om nätaggregatet saknar anslutningen går det att använda en adapter. Däremot måste alltid effekterna jämföras före inkoppling. Om grafikkortet kräver mer ström än vad nätaggregatet kan leverera kommer det inte att fungera. Många grafikkortstillverkare skriver ut ett ungefärligt värde för hur kraftigt nätaggregat en standarddator med det aktuella grafikkortet behöver.

Adapter mellan 4-pin Molex-kontakter och PCI-express-power-kontakten
Adapter mellan 4-pin Molex-kontakter och PCI-express-power-kontakten.

Obs! Vid användning av en adapter från två 4-pin Molex-kontakter bör Molex-kontakterna kopplas till uttag som sitter på varsin ledning från nätaggregatet (i stället för två kontakter som sitter på samma ledning).

Om två grafikkort ska strömförsörjas (SLI eller Crossfire) bör nätaggregatet också ha stöd för det. Då finns det flera PCI-express-power-kontakter och nätaggregatet är ofta märkt med exempelvis Nvidia SLI Ready

Att jämföra olika grafikkortslösningar

Utvecklingen på grafikkortsmarknaden går i en rasande fart. Denna bok ger inga modell­specifika rekommendationer när det gäller val av grafikkort eftersom sådana råd hade blivit föråldrade väldigt snabbt. För att hitta grafikkortet som är det mest ändamålsenliga i aktuellt dagsläge rekommenderar vi i stället nättidningarna som löpande testar grafikkort och aviserar nyheter:

  • Sweclockers (www.sweclockers.com)
  • Nordic Hardware (www.nordichardware.se)
  • Toms Hardware (www.tomshardware.com).

Sweclockers har både ett väluppdaterat nyhetsflöde över vad som händer på hårdvaru­fronten och ett stort forum med medlemmar som gärna delar med sig av sina erfaren­heter. Sist men inte minst sänder de ett webb-TV-program varannan fredag där de samman­fattar vad som har hänt i datorvärlden. Genom att kolla på det blir det lätt att hänga med i vad som händer på bland annat grafikkortsfronten.

Senast ändrad: 2017-12-20