Just nu i M3-nätverket
Gå till innehåll

Primärminnen (RAM) för dom som söker det lilla extra eller vill köra mer extremt


Flyfisherman

Rekommendera Poster

Minneshastighet

 
 
 
När det gäller minneshastighet till datorer så finns det en uppsjö olika typer av minnen med olika egenskaper och till olika sorters datorer, men här tar jag bara upp DDR3 minnen för stationära datorer och för dom med högre krav på hastighet.
Kjell & Company har en bra sammanfattning när det gäller Typer av arbetsminne
 
Först och främst vill jag dock säga; att för vanlig surfning, kontorsarbete, filmtittande osv. att minnenas hastighet i princip inte har någon som helst betydelse före CPU.
Och även om man uppgraderar sin dator och vill göra lite mer "krävande" saker, så är det inte minnenas hastighet som har den största påverkan.
Jag kommer inte att ta upp hur spänningsnivån påverkar och inte heller hur man överklockar.
 

 

Om man skulle köpa två olika minneskit, båda med samma frekvens DDR3-2400MHz fast med olika timings; så kommer dessa att prestera olika tex. 9-11-10 (2400 C9) och det andra 11-11-11 (2400 C11).
Minnena har något som kallas för timings och frekvenser och jag skall försöka bena ut detta lite grann, med hjälp av bilder och citat från AnandTech
 
Vad som avgör hur snabbt ett minne arbetar utgörs av två saker: frekvens och timings.
Att köpa minnen med högre frekvens är oftast en fördel gentemot låga timings, eftersom minnen med sk. "tight timings" är svårare att få stabila, men även att högre frekvenser oftast ger högre prestanda än att ha samma minne med lägre "timings", detta har AnandTech påvisat i många olika minnestester, även fast "regeln har undantag".
 
Informationen i minnenas celler lagras i vad som kan liknas i en tabell där varje rad och kolumn betyder olika saker och hur datat lagras för att sedan kunna läsas.
Detta visar en schematisk bild över detta:
 
AanandTech: Everything You Always Wanted to Know About SDRAM (Memory): But Were Afraid to Ask
post-73434-0-71808700-1386981491_thumb.png
 
 
Varje rad och kolumn läses eller skrivs från vänster i denna schematiska bild
Back%20to%20Back%20Burst%20Read%20with%2

 
 Timings vad är då detta?
Minnena har otroligt många olika typer av parametrar och som alla påverkar prestandan, men nedan är dom som i realiteten ger mest påverkan och återges i databladen - det finns flera parametrar och som skiljer mellan olika minnestillverkare, men här går vi inte in på detta utöver nedanstående.
 
Till att börja med så om vi tar ett helt vanligt standard DDR3-1600Mhz minnes-kit som exempel:
Corsair Vengeance® Low Profile — 16GB Dual/Quad Channel DDR3 Memory Kit (CML16GX3M4A1600C9)
Så har just detta "timings" 9-9-9-24
 
Dessa siffror betyder i tur och ordning:
CL (CAS Latency) den tid det tar att läsa igenom en rad och en kolumn för att få fram en "bit", förenklat uttryckt.
tRCD (RAS to CAS Delay) en lägre siffra betyder att flera CL kan starta inom tRas
tRP (RAS Precharge) tiden det tar att gå mellan olika rader och räknas ut från tRAS + tRP.
tRAS (Cycle Time) den tid det tar att läsa datat från minnesraderna. Låg siffra betyder snabbare läsning men leder också till instabilitet pga. mer komplex hantering av samtidig datahantering.

 

DRAM%20Simplified%20State%20Diagram.png
 
När det gäller att välja minnenas hastighet så hänvisar jag till AnandTech Memory där dom utförligt testat olika typer av minnen under varierande förhållanden under lång tid och därmed kommit fram till en simpel guide och formel som man mycket enkelt kan använda.
 
Först vill jag citera Dr. Ian Cutress på AnandTech när det gäller att välja minnen; i prioritetsordning:
 

As mentioned in the Ivy Bridge memory scaling article, one of the main issues with reporting memory speeds is the exclusion of the CAS Latency, or tCL. When a user purchases memory, it comes with an associated number of sticks, each stick is of a certain size, memory speed, set of subtimings and voltage. In fact the importance of order is such that:

1. Amount of memory

2. Number of sticks of memory

3. Placement of those sticks in the motherboard

4. The MHz of the memory

5. If XMP/AMP is enabled

6. The subtimings of the memory

I use this order on the basis that point 1 is more important than point 3:

A system will be slow due to lack of memory before the speed of the memory is an issue (point 1)
In order to take advantage of the number of memory channels of the CPU we must have a number of sticks that have a factor of the memory channels (point 2), known as dual channel/tri channel/quad channel.
In order to ensure that we have dual (or tri/quad) channel operation these sticks need to be in the right slots of the motherboard – most motherboards support two DIMM slots per channel and we need at least one memory stick for each channel
If the MHz of the memory is more than CPU is rated for (1333, 1600, 1866+), then the user needs to apply XMP/AMP in order to benefit from the additional speed. Otherwise the system will run at the CPU defaults.
Subtimings, such as tCL, are used in conjunction with the MHz to provide the overall picture when it comes to performance.

1. Storleken på minnet - för lite minne har den mest avgörande betydelsen före hastigheten av densamma.
2. Antalet minnesstickor - måste överensstämma med antalet minneskanaler på moderkortet tex. 2/3/4 minneskanaler.
3. Placeringen av dessa i moderkortets minneskontakter - minst en minnessticka/minneskanal.
4. Frekvensen i MHz av dessa
5. Om Intel XMP eller AMD AMP är aktiverad i BIOS för minnenas inbyggda överklockningsprofil
6. Minnenas timings och då i synnerhet CL.
 
 
AnandTech har tagit fram en en formel baserat på resultat av ett otal olika minnestester när det gäller minnesprestanda och dom kallar detta för Performance Index (PI)
Detta är på inget sätt absolut, mer skall det ses som ett riktvärde, för det finns olika fabrikat och minnestyper som i vissa lägen (program) kan prestera bättre även fast dess frekvens kan vara lite lägre kontra dess timings, men generellt så är det en grund att stå på.
 
Tabeller för att åskådliggöra detta och hur mycket det betyder
 
post-73434-0-78664400-1386991010_thumb.png
I tabellen ovan så ser man den största prestandaökningen från 1333MHz CL9 (PI=148) ger till 1600MHz CL9 (PI=178)  20% prestandaökning.

Och sedan ett rejält hopp från 1600MHz CL9 (PI=178) till 2400MHz CL11 (PI=218)  22% prestandaökning.
 

From the data in our memory overview, it was clear that any kit with a performance index of less than 200 was going to have issues on certain benchmarks.  The Corsair kit has a PI of 240, which is at the higher end of the spectrum.

Specviewperf.png




SPECviewperf

The mix of real-world and synthetic benchmarks does not get more complex than SPECviewperf – a benchmarking tool designed to test various capabilities in several modern 3D renders.  Each of these rendering programs come with their own coding practices, and as such can either be memory bound, CPU bound or GPU bound.  In our testing, we use the standard benchmark on the IGP and report the results for comparison.

 
50928.png

Cinebench x64
A long time favourite of synthetic benchmarkers the world over is the use of Cinebench, software designed to test the real-world application of rendering software via the CPU or GPU.  In this circumstance we test the CPU single core and multi-core performance, as well as the GPU performance using a single GTX 580 at x16 PCIe 2.0 bandwidth.  Any serial factors have to be processed through the CPU, and as such any memory access will either slow or speed up the benchmark.

 
50925.png

WinRAR is one of the benchmarks in our testing suite that benefits immensely from having faster memory.  Moving from DDR3-1333 to DDR3-2400 speeds the process up by 20%, with the biggest gain moving from 1333 to 1600, and noticeable gains all the way up to 2133 C9.

 
 
 
50926.png

In another conversion test, we see that this benchmark gets a ~5% boost with faster memory, although Pass 1 sees a bigger boost than Pass 2.  If conversion into x264 is the main purpose of the system, then the price premium of the faster memory could easily be justifiable.

 
 
Och spel där det i än högre grad har betydelse om man använder IGPU (Intel) och APU (AMD) alltså processorns inbyggda grafikkrets
till skillnad mot Diskret GPU dvs. ett separat grafikkort.
Graferna i bilden säger mer än några ord kan göra när det gäller prestanda över standard 1333MHz CL9...
IGP%20Results.png

For the majority of users, the DDR3-1866 C9 kit from G.Skill is a great buy, as long as the user remembers to enable XMP(!).  Budget conscious builds will find solace in the DDR3-1600 C9 kit, which is a no brainer over the 1333 C9 kit for the extra $5.  If your pockets are a little deeper, then the G.Skill DDR3-2133 C9 kit will offer some extra performance, but not as much as jumping between the other kits will.  The DDR3-2400 C10 kit is not in the right ballpark compared to the other kits and only serves well for forum signatures.

 

There is plenty of scope to overclock beyond this, such as adjusting voltages or the voltage of the memory controller.  As long as a user is confident with adjusting these settings, then there is a good chance that the results here will be surpassed.  
 
There is also the fact that individual sticks of memory may perform better than the rest of the kit, or that one of the modules could be a complete dud and hold the rest of the kit back.  For the purpose of this review we are seeing if the memory out of the box, and the performance of the kit as a whole, will work faster at the rated voltage.
 
In order to ensure that the kit is stable at the new speed, we run the Linpack test within OCCT for five minutes.  This is a small but thorough test, and we understand that users may wish to stability test for longer to reassure themselves of a longer element of stability.  However for the purposes of throughput, a five minute test will catch immediate errors from the overclocking of the memory.

 
 

Prestanda Index (PI) är rätt simpel:
PI=Minnesfrekvensen/CL  tex. 1600MHz dividerat med CL9=178

The PI calculation and ‘rules’ are fairly simple:

  • Performance Index = MHz divided by CL
  • Assuming the same kit size and installation location are the same, the memory kit with the higher PI will be faster
  • Memory kits similar in PI should be ranked by MHz
  • Any kit 1600 MHz or less is usually bad news.
  • PI=MHz dividerat med CL
  • Förutsatt att det är samma minnesskit-storlek  och sitter i samma minnesbank, betyder att minneskitet med högre PI är snabbare
  • Minneskit som har lika PI, då är det det minneskitet som har högre frekvens som skall rankas högre.
  • Prestanda Index PI om minst 200 är att föredra. 
    Se Performance Index tabellen ovan.

That final point comes about due to the law of diminishing returns – in several benchmarks in our Haswell memory overview performed very poorly (20% worse or more) with the low end MHz kits.  In that overview, we suggested that an 1866 C9 or 2133 C10 might be the minimum suggestion; whereas 2400 C10 covers the sweet spot should any situation demand good memory.

 

Jag hoppas att detta kan förklara något litet om DDR3-minnesfunktioner och hur dessa arbetar, samt ge tips om vad man bör eftersträva för att nå bästa prestanda i sin dator genom att använda AnandTechs Prestanda Index (PI).

Mvh :)

Länk till kommentar
Dela på andra webbplatser

Arkiverat

Det här ämnet är nu arkiverat och är stängt för ytterligare svar.

×
×
  • Skapa nytt...