Jeg har nylig snakket med en venn om LaTeX-kompilering. LaTeX kan bare bruke en kjerne til å kompilere. Så for hastigheten til LaTeX-kompilering, klokkehastigheten av CPU er viktigst (se Tips for valg av maskinvare for best LaTeX kompileringsytelse )

Av nysgjerrighet har jeg sett etter CPUer med høyest klokkehastighet. Jeg tror det var Intel Xeon X5698 med 4,4 GHz ( kilde ) som hadde den høyeste klokkehastigheten.

Men dette spørsmålet handler ikke om CPUer som blir solgt. Jeg vil gjerne vite hvor fort det kan bli hvis du ikke bryr deg om prisen.

Så et spørsmål er: Er det en fysisk grense for CPU-hastighet? Hvor høy er den?

Og det andre spørsmålet er: Hva er den høyeste CPU hastighet nådd så langt?

Jeg har alltid trodd at CPU-hastigheten var begrenset fordi kjøling (så varme ) blir så vanskelig. Men min venn tviler på at dette er grunnen (når du ikke trenger å bruke tradisjonelle / billige kjølesystemer, f.eks. I et vitenskapelig eksperiment).

I [2] har jeg lest at overføringsforsinkelser forårsaker en annen begrensning i CPU-hastigheten. Imidlertid nevner de ikke hvor fort det kan komme.

Det jeg har funnet

Om meg

Jeg er en informatikkstudent. Jeg vet noe om prosessoren, men ikke for mye. Og enda mindre om fysikken som kan være viktig for dette spørsmålet. Så vær oppmerksom på svarene dine hvis det er mulig.

Kommentarer

  • Spørsmålet ditt er hyggelig, forvent noen veldig gode og utdannede svar. Mine to øre: implikasjonen » den løper bare av en kjerne » – > » klokken er viktigst » er ikke sant.
  • Den nåværende posten for en overklokket CPU er AMD Bulldozer, på 8,4 GHz . Den ble avkjølt med flytende nitrogen.
  • Selv om tittelen på spørsmålet er » Hva begrenser CPU-hastighet? » det skal bemerkes at utsagnet: » LaTeX kan bare bruke en kjerne å kompilere. Så for hastigheten til LaTeX-kompilering er klokkehastigheten til CPUen viktigst » er ikke nødvendigvis sant. CPU-cache kan også gjøre en forskjell. På grunn av hvor moderne CPUer fungerer, kombinert med det faktum at det er forskjellige CPUer som har identiske frekvenser, men forskjellige størrelser (r) og hvordan programvaren ble skrevet og brukes, kan CPU-cache ha større innflytelse på kjøringshastighet enn CPU-frekvens. li>
  • Ytelse med en tråd er ikke direkte proporsjonal med klokkehastigheten; forholdet er mer komplekst. Dette kan delvis maskeres av likheten mellom nylige Intel x86 mikroarkitekturer med mikroarkitektoniske forbedringer som kompenserer for noen av kostnadene i økende frekvens.
  • Jeg foreslår at du sammenligner en 2004 2 GHz prosessor med en 2014 2 GHz prosessor; du ‘ vil finne ut at de ‘ ikke er i samme ballpark selv på enkelttrådede oppgaver, og selv når begge implementerer det samme instruksjonssett – CISC-instruksjonene de ‘ mates er en ting, men mikrooperasjonene disse er delt inn i er en helt annen.

Svar

Det som begrenser CPU-hastigheten er praktisk talt både varmen som genereres og porten forsinkes, men vanligvis blir varmen et langt større problem før sistnevnte sparker inn .

Nylige prosessorer er produsert ved hjelp av CMOS-teknologi. Hver gang det er en klokkesyklus, forsvinner strømmen. Derfor betyr høyere prosessorhastigheter mer varmespredning.

http://en.wikipedia.org/wiki/CMOS

Her er noen figurer:

Core i7-860 (45 nm) 2.8 GHz 95 W Core i7-965 (45 nm) 3.2 GHz 130 W Core i7-3970X (32 nm) 3.5 GHz 150 W 

skriv inn bildebeskrivelse her

Du kan virkelig se hvordan CPU-overgangseffekten øker (eksponentielt!).

Det er også noen kvanteeffekter som sparker inn når størrelsen på transistorer krymper. På nanometernivå blir faktisk transistorporter til » utett «.

http://computer.howstuffworks.com/small-cpu2.htm

Jeg kommer ikke inn på hvordan denne teknologien fungerer her, men jeg er sikker på at du kan bruke Google til å slå opp disse emnene.

Ok, nå, for sendingforsinkelsene.

Hver » ledning » inne i CPU-en fungerer som en liten kondensator. Også basen til transistoren eller porten til MOSFET fungerer som små kondensatorer. For å endre spenningen på en tilkobling, må du enten lade ledningen eller fjerne ladningen. Når transistorer krymper, blir det vanskeligere å gjøre det. Dette er grunnen til at SRAM trenger forsterkningstransistorer, fordi de faktiske hukommelsestransistorene er så små og svake.

I typiske IC-design, hvor tetthet er veldig viktig, bitcellene har veldig små transistorer. I tillegg er de vanligvis innebygd i store matriser, som har veldig store bitlinjekapasitanser. Dette resulterer i en veldig langsom (relativt) utladning av bitlinjen av bitcellen.

Fra: Hvordan implementere SRAM sense-forsterker?

I utgangspunktet er poenget at det er vanskeligere for små transistorer å drive sammenkoblingene.

Det er også gate forsinkelser. Moderne CPUer har mer enn ti rørledningsetapper, kanskje opptil tjue.

Ytelsesproblemer i rørledning

Det er også induktive effekter. Ved mikrobølgefrekvenser blir de ganske betydningsfulle. Du kan slå opp crosstalk og den slags ting.

Nå, selv om du klarer å få en 3265810 THz-prosessor til å fungere, er en annen praktisk grense hvor raskt resten av systemet kan støtte den. Du må enten ha RAM, lagring, limlogikk og andre sammenkoblinger som fungerer like raskt, eller du trenger en enorm cache.

Kommentarer

  • Det kan være lurt å ta med en lenke til denne diskusjonen for fine referanser om hvordan klokkehastighet og strømforbruk forholder seg: physics.stackexchange.com/questions/34766/…
  • ‘ er også hastigheten på elektrisitet å ta i betraktning når vi snakker om forsinkelser for overføring no.wikipedia.org/wiki/Speed_of_electricity
  • Øker det faktisk eksponentielt, eller bare kvadratisk? Faktisk sier denne videoen at Power = Frequency ^ 1.74.
  • Bra poeng, derimot, en av de største vanskelighetene i CPU-design er sammenkoblingene. En fysisk stor brikke kan være mulig, men husk at disse fungerer i gigahertz-området. Du vil holde ledningene korte.
  • Siden spørsmålet er teoretisk, kan det legges til at andre halvledere, som Galliumarsenid, tillater høyere frekvenser.

Svar

Varmeproblemet dekkes godt av fuzzyhair . For å oppsummere forsinkelsesoverføringen, bør du vurdere dette: Tiden det tar for et elektrisk signal å krysse hovedkortet er nå mer enn en klokkesyklus til en moderne CPU. Å lage raskere prosessorer vil ikke oppnå mye.

En superrask prosessor er egentlig bare fordelaktig i massive antall knusing prosesser, og da bare hvis koden din er nøye optimalisert for å gjøre sitt arbeid på- Hvis det ofte må gå andre steder for data, blir den ekstra hastigheten bortkastet. I dagens systemer kan flertallet av oppgavene kjøres parallelt, og store problemer blir delt over flere kjerner.

Det høres ut som om latexkompileringsprosessen din ville blitt forbedret med:

  • Raskere IO. Prøv en RAMdisk.
  • Kjører forskjellige dokumenter på forskjellige kjerner
  • Forventer ikke at en 200-siders bildekrevende jobb skal gjøres i 2 sekunder

Kommentarer

  • Synd at jeg bare har lov til en oppstemning. Svaret ditt fortjener mer for å påpeke at klokkefrekvensen kanskje ikke er flaskehalsen i OP ‘ s problem.

Svar

Det er tre fysiske grenser: Varme, portforsinkelse og hastigheten på elektrisk overføring.

Verdensrekorden på den høyeste klokkehastigheten så langt er (ifølge denne lenken) 8722,78 MHz

Hastigheten på elektrisk overføring (omtrent den samme som lysets hastighet) er den absolutte fysiske begrensning, siden ingen data kan overføres raskere enn mediet. Samtidig er denne grensen veldig høy, så det er vanligvis ikke en begrensende faktor.

CPU-er består av store mengder porter, hvorav mange er koblet serielt (den ene etter den andre). En bytte fra høy tilstand (f.eks. 1) til lav tilstand (f.eks. 0) eller omvendt tar litt tid. Dette er portforsinkelsen. Så hvis du har 100 porter koblet serielt og en tar 1 ns å bytte, må du vente på minst 100 ns for at hele greia skal gi deg en gyldig utgang.

Disse bryterne er tingen som tar mest strøm på en CPU. Dette betyr at hvis du øker klokkehastigheten, får du flere brytere og bruker mer strøm og øker dermed varmeeffekten.

Overspenning (= > gir mer kraft) reduserer portforsinkelsen litt, men øker igjen varmeeffekten.

Et eller annet sted rundt 3 GHz strømforbruket til klokkehastighet øker ekstremt. Dette er grunnen til at 1,5 GHz-prosessorer kan kjøre på en smarttelefon, mens de fleste 3-4 GHz-prosessorer ikke kan kjøres på en bærbar datamaskin.

Men klokkehastighet er ikke det eneste som kan øke CPU, også optimaliseringer ved rørledningen eller mikrokodearkitekturen kan føre til betydelig hastighet. Dette er grunnen til at en 3 GHz Intel i5 (Dualcore) er flere ganger så rask som en 3 GHz Intel Pentium D (Dualcore).

Kommentarer

  • Bare overklokking øker CPU-strømforbruket lineært. Så dobbel klokkehastighet betyr dobbelt strømbruk. Men ved høyere klokkehastigheter blir portene for sakte til å jobbe med den klokkehastigheten, og du begynner å få beregningsfeil – > tilfeldige krasjer. Så du må øke spenningen for å få fart på portene. Strømbruk skalerer rett i forhold til spenningen. Så dobbel spenning betyr fire ganger strømforbruket. Legg til det for å doble klokken, og du får åtte ganger strømforbruket. Også den nødvendige spenningen øker eksponentielt med klokkehastigheten. no.wikipedia.org/wiki/CPU_power_dissipation
  • Det andre problemet her er at overspenning bare kan steke CPU-en din, og det er ingenting som kan gjøres mot det. Hvis CPU-en din er spesifisert for f.eks. 3.3V kan du kanskje gå opp til 3.7 eller kanskje til og med 4V, men hvis du går til høy, vil det bare ødelegge brikken. En annen lenke det er verdt å lese: en.wikipedia.org/wiki/CPU_core_voltage
  • Overføringshastighet er et problem: på 3Ghz får du bare 10cm / syklus. Siden en typisk prosessormat for øyeblikket har 300m ², tror jeg at man etter 10 Ghz vil måtte revurdere prosessordesign siden sannsynligvis ikke alle deler av brikken kan nås i en syklus. / li>
  • @MartinSchr ö der: Det er ikke så mye av et problem, siden (a) CPU dør på grunn av varme- og portforsinkelse før 10 GHz oppnås og (b) prosessorer blir mindre for hver generasjon. For eksempel har en 6-kjerne i7 med hypertråd omtrent samme størrelse som en enkelt Pentium 4. Men i7 har 6 fulle kjerner og 6 flere » halvkjerner » for hypertråding. Også der er hurtigbufferen. Også disse kjernene er delt inn i rørledningsfaser. Bare delene av CPU-en i en kjerne og en rørledningsfase (og kanskje L1-cache) trenger å nås i en syklus.
  • @ com.prehensible Innlegget du koblet snakker faktisk spesifikt om det faktum , at denne 500 GHz-transistoren » bare » er en analog transistor som brukes til analog RF-undertrykkelse. Det er på ingen måte datamaskinprosessor.

Svar

Svarene på spørsmålene dine er: Ja , det er en fysisk grense for CPU-hastighet. Den høyeste teoretiske grensen vil bli satt av hvor raskt en «bryter» kan bytte tilstand. Hvis vi bruker elektronen som grunnlag for bryteren, bruker vi Bohr-radien $$ r = 5.291 \ ganger 10 ^ {- 11} $$ og den raskeste mulige hastigheten $$ c = 3 \ ganger 10 ^ 8, $$ for å beregne frekvensen $$ F = \ frac {1} {t} = \ frac {c} {2} \ pi r = 9,03 \ ganger 10 ^ {17} \ tekst {Hz} $$ Ved nåværende teknologitilstand, den faktiske grensen er ca $$ 8 \ ganger 10 ^ 9 \ text {Hz} $$

Kommentarer

  • Jeg gjorde noen endringer i LaTeX. Kan du sjekke om redigering av frekvens var riktig?
  • Hvordan kom du på den nåværende teknologitilstanden?
  • Du ville også bygge den raskest mulige datamaskinen på Schwarzschild. radius på et svart hull for maksimal effekt. Bohr-radiusen er veldig stor å jobbe med i høye hastigheter. 🙂

Svar

Så ett spørsmål er: Er det en fysisk grense for CPU-hastighet?

Det kommer veldig an på selve CPU-en. Produksjonstoleranser resulterer i at den fysiske grensen er litt forskjellig for hver brikke, selv fra den samme waferen.

forsinkelser på overføring forårsaker en annen begrensning i CPU-hastigheten. Imidlertid nevner de ikke hvor fort det kan komme.

Det er fordi transmission delay eller speed path length er et valg for designeren av brikken å lage. I et nøtteskall er det hvor mye arbeid logikken gjør i en enkelt klokkesyklus . Mer kompleks logikk resulterer i langsommere maksimale klokkehastigheter, men bruker også mindre strøm.

Dette er grunnen til at du vil bruke en referanse for å sammenligne CPUer. Arbeidet per syklusnummer er veldig forskjellige, så sammenligning av rå MHz kan gi deg en feil ide.

Svar

Praktisk talt er det definitivt den termiske effekten, som er omtrent proporsjonal med spenningens kvadrat: http://en.wikipedia.org/wiki/Thermal_design_power#Overview . Hvert materiale har sin spesifikke varmekapasitet som begrenser kjøleeffektiviteten.

Når du ikke vurderer de tekniske problemene med kjøle- og overføringsforsinkelse, vil du finne lyshastigheten som begrenser avstanden et signal kan reise innen CPU-en per sekund . Derfor må CPU-en bli mindre jo raskere den fungerer.

Til slutt, utover en viss frekvens, kan CPU-en bli gjennomsiktig for de elektroniske bølgefunksjonene (elektroner modellert som bølgefunksjoner etter Schrödingers ligning).

I 2007 beregnet noen fysikere en grunnleggende grense for driftshastigheter: http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.99.110502

Svar

I tillegg til alle de andre svarene, er det også noen andre hensyn som ikke kan påvirke CPU-hastigheten direkte, men som gjør det å bygge noe rundt det CPU ganske vanskelig;

Kort sagt, over DC, blir radiofrekvens et problem. Jo raskere du går, jo mer tilbøyelig er alt til å fungere som en gigantisk radio. Dette betyr at PCB-spor lider overhør, effekten av deres iboende kapasitans / induktans med tilstøtende spor / bakkeplan, støy osv. osv. osv.

Jo raskere du går, jo verre blir alt dette – komponentben kan introdusere unacce ptable induktans for eksempel.

Hvis du ser på retningslinjene for å legge ut «grunnleggende» PCB «er av typen Nivå til en Raspberry Pi med noe DDR RAM, alle sporene for databussen osv. må være av samme lengde, ha riktig avslutning osv. og det kjører godt under 1 GHz.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *