Niedawno rozmawiałem ze znajomym o kompilacji LaTeX-a. LaTeX może używać tylko jednego rdzenia do kompilacji. Tak więc dla szybkości kompilacji LaTeX, szybkość zegara procesora jest najważniejsza (patrz Wskazówki dotyczące wyboru sprzętu zapewniającego najlepszą wydajność kompilacji LaTeX )

Z ciekawości szukałem Procesory o najwyższych częstotliwościach zegara. Myślę, że to Intel Xeon X5698 z 4,4 GHz ( źródło ) miał najwyższą częstotliwość taktowania.

Ale to pytanie nie dotyczy procesorów które zostaną sprzedane. Chciałbym wiedzieć, jak szybko może się to stać, jeśli nie obchodzi Cię cena.

Jedno pytanie brzmi: Czy istnieje fizyczny limit Szybkość procesora? Jaka jest jej wysokość?

A drugie pytanie brzmi: Jaki jest najwyższy procesor prędkość osiągnięta do tej pory?

Zawsze myślałem, że prędkość procesora jest ograniczona z powodu chłodzenia (więc ciepło ) staje się bardzo trudne. Ale mój przyjaciel wątpi, że to jest powód (kiedy nie musisz używać tradycyjnych / tanich systemów chłodzenia, np. W eksperymencie naukowym).

W [2] czytałem, że opóźnienia transmisji powodują kolejne ograniczenie szybkości procesora. Jednak nie wspominają, jak szybko to może się stać.

Co znalazłem

O mnie

Jestem studentem informatyki. Wiem coś o procesorze, ale nie za dużo. A jeszcze mniej o fizyce, która może być ważna w tym pytaniu. Więc proszę, miej to na uwadze przy swoich odpowiedziach, jeśli to możliwe.

Komentarze

  • Twoje pytanie jest miłe, spodziewaj się kilku bardzo dobrych i wykształconych odpowiedzi. Moje dwa centy: implikacja ” działa tylko z jednego rdzenia ” – > ” zegar jest najważniejszy ” nie jest prawdą.
  • Aktualny rekord przetaktowanego procesora to buldożer AMD, pracujący z częstotliwością 8,4 GHz . Został schłodzony za pomocą ciekłego azotu.
  • Chociaż tytuł pytania brzmi ” Co ogranicza szybkość procesora? ” należy zauważyć, że instrukcja: ” LaTeX może używać tylko jednego rdzeń do kompilacji. Dlatego dla szybkości kompilacji LaTeX najważniejsza jest szybkość zegara procesora ” niekoniecznie musi być prawdą. Pamięć podręczna procesora również może mieć znaczenie. Ze względu na nowoczesność Procesory działa, w połączeniu z faktem, że istnieją różne procesory mające identyczne częstotliwości, ale różne rozmiary pamięci podręcznej oraz sposób, w jaki oprogramowanie zostało napisane i jest używane, pamięć podręczna procesora może mieć większy wpływ na szybkość wykonywania niż częstotliwość procesora.
  • Wydajność pojedynczego wątku nie jest wprost proporcjonalna do szybkości zegara; związek jest bardziej złożony. Może to być częściowo maskowane przez podobieństwo najnowszych mikroarchitektur Intel x86 z ulepszeniami mikroarchitektury kompensującymi niektóre koszty związane ze wzrostem częstotliwości.
  • Sugeruję porównanie procesora 2GHz z 2004 roku z procesorem 2GHz z 2014 roku; ' odkryjesz, że ' nie znajdują się w tym samym miejscu, nawet w przypadku zadań jednowątkowych, a nawet gdy oba realizują to samo zestaw instrukcji – instrukcje CISC, które ' ponownie wprowadzają, to jedno, ale mikrooperacje, na które są one podzielone, to zupełnie co innego.

Odpowiedź

Praktycznie to, co ogranicza szybkość procesora, to zarówno generowane ciepło, jak i opóźnienia bramek, ale zwykle ciepło staje się znacznie większym problemem, zanim zacznie działać ta ostatnia .

Najnowsze procesory są produkowane przy użyciu technologii CMOS. Za każdym razem, gdy występuje cykl zegara, energia jest rozpraszana. Dlatego wyższa prędkość procesora oznacza większe rozpraszanie ciepła.

http://en.wikipedia.org/wiki/CMOS

Oto kilka liczb:

Core i7-860 (45 nm) 2.8 GHz 95 W Core i7-965 (45 nm) 3.2 GHz 130 W Core i7-3970X (32 nm) 3.5 GHz 150 W 

tutaj wprowadź opis obrazu

Ty naprawdę widzę, jak zwiększa się moc przejścia procesora (wykładniczo!).

Istnieją również efekty kwantowe, które pojawiają się wraz ze zmniejszaniem się wielkości tranzystorów. Na poziomie nanometrów bramki tranzystora w rzeczywistości stają się ” nieszczelne „.

http://computer.howstuffworks.com/small-cpu2.htm

Nie wiem, jak działa ta technologia, ale jestem pewien, że możesz użyć Google do wyszukania te tematy.

OK, teraz na opóźnienia w transmisji.

Każdy ” przewód ” wewnątrz procesora działa jak mały kondensator. Również baza tranzystora lub bramka tranzystora MOSFET działają jak małe kondensatory. Aby zmienić napięcie na połączeniu, należy albo naładować przewód, albo usunąć ładunek. W miarę kurczenia się tranzystorów staje się to trudniejsze. Dlatego SRAM potrzebuje tranzystorów wzmacniających, ponieważ tranzystory z tablicą pamięci są tak małe i słabe.

W typowych projektach układów scalonych, gdzie gęstość jest bardzo ważna, komórki bitowe mają bardzo małe tranzystory. Ponadto są one zwykle wbudowane w duże tablice, które mają bardzo duże pojemności linii bitowej. Powoduje to bardzo powolne (względnie) wyładowanie linii bitowej przez komórkę bitową.

From: Jak zaimplementować wzmacniacz czułości SRAM?

Zasadniczo chodzi o to, że małym tranzystorom trudniej jest sterować interkonektami.

opóźnienia bramek. Współczesne procesory mają więcej niż dziesięć etapów potoków, być może do dwudziestu.

Problemy z wydajnością podczas tworzenia potoków

Istnieją także efekty indukcyjne. Przy częstotliwościach mikrofalowych stają się dość znaczące. Możesz sprawdzić przesłuchy i tego typu rzeczy.

Teraz, nawet jeśli uda ci się uruchomić procesor 3265810 THz, kolejnym praktycznym ograniczeniem jest szybkość, z jaką reszta systemu może go obsługiwać. Musisz mieć pamięć RAM, pamięć masową, logikę klejenia i inne połączenia międzysieciowe, które działają równie szybko, albo potrzebujesz ogromnej pamięci podręcznej.

Komentarze

  • Możesz dołączyć link do tej dyskusji, aby uzyskać ładne odniesienia na temat związku między szybkością zegara i zużyciem energii: physics.stackexchange.com/questions/34766/…
  • Istnieje ' także prędkość energii elektrycznej, którą należy wziąć pod uwagę, mówiąc o opóźnieniach transmisji en.wikipedia.org/wiki/Speed_of_electricity
  • Czy faktycznie rośnie wykładniczo czy tylko kwadratowo? W rzeczywistości ten film mówi, że Power = Frequency ^ 1.74.
  • Słuszna uwaga, jednak jedna z główne trudności w projektowaniu procesorów to interkonekty. Fizycznie duży chip może być możliwy, ale pamiętaj, że działają one w zakresie gigaherców. Chcesz, aby przewody były krótkie.
  • Ponieważ pytanie jest teoretyczne, można dodać, że inne półprzewodniki, takie jak arsenek galu, pozwalają na wyższe częstotliwości.

Odpowiedź

Problem z wysoką temperaturą jest dobrze omówiony w artykule fuzzyhair . Podsumowując opóźnienia transmisji, rozważ to: Czas potrzebny na przejście sygnału elektrycznego przez płytę główną wynosi teraz więcej niż jeden cykl zegara współczesnego procesora. Tak więc tworzenie szybszych procesorów nie da wiele.

Superszybki procesor jest naprawdę korzystny tylko w ogromnych procesach obliczania liczb i tylko wtedy, gdy kod jest starannie zoptymalizowany pod kątem wykonywania swojej pracy – Jeśli często trzeba szukać gdzie indziej danych, cała ta dodatkowa prędkość jest marnowana. W dzisiejszych systemach większość zadań można wykonywać równolegle, a duże problemy są rozdzielane na wiele rdzeni.

To brzmi tak jak proces kompilacji lateksu zostałby ulepszony przez:

  • Szybsze IO. Wypróbuj RAMdysk.
  • Uruchamianie różnych dokumentów na różnych rdzeniach
  • Nie spodziewam się, że 200-stronicowa praca wymagająca dużej ilości obrazu zostanie wykonana w 2 sekundy

Komentarze

  • Szkoda, że mam tylko jeden głos za. Twoja odpowiedź zasługuje na więcej, ponieważ wskazuje, że częstotliwość zegara może nie być wąskim gardłem w problemie OP '.

Odpowiedź

Istnieją trzy fizyczne ograniczenia: ciepło, opóźnienie bramki i prędkość transmisji elektrycznej.

Rekord świata w zakresie najwyższej jak dotąd szybkości zegara wynosi (zgodnie z tym linkiem) 8722,78 MHz

Prędkość transmisji elektrycznej (mniej więcej taka sama jak prędkość światła) jest absolutną fizyczną limit, ponieważ żadne dane nie mogą być przesyłane szybciej niż ich nośnik. Jednocześnie ten limit jest bardzo wysoki, więc zwykle nie jest czynnikiem ograniczającym.

Procesory składają się z ogromnej liczby bramek, z których sporo jest połączonych szeregowo (jedna po drugiej). Przejście ze stanu wysokiego (np. 1) do stanu niskiego (np. 0) lub odwrotnie zajmuje trochę czasu. To jest opóźnienie bramki. Więc jeśli masz 100 bramek połączonych szeregowo, a przełączenie zajmuje 1 ns, będziesz musiał poczekać co najmniej 100 ns, aby całość dała prawidłowe wyjście.

Te przełączniki są tym, co zużywa najwięcej mocy procesora. Oznacza to, że jeśli zwiększysz częstotliwość taktowania, otrzymasz więcej przełączników, a tym samym zużyjesz więcej mocy, a tym samym zwiększysz moc cieplną.

Przeciążenie (= > zapewnienie większej mocy) zmniejsza nieco opóźnienie bramki, ale ponownie zwiększa moc cieplną.

Gdzieś około 3 GHz zużycie energii do taktowania wzrasta niezwykle. Dlatego procesory 1,5 GHz mogą działać na smartfonie, podczas gdy większości procesorów 3-4 GHz nie można nawet uruchomić na laptopie.

Ale szybkość zegara nie jest jedyną rzeczą, która może przyspieszyć Procesor, również optymalizacje w potoku lub architektura mikrokodu mogą spowodować znaczne przyspieszenie. Właśnie dlatego Intel i5 (Dualcore) 3 GHz jest wielokrotnie szybszy niż Intel Pentium D (Dualcore) 3 GHz.

Komentarze

  • Samo przetaktowanie zwiększa liniowo zużycie energii procesora. Podwójna prędkość zegara oznacza więc podwójne zużycie energii. Ale przy wyższych częstotliwościach taktowania bramki stają się zbyt wolne, aby pracować z taką szybkością zegara i zaczynasz otrzymywać błędy obliczeniowe – > losowe awarie. Musisz więc zwiększyć napięcie, aby przyspieszyć bramy. Zużycie energii jest skalowane w stosunku do napięcia. Podwojenie napięcia oznacza więc czterokrotnie większe zużycie energii. Dodaj to, aby podwoić zegar, a uzyskasz ośmiokrotnie większe zużycie energii. Również wymagane napięcie rośnie wykładniczo wraz z szybkością zegara. en.wikipedia.org/wiki/CPU_power_dissipation
  • Innym problemem jest to, że nadmierne napięcie może po prostu obciążać procesor i nic nie może zrobić przeciwko temu. Jeśli twój procesor jest przeznaczony np. 3,3 V może być w stanie podnieść do 3,7 lub nawet 4 V, ale jeśli przejdziesz za wysokie, po prostu zniszczy chip. Kolejny link, który warto przeczytać: en.wikipedia.org/wiki/CPU_core_voltage
  • Prędkość transmisji to problem: przy 3 GHz otrzymujesz tylko 10 cm / cykl. Ponieważ typowa matryca procesora ma obecnie 300 m ², uważam, że po 10 GHz należałoby przemyśleć projekt procesora, ponieważ prawdopodobnie nie wszystkie części chipa można uzyskać w jednym cyklu.
  • @MartinSchr ö der: To nie jest duży problem, ponieważ (a) procesor umiera z powodu ciepła i opóźnienia bramki przed osiągnięciem 10 GHz oraz (b) procesory stają się mniejsze z każdym pokoleniem. Na przykład 6-rdzeniowy i7 z hiperwątkowością ma mniej więcej taki sam rozmiar jak jednoprocesorowy Pentium 4. Ale i7 ma 6 pełnych rdzeni i 6 więcej ” pół-rdzeni ” do obsługi wielowątkowości. Jest też pamięć podręczna. Również te rdzenie są podzielone na fazy rurociągu. Tylko części procesora w jednym rdzeniu i jednej fazie potoku (i być może pamięć podręczna L1) muszą zostać osiągnięte w jednym cyklu.
  • @ com.prehensible Post, z którym łączysz się, mówi konkretnie o fakcie , że ten tranzystor 500GHz jest ” tylko ” tranzystorem analogowym używanym do przetwarzania analogowego RF. W żadnym wypadku nie jest to procesor komputera.

Odpowiedź

Odpowiedzi na Twoje pytania to: Tak , istnieje fizyczny limit szybkości procesora. Najwyższy teoretyczny limit zostanie ustawiony na podstawie szybkości, z jaką „przełącznik” może przełączać stany. Jeśli użyjemy elektronu jako podstawy przełącznika, użyjemy promienia Bohra $$ r = 5,291 \ times 10 ^ {- 11} $$ i największej możliwej prędkości $$ c = 3 \ times 10 ^ 8, $$ do obliczenia częstotliwości $$ F = \ frac {1} {t} = \ frac {c} {2} \ pi r = 9.03 \ times 10 ^ {17} \ text {Hz} $$ W aktualny stan technologii, rzeczywisty limit to około $$ 8 \ times 10 ^ 9 \ text {Hz} $$

Komentarze

  • Wprowadziłem kilka zmian w Twoim LaTeX. Czy mógłbyś sprawdzić, czy zmiana częstotliwości była poprawna?
  • Jak wymyśliłeś obecny stan limitu technologicznego?
  • Zbudowałbyś również najszybszy możliwy komputer na Schwarzschild promień czarnej dziury dla maksymalnego efektu. Promień Bohra jest o wiele za duży do pracy przy dużych prędkościach. 🙂

Odpowiedź

Jedno pytanie brzmi: Czy istnieje fizyczne ograniczenie szybkości procesora?

To zależy w dużej mierze od samego procesora. Tolerancje produkcyjne powodują, że fizyczny limit jest nieco inny dla każdego chipa, nawet z tej samej płytki.

Opóźnienia transmisji powodują kolejne ograniczenie szybkości procesora. Jednak nie wspominają, jak szybko to może się stać.

To dlatego, że transmission delay lub speed path length to wybór dla projektanta chipa. Krótko mówiąc, jest to ilość pracy wykonywana przez logikę w jednym cyklu zegara . Bardziej złożona logika skutkuje wolniejszymi maksymalnymi częstotliwościami taktowania, ale także zużywa mniej energii.

Dlatego właśnie chcesz użyć testu porównawczego do porównania procesorów. Liczba pracy na cykl jest bardzo różna, więc porównanie surowego MHz może dać zły pomysł.

Odpowiedź

W praktyce jest to zdecydowanie moc cieplna, która jest w przybliżeniu proporcjonalna do kwadratu napięcia: http://en.wikipedia.org/wiki/Thermal_design_power#Overview . Każdy materiał ma określoną pojemność cieplną, co ogranicza wydajność chłodzenia.

Nie biorąc pod uwagę kwestii technicznych związanych z chłodzeniem i opóźnieniem transmisji, zauważysz, że prędkość światła ogranicza odległość, jaką sygnał może pokonać w naszym procesorze na sekundę . Dlatego procesor musi się zmniejszać, im szybciej działa.

Wreszcie, poza pewną częstotliwością, procesor może stać się przezroczysty dla elektronicznych funkcji falowych (elektrony modelowane jako funkcje falowe zgodnie z równaniem Schrödingera).

W 2007 roku niektórzy fizycy obliczyli podstawowe ograniczenie prędkości roboczych: http://journals.aps.org/prl/abstract/10.1103/PhysRevLett.99.110502

Odpowiedź

Oprócz wszystkich innych odpowiedzi istnieje również kilka innych kwestii, które mogą nie wpływać bezpośrednio na szybkość procesora, ale mogą tworzyć coś wokół tego Procesor dość trudny;

Krótko mówiąc, powyżej DC, częstotliwość radiowa staje się problemem. Im szybciej jedziesz, tym bardziej nachylone jest wszystko, aby działać jak gigantyczne radio. ich wewnętrznej pojemności / indukcyjności z sąsiednimi ścieżkami / płaszczyzną uziemienia, szumem itp. itp.

Im szybciej jedziesz, tym gorzej wszystko się dzieje – nogi komponentu mogą wprowadzić unacce Na przykład indukcyjność ptable.

Jeśli spojrzysz na wytyczne dotyczące układania „podstawowych” PCB „poziomu Raspberry Pi z pamięcią RAM DDR, wszystkie ślady magistrali danych itp. musi być równej długości, mieć poprawne zakończenie itp. i to działa znacznie poniżej 1 GHz.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *