Quote:
Originariamente inviato da gridracedriver
http://www.bitsandchips.it/50-enterp...va-in-pensione
amd grazie all' infinity fabric mette insieme 4 die ad 8 core piccoli e facili da produrre con rese massime (4*200mmq), intel invece fa die monolitici dove all'interno ci sono già i core massimi pensati e poi con gli scarti scalano (Xeon Platinum 8180 , per fare il 28 core gli servano 6-700mmq circa o forse più ancora non si sa).
https://en.wikipedia.org/wiki/List_o...le_Performance
quando stampi sul wafer con 200mmq a die avrai rese nettamente superiori ai 700mmq, per diversi motivi, certo poi devi usare 4 die, ma ti verranno fuori quasi tutti al top, mentre Intel sarà costretta a selezionare in modo più ferreo per le soluzioni platinum, man mano quello che scartano passa ai livelli "inferiori" di performance, ma questo lo farà anche amd.
i metodi MCM non sono nuovi, ma far comunicare sempre più core in modo veloce è sempre più una sfida, e lo vogliono portare anche nel campo gpu... speriamo ci riescano.
tutto sta a come li fai comunicare.
|
Non centra come li fai comunicare, la cache può essere inclusiva o esclusiva ma con quella soluzione non hai una L3 unica per tutti i core ma 4 blocchi. Vuol dire che se un P gira su un core di un DIE per girare su un core di un altro DIE deve essere ricaricato in cache e saltano i paradigmi di località spaziale e temporale.
Poi lato server penso che andranno ad adoperarsi soluzione atte a scheduling affinati in modo da evitare che un thread salti da un DIE all'altro ma su un sistema desktop è un po' meno efficiente. Poi tanto onestamente fatico a trovare un uso desktop dove 16 core e 32 thread abbiano impiego (ma anche 10 o 12 sia chiaro).