CPU的L1與L2快取



贊助商連結


Lock
2001-03-11, 12:36 AM
可否詳述CPU L1,L2快取的所在位置
、效能(速度)和功用??

還有還有它有最大值嗎??
不然,為何聽說有L3快取而不直接加大
L2orL1快取??

(我還有上一個問題不知道速不速問的不
好沒人回應,請各個大大贈幾個字就行
了,謝謝~~~~~)

贊助商連結


Lock
2001-03-11, 01:13 AM
嗯~~~~~~沒人回~~~~~~

給我網址也可以,我很想知道這些基本的概論
像大部份都只寫到L1快取是和cpu連接,L2快取
是連外(不知道有沒有記錯),更深入的就沒看
到了~~so請各位大大解惑~~謝謝~~~~~~

xbug
2001-03-11, 02:12 AM
>可否詳述CPU L1,L2快取的所在位置 、效能(速度)和功用??
位置? 嗯... On-Die (包在CPU堶)~ :>
速度? K7 CPU是 0.18us 或 0.25us ( u = 10 的負6次方)
當cpu讀取資料時,會先進入L1中尋找,如果找不到要讀取的資料就會進入到L2中尋找,如果還是找不到則會進入memory or hdd or 其它device中讀取.. 讀取到的資料會順便COPY一份到 L1 及 L2 中, 當下次讀取時又重覆這些動作L1->L2->OTHER....
因為L1, L2 速度快, 如果在L1,L2中就可以讀到資料, 就不需到慢速的DEVICE上讀取... 這就是 L1, L2的功用~
簡單來說, L1,L2可以加快系統的處理速度.....

>還有還有它有最大值嗎??
>不然,為何聽說有L3快取而不直接加大 L2orL1快取??
沒有上限~
cache memory容量大, 不代表系統"一定"比較快, 這跟快取擊中率有關~ 快取擊中率是指 CPU 去 cache memory中讀資料時,有多少次能正確找到要讀取的資料..

stw_cbx
2001-04-24, 11:51 AM
其實L2也不一定on-die啦...部分P-II及500Mhz以前的P3(代號Katmai)就是拉出來做在卡莢內的PCB上的...

另外就如同Xbug說的....cache雖沒有上限,但有所謂命中率的問題,
太大的cache,查詢時間增加,就失去了快取記憶體的意義了...

L1依CPU架構及管線數而定...由大廠設計不同...
理想的L2是256~512,但這又關係到運作時脈及製程的問題....
今日的高速中央處理器,Cache技術無法跟上,所以您才會看到L2 cache由PII時的512變成P3(P!!!)時的256(但這裡的Cache是Full rate)

至於所謂的命中率(擊中率),是和運算式有關的,設計良好的運算式,其命中率高,效能也會比較好.運算式的發展已經很久了,算是相當成熟,不同世代同樣大小的Cache表現幾乎不分軒輊.如果您還有興趣的話,還可以參考如P3的ATC架構及P4的Execution Trace Cache...

TIM
2001-04-24, 01:50 PM
記憶體越精細..越需要多管路控制..成本也就越高..
L1..都是內建在CPU的DIE裡面..與其晶圓區是融合在一起的..速度是與CPU相同..也就是跑全速..通常都是用邏輯閘作其機制..所以成本高昂
L2..最早以前是做成子卡的形式插在主機板上..速度並不快..與外頻相關..在INTEL時期..是用SRAM來做的..後來在PENTIUM PRO的時候將L2與CPU的晶圓作入同一個封裝中..(不是DIE歐)..跑全速..但是由於品管時要兼顧兩個晶圓..所以良率大幅下降..價格高昂..所以PRO是INTEL第一個獲利不如前..被人唾棄的產品之一..後來"L2戰術"被廣泛應用..INTEL就推出PENTIUM2..將L2與CPU封裝坐在同一塊IC版上..跑半速..最後為了節省成本..終於將L2與CPU核心作入同一個DIE中..至此..CPU內部有兩塊堆置區..
L3..就是第三階快取記憶體..在兩個地方看的到..一個是SERVER的非X86系統上..一個是有L2設計的板子加上K6-3..因為K6-3內部融合L1+L2.所以主機板上原先設計的L2..就變成L3了..AMD真厲害..
我舉幾個例子
INTEL--CLERON500..
L1--32K..16K資料16K指令..速度500MHZ..機制是邏輯閘
L2--128K..可邏輯化控制..開16WAY..速度500MHZ..機制是INTEL自己研發的RAM型態
L3--無
AMD-BIRD1G
L1--128K...64K資料64K指令..速度1G..邏輯閘
L2--512K...可邏輯化控制..開4WAY..速度1G..記憶體..未找到相關資料

各級比較
速度--L1>L2>L3>SYSTEM RAM
容量--L1<L2<L3<SYSTEM RAM
一單位成本--L1>L2>L3>SYSTEM RAM
技術需求度--L1>L2>L3>SYSTEM RAM
可邏輯化程度--L1<L2<L3<SYSTEM RAM

如有錯..敬請指教囉..

sanka
2001-04-24, 08:05 PM
哇..今天學了好多... 真是謝啦... 在cache 方面的文章或是資料要到那找才找的到...看了之後想再了解多一點...或是請各位大大有空就再多post 一點讓我學習一下.. 多增加一點對電腦的了解...
小弟在這就先謝謝各位大大....

yagami
2001-06-19, 01:54 PM
這裡的文章都好專業喔!
把這裡當成圖書館啦!
感謝各位大大的不吝賜教

cengzie
2001-06-30, 10:01 PM
其實amd當時出ㄉk6-III原本是k6-2再加ㄍL2 CACHE使M/B上ㄉSRAM顏變為L3
K6-III東西出ㄌ但是M/B上ㄉ種種因素使原本理論上ㄉ效能未達..
而且因為多ㄌ256KㄉFULL SPEEDL2
使ㄉ晶體數量由900萬(K6-2)變到2100萬(K6-III)多ㄌ1200萬ㄍ晶體..
使電流需求也大大題升..
我剛買來玩時竟把我ㄉM/B給燒ㄌ~~@@~IWILLㄉSCSI M/Bㄝ~~@@~POWER也掛ㄌ一ㄍ````
後來換ㄌM/B SRAM 是1Mㄉ`效率只比K6-2高10%~20%
OCㄉ成度也不高
最後在我ㄉ猛超下~(400 OC 504) 2ㄍHR就掛ㄌ...在我抽屜當裝飾品....@@..

maosung
2001-10-15, 02:38 PM
謝謝....
我又多學了一些...

cengzie
2001-10-15, 09:52 PM
oh~再update
我換k6-2+ 500 oc 550 vcore 2.1 (規格是2.0v) .因為我ㄉm/b電壓準位不準..所以用2.1v才能開機.
k6-2+ 固明思意就是k6-2 +上點東東
k6-2+ 就是k6-2 +上3dnow+ 跟L2 128K
開機ㄉ速度比K6-2-350 OC 450快ㄌ近一倍以上~
植行許多東西也比以前順很多
完全不感覺會被768M RAM拖累效率..最強ㄉ是使用0.18制程.