推土機微架構

(重定向自AMD Bulldozer

推土機微架構[1][2][3](英語:AMD Bulldozer)是AMDK10微架構之後推出的中央處理器微架構[2],由 IBM Power4 的總工程師 Chuck Moore 操刀。該微架構主要應用於桌上型平台伺服器平台乃至超級計算機的微處理器核心上。Bulldozer在歷經數次跳票後於2011年9月19日發布,其首發產品是核心代號為“Zambezi”的AMD FX

推土機微架構
產品化2011年至2014年
推出公司超微半導體(AMD
設計團隊超微半導體(AMD)
生产商
微架構CISC(x86-64)
指令集架構AMD64/x86-64x86MMX3DNow!SSE(1、233S4a4.14.25(後拆分為XOPFMA4CVT16)、AVXAESNX bitAMD-V
制作工艺/製程32納米
核心数量3至16(1.5模組至 8模組)
一級快取每整數排程單元16KB指令
每模組共用32KB指令
每模組64KB資料
二級快取每模組2MB 16路
三級快取全部模組共用8MB 16路
CPU主频范围1.600 GHz 至 4.200 GHz
HyperTransport速率至 6.4 GT/s
CPU插座
封裝
應用平台伺服器工作站桌上型電腦超級計算機
核心代號
  • 伺服器:
    Interlagos
    Valencia
    Zurich
  • 桌上型:
    Zambezi
使用的處理器型號
上代產品AMD 10h處理器家族
繼任產品AMD Piledriver

Bulldozer微架構從一個早期已擱置的微架構設計發展而來[3],主攻熱設計功耗為10瓦至125瓦的處理器平台。AMD預期認為,基於Bulldozer架構的處理器在實際應用中每個「推土機」(Bulldozer)核心每瓦效能可達到高效能計算(High-performance computing,HPC)的水準。屆時每個“推土機”核心會支援Intel絕大部分的指令集(包括SSE4.1、SSE4.2、AESCLMUL以及AVX),以及AMD自有的指令集(包括由SSE5拆分而來的XOPFMA4CVT16[4][5]

概觀 编辑

2011年,AMD處理器開始導入32奈米製程,推出APU(加速處理單元)新形態處理器,應用在桌上型電腦筆記型電腦。超微的處理器架構有兩大關鍵的調整方向,依用途區分成兩種系列,其研發技術代號分別為Bulldozer與Bobcat。Bulldozer架構針對主流伺服器、桌上型電腦、筆電的應用,提供高存取效能與高負載多執行緒的架構,並選擇以APU組態的高延展性來連結圖形處理器;Bobcat主攻低耗電的超輕薄電腦應用。[6]

Bulldozer架構的處理器均使用格羅方德的32納米HKMG SOI製程,重新使用類似DEC的多任務計算的設計。根據AMD的發布說明,“平衡專用和共用的處理器運算資源,來提供一個易於成倍提升計算效能的,高度緊湊的單晶片多核心的設計”。[7]換句話說,透過精簡處理器核心一些「冗餘」部分,輔以多核心/多線程的設計,超微希望籍此以更少的能耗,來充分發揮這些核心的特性和效能來提升整塊微處理器乃至整個平台的效能。AMD研究員Tim Fischer表示,Bulldozer採用全新的控制結構和運算單元,其性能體現於整數運算、浮点运算、L1快取、電源管理,和時脈產生器等……均是開發重點,主要意義在於降低功耗並提升單位功耗的效能。[8]

Bulldozer微架構的設計早在2003年已出現,由於AMD忙於K8微架構處理器的研發和推出而擱置,後來Bulldozer架構在該微架構的基礎上重新設計。可合併為1個256位的2個128位並且可進行融合乘法運算的浮點運算單元,這個主要特性在2003年的設計中已出現;一個Bulldozer核心單元中,除了前述的浮點運算單元外,還擁有兩個整數排程運算單元,每個整數排程運算單元各自擁有4條管線(另外的讀取、解碼這兩級管線為兩個整數運算單元所共用);L1快取為每整數排程運算單元獨占,但L2快取則為兩個整數排程運算單元所共用。AMD稱這樣的一個單元為一個“模組”,一個16線程的Bulldozer處理器中包含8個這樣的模組,但一個模組並不會被辨認為一個物理核心,而是根據一個模組中的2個整數排程運算單元的數量辨認為兩個邏輯核心(即作業系統會將1個模組辨認為兩個邏輯核心/線程)。[9]一個“模組”包含2個邏輯核心,和Intel超線程技術中1個物理核心被辨認為2個邏輯核心的做法似乎有類似之處,但事實上,兩者大相徑庭:AMD Bulldozer的“模組”為每條線程提供了各自的整數運算排程單元和一級指令快取,而英特爾的超線程則是兩條線程共用核心內所有可用的運算資源。[10]

基於Bulldozer微架構,32納米SOI HKMG製程的處理器產品於2011年9月率先於桌上型平台上發布,是為核心代號“Zambezi”(Socket AM3+,4至8線程)之AMD FX系列;緊接著的是10月12日發布伺服器平台,核心代號“Interlagos”(Socket G34,16線程)、“Valencia”(Socket C32,4至8線程)之AMD Opteron系列[11][12]重新啟用了AMD少有的“FX”品牌。首發的桌面級產品FX-8150,將有四個Bulldozer模組;伺服器級微處理器,代號Interlagos,是由兩個包含4個Bulldozer模組的MCM、共八個Bulldozer模組所構成。[13]

微架構特性 编辑

Bulldozer核心/模組 编辑

 
完整的Bulldozer模組之示意圖
 
完整的基於Bulldozer微架構的處理器示意圖,包含:4模組8核心8線程、L3快取以及I/O總線
 
Bulldozer伺服器的記憶體架構
  • AMD認為並對外聲明這種模組化的設計是“基於集群的多線程”或“兩個整數排程運算單元的集群”。這種基於集群的多線程技術一般稱為“集群多線程”(CMT,Clustered Multithreading),而AMD則定義:基於這種設計的處理單元為一個“模組”(Module)。從硬體的複雜性和功能性的角度出發,Bulldozer模組(集群多線程)介於兩個獨立的處理器核心和超線程之間。兩個獨立的處理器核心的設計中,每個核心擁有獨立的處理單元、快取等運算資源,一般稱這種多線程設計為晶片級多核心CMP,Chip Multi-Processor);而超線程則是兩條線程運作於一個運算排程資源足夠多、管線足夠長(但不可太長)的處理器核心上,兩條線程的運算資源是共用的,包括處理單元、快取,一般稱這種多線程設計為同步多線程SMT,Simultaneous Multithreading);而集群多線程中一般幾條線程或多或少共用fetch、寄存器甚至是浮點運算單元等運算資源,但主要執行單元——整數排程運算單元都是獨占的[14]。這種集群式多線程微架構的設計,綜合了晶片級多核心和同步多線程的特點,最早的實例是DEC在1996年研發後來推出市場的精簡指令集體系的微處理器Alpha 21264,後來的昇陽電腦公司甲骨文公司开发的UltraSPARC T1(核心代號「Niagara」)、UltraSPARC T2(核心代號「Niagara 2」)微處理器也是採用類似的設計(UltraSPARC T2還同時使用了同步多線程技術[14])。[15][16]
    • 超微採用集群多線程設計的Bulldozer模組中,包含兩個x86整數運算排程單元並被辨認為兩個邏輯核心,每個整數運算排程單元各自佔有16KB一級指令快取;一個可拆分為兩個128位元的256位元浮點運算單元,fetch、解碼器、二級快取I/O總線等為兩條線程所共用,即一個模組所有。
  • 每模組都擁有獨立的硬體資源:[17][18][10]
    • 2MB的L2快取(模組內兩個整數運算排程單元共用);
    • 模組內兩個整數運算排程單元共用2路32KB一級指令快取,每整數運算排程單元獨占1路16KB一級指令快取和全數4路64KB一級資料快取,包含快取分支預測[19][20][21]
    • 兩個獨立的整數運算排程單元/整數核心,
      • 每個整數運算排程單元擁有兩個算術邏輯單元ALU,Arithmetic logic unit)和位址產生單元AGU,Address generation unit),由此一個整數排程運算單元在一個時鐘週期內可完成4次運算操作和記憶體存取作業,即一個模組可達成8指令發射/處理作業;
      • 對一些偏重多線程的應用程式,兩個整數排程運算單元和更多的執行管線可提供更多的硬體資源予兩條並行的線程上,以提升這些應用程式的效能表現;
      • 兩個整數運算排程單元的Bulldozer模組比僅有1個整數運算排程單元的僅多出12%的電晶體數量以及5%的晶片面積增量[22]
    • 一組兩個對稱的128位元FMAC(融合乘法加法)浮點運算單元,在接收到有256位浮點運算作業的指令(如AVX)或並行的(x87/MMX/SSE等)128位元浮點運算作業後可以合併為1個256位元的浮點運算單元,這種設計可以更好地相容一些不支援並行對稱浮點運算的應用程式;
    • 共同的Fetch/解碼管線;
  • 所有模組共用三級快取和增強的雙通道DDR3-SDRAM記憶體控制器;
  • 一個模組共計2.13個電晶體,佔用30.9平方毫米的晶片面積,這個數據包含了2MB的二級快取,四個模組共計約12億電晶體;[23]
  • 按照超微的說法,基於AMD Bulldozer微架構的處理器上,一個雙線程的的處理器上有一個Bulldozer模組(2個整數排程運算單元),一個4線程的處理器有兩個模組(4個整數排程運算單元),一個8線程的處理器上有4個Bulldozer模組(8個整數排程運算單元),如此類推。

指令集 编辑

  • 支援IntelAVX指令集(Advanced Vector Extensions,進階矢量擴展),使處理器支援256位元的浮點運算作業。除此之外還支援Intel授權的SSE4.1、SSE4.2、AESCLMUL、Multiply-Add/Accumulat等[8],以及AMD自有的XOP、FMA4、CVT16、SSE4a等,其中XOPFMA4CVT16是AMD原先的SSE5拆分而來(原本Bulldozer將會實現SSE5指令集,但是由於Intel選擇不支援SSE5而另立自己的AVX指令集,AMD最終決定將SSE5分拆)[24],儘管這三者為並行對稱的128位元算指令,但可以相容於AVX的編碼方案。[25][26][25][27]

製程/製作工藝、時鐘頻率、熱設計功耗 编辑

 
四模組八核心的AMD Bulldozer架構的處理器
  • 11層金屬、32納米SOI輔以格羅方德首代HKMG製程;
  • Turbo Core 2.0,和上代Turbo Core一樣可以根據處理器的負載狀態調整各處理器核心的時鐘頻率。在處理器核心閒置時可以降低其時鐘頻率乃至關閉核心;處理器核心滿載時可以提升其時鐘頻率,處理器半數核心處於滿負荷時可以有1GHz的提升幅度,全部核心滿載時也有500MHz的提升幅度,但是時鐘頻率的提升會保持在處理器的TDP限制(俗稱「熱牆」或「工作溫度牆」)之下。與上一代Turbo Core相比,Turbo Core 2.0可以使處理器核心關閉,而且可以調整各個核心的時鐘頻率,而首代Turbo Core則只能一次過調整半數核心的時鐘頻率而不能調整單個核心的,核心閒置也不能被完全關閉。[28]
  • 處理器核心電壓在0.775V至1.425V,伺服器平台的預設時鐘頻率最低1.6GHz,最高3.4GHz;桌上型平台預設時鐘頻率最低2.8GHz,最高達4.2GHz;[23]
  • 熱設計功耗最低25,最高140瓦。

快取、記憶體 编辑

  • 單晶片最高8MB的路快取容量,4模組8核心共用;伺服器版本最高端型號的AMD Opteron 6200系列4模組8核心以上的則為16MB(兩個多晶片模組)。單晶片的8MBL3快取被劃分為4個容量相同的2MB的部分,可以和北橋(記憶體控制器)一併運作於2.2GHz的時鐘頻率上,於1.1125V的操作電壓;[23]
  • 原生支援DDR3-1866記憶體;[29]
  • 桌上型平台的處理器,內建雙通道DDR3記憶體控制器,支援PC3-14900(DDR3-1866)、PC3-16000(DDR3-2000)、PC3-17000(DDR3-2133)以及更高規格的記憶體;伺服器/工作站平台的處理器,則內建四通道DDR3記憶體控制器,可支援PC3-1280(DDR3-1600)暫存型記憶體(ECC記憶體,僅核心代號“Valencia”、“Interlagos”支援)。[30]
  • AMD稱每通道支援兩條DIMM DDR3-1600(亦即每通道的兩條DIMM記憶體插槽可插滿DDR3-1600的記憶體),但單個通道兩條DIMM插上DDR3-1866記憶體時會降低記憶體時脈至1600MHz。

輸出輸入總線、配套晶片組、處理器插座 编辑

 
第一代Bulldozer的處理器之I/O界面示意圖
  • HyperTransport總線升級為3.1版本,預設運作時鐘頻率3.20GHz,傳送速率6.4GT/s,頻寬25.6GB/s,單向位寬16位元。新版本的HyperTransport,在上一代K10.5微架構,HY-D1步進的“Magny-Cours”核心(socket G34平台,新步進版本於2010年3月推出)和“Lisbon”核心(socket C32平台,新步進於2010年6月推出)AMD Opteron處理器上業已使用。
  • AMD官方接受媒体采访时确认:“现有的G34、C32服务器平台会支持基于推土机的新款服务器产品(核心代號為“Interlagos”/“Valencia”)。至于桌面上,为了充分发挥推土机架构的能力,会引入增强的AM3+接口,支持推土机并向下兼容现有AM3接口处理器。”[31][32]
    • 桌面版處理器使用的插座為Socket AM3+(也稱AM3r2)配套晶片組為900系列晶片組[33][34]此代晶片組除了支援AMD自家的CrossFireX多卡互聯技術以外,還會支援NVIDIA SLI多卡互聯技術。[35]
      • 處理器上共942個針腳,插座上也有942個腳位,但和同樣也是942個腳位的Socket AM3插座不同的是Socket AM3+僅支援DDR3-SDRAM記憶體、HT總線版本不同以及供電穩定性更強;
      • 可向下相容於800系列晶片組、使用Socket AM3插座(包括一些已使用Socket AM3+的)的主機板,但需要主機板廠商提供BIOS/EFI韌體更新[36][37],因為AMD官方沒有提供正式的技術支援,也沒有說明Socket AM3+接口的處理器可使用於Socket AM3插座的主機板,然而AMD卻說明了Socket AM3接口的處理器可以使用於Socket AM3+插座的主機板上。[38][31]
    • 伺服器/工作站平台則繼續沿用既有的伺服器晶片組和既有的socket G34(LGA1974)和socket C32(LGA1207)。[31][32]

處理器 编辑

桌上型處理器 编辑

基於Bulldozer微架構的桌上型平台處理器為AMD FX,於2011年9月19日正式上市[39]。使用GlobalFoundries 32nm SOI工艺,支持Turbo Core 2.0、Cool'n'QuietHyperTransport 3.1等技术。使用新的Socket AM3+(942)插座,支持DDR3-1866双通道内存,分为8核、6核、4核三种版本,主频从2.8GHz~4.2GHz不等。配套芯片组为AMD 900系列芯片组。

Bulldozer與Fusion APU“Llano”兩個系列處理器的上市時間定案,分別是2011年9月19日跟2012年第一季。[40]最初有4個Bulldozer處理器在2011年9月19日發佈,分別是:四核心FX-4100、六核心FX-6100、八核心FX-8150、FX-8120。[41]三核心型號(1.5個模組,微軟KB2592546修補程式的定義為“1.5核心”)只供OEM市場。[42]

伺服器處理器 编辑

2011年11月14日,AMD宣佈推出針對伺服器等級效能的Opteron 6200與4200系列處理器(先前代號分別為:Interlagos與Valencia),主要將提供其擴充性,並且提供高出73%的記憶體頻寬,以對應更高階的虛擬化技術應用,同時在整體耗電量部份也讓每組核心減少原有一半,同時也讓主機使用空間減少三分之二,進而節省更多電力空間成本支出。[43][44]

AMD也同步透露2012年將加入全新AMD Opteron 3000伺服器平台,主要鎖定超高密度、超低功耗的1路網路主機代管(Web Hosting)、網路伺服器(Web Serving),以及微型伺服器(Microserver)等應用領域。其中將會先推出代號為「Zurich」的4至8核心架構的處理器系列,同樣採用推土機(Bulldozer)架構且對應AM3+插槽,並且預計將於2012上半年間出貨。[43][44]

主要特性 编辑

  • 同價位伺服器處理器產品效能約較競爭品牌高出89%[43][44]
  • 處理器陣容齊全、從4核心一路涵蓋到16核心[43][44]
  • 與前代平台相同的功耗曲線下,每顆核心功耗最低約可達4.375W[43][44]
  • 處理關鍵雲端、虛擬化及高效能運算等作業時,效能可高出24%至84%[43][44]
  • 擁有2路處理器最高的TPCC速度測試分數[43][44]
  • 最低的虛擬系統(virtual machine,VM)單位成本[43][44]
  • 最高可達4個記憶體通道,最高可支援1600MHz記憶體時脈[43][44]
  • 支援1.25伏特超低電壓記憶體[43][44]
  • 每顆處理器最高支援12組DIMM記憶體,最高可支援384GB記憶體[43][44]
  • 最多可支援4個16倍速的HyperTransport(HT3)鏈路,每個鏈路傳輸速度達每秒6.4GT[43][44]

效能表現和市場反應 编辑

AMD FX系列效能問題 编辑

首款基於Bulldozer微架構的消費級處理器AMD FX上市後,在微架構的設計上、效能上和能耗上飽受爭議。首發的頂級型號FX-8150,在倚重單線程的基準效能測試中,測試結果顯示FX-8150不僅落後於基於NehalemSandy Bridge等微架構的Intel Core i系列,還不如基於K10微架構的AMD Phenom II系列;[45]不過在倚重多線程的效能測試中,結果顯示勉強可以追平Phenom II X6 1100T和Intel Core i7-2600K。縱觀各媒體的效能測試結果,FX-8150綜合效能強於Intel Core i5 2500K,而零售價格則在其之下,這個結果並沒給市場預期留下好印象。[46][47]在效能測試中,FX-8150在廠方預設時鐘頻率下運作,無論待機抑或滿負荷運作,能耗比與Intel基於SandyBridge的處理器不相上下,但是進行較大幅度的超頻後,FX-8150儘管效能提昇明顯但處理器會變得極其耗電,能耗比變得相當低下。[48][49][50][51]

Tom's Hardware的網站評論認為,這種在多線程負載下仍然不如預期的效能表現,是由於目前Windows 7的線程和處理器核心一一對應的線程排程方式。他們指出,如果Windows首先把一條線程分配給一個Bulldozer模組,並在模組內分為兩條子線程以充分利用該模組內的整數排程運算單元,這將會效能最大化地使處理器同時處理四條線程。這種線程排程方式和帶有超線程的Intel微處理器的類似——Windows 7會在利用邏輯核心(超線程得到的)前把線程安排至物理核心上。[52]

對於處理器在超頻狀態時誇張的功耗水平,業界相信由於格羅方德的32納米SOI HKMG製程仍舊不成熟,這個導致了處理器核心在更高時脈下運作時,漏電現象嚴重,使耗電量飆升以及核心發熱量大增。[53][54]而且有效能測評指出,AMD為壓低FX系列的功耗,有意壓低部分型號處理器的最高工作溫度,而這個溫度的設定值,實際還低於處理器在預設時鐘頻率下滿負荷運作時的最高溫度,這樣一來在處理器過熱保護機制下,效能受到了不小的影響,從而使處理器效能不如預期。[55]

而AMD FX的較低階的型號中,FX-4100系列與Intel Core i3系列之間的比較以及FX-6100系列與Intel Core i5系列(Core i5 2500K除外)之間的比較中,除了某些倚重單線程的應用程式和基準效能測試項目以外,其餘的差距不大。不過功耗方面仍然有些偏高,尤其是超頻以後功耗仍然大幅增加。[56][57][58][59]

2011年10月13日,AMD在其官方部落格中回應了AMD FX系列處理器的效能、功耗表現不如市場預期的問題,除了指出由於微架構不同於以往的x86處理器的微架構,現行的應用程式以及基準效能測試程式沒有對Bulldozer微架構的特點進行充分優化,以至效能不如預期以外,也承認FX-8150效能不濟的事實:不少效能測試成績不如Intel的Core i7-2600K/2700K,甚至比不過AMD上一代的消費級頂級產品Phenom II X6 1100T。AMD同時表示,在2012年以後的發展規劃中,將提升Bulldozer微架構的效能,並降低功耗,目標是每一瓦電功率的效能提升10%至15%。格羅方德也表示繼續改進其32納米SOI HKMG製程。[45][60]根據目前一些基於AMD Piledriver微架構的AMD Fusion(核心代號“Trinity”)的工程樣品的效能測試,結果顯示和AMD的預期效能一致。[61][62]

超級電腦 编辑

AMD於2011超級電腦展(Supercomputing 2011)上,宣布基於Bulldozer微架構的新款AMD Opteron 6200系列處理器已被HPCwire雜誌的編輯與讀者評選為2012年最受矚目的五款新產品之一,並被美國國家科學基金會(National Science Foundation)的Blue Waters計畫採用,將在伊利諾州的國家超級電腦應用中心(NCSA)建置此部超級電腦[63]

超過235部,搭載近5萬顆AMD Opteron 6200系列處理器的Cray XE6機櫃,使Blue Waters超級電腦能提供超過每秒千兆次(petaflop)的充裕效能,在各種現象研究上的獲得突破性進展,包括:宇宙大爆炸(Big Bang)之後的演進、龍捲風的形成、病毒侵入細胞的機制,與其他眾多科學工程方面的應用。

2012年12月,搭載18,688顆8模組16核心的AMD Opteron 6274為任務分配單元,18,688顆NVIDIA Tesla運算加速卡(GK110通用圖形處理器)的泰坦超級電腦以17.59petaFLOPS的記錄榮登TOP500第一名,Green500(超級電腦效能功耗比前500強)第三名。[64][65]

效能優化修補程式 编辑

2011年12月16日,微软发布了KB2592546[66],即传说中的推土机线程调度补丁。而當天上午微软就已经撤下了补丁,对于这一点BSN网站[67]联系了微软和AMD,得到了AMD方面的官方回应:

微軟在KB2592546之後,針對以Win7Windows Server 2008 R2的電腦為基礎,進行最佳化。目前,AMD推土機處理器比預期的慢。因為在該兩種作業系統的執行緒邏輯,只對同步多執行緒(Simultaneous Multithreading, SMT)的排程特色進行優化,而沒對集群多線程(CMT,Clustered Multithreading)一類的多線程設計的處理器進行特別優化,來讓效能最有效地運行。[67][52][69]

後來完整版的修補程式(KB2646060以及KB2645594更新檔)發布,不少效能測試結果顯示這些效能優化修補程式效用有限,無論是伺服器平台還是桌面平台,最多僅在某些項目上有15%的效能增長。[69]

2012.09.21 AMD的驅動程式已有內建修補無需安裝微軟的修正程式

金氏世界紀錄 编辑

AMD全球副總裁暨終端產品事業群總經理Chris Cloran表示,等級最高的FX-8150八核心處理器,在2011年8月31日,由AMD團隊超頻達到8.429GHz,超越同廠處理器先前的被「Team AMD FX」締造的8.308 GHz成績,榮登金氏世界紀錄「最高時脈的電腦處理器」。[70][71]

改進版本 编辑

AMD在2011年發布2012年的財政預算以及2012年的產品路線圖時宣布,在2012年的第三季度發布Bulldozer微架構的改進版Piledriver。首批基於Piledriver的處理器是核心代號「Trinity」的AMD A系列處理器(APU)行動版本和桌面版本;新FX和Opteron在2012年9月發布。[72][73]

参考文献 编辑

  1. ^ Inside the AMD Bulldozer Architecture. [2012-06-13]. (原始内容存档于2011-07-11). 
  2. ^ 2.0 2.1 AMD's Bulldozer Microarchitecture. [2013-03-19]. (原始内容存档于2013-02-27). 
  3. ^ 3.0 3.1 Bulldozer 50% Faster than Core i7 and Phenom II, techPowerUp, [2012-01-23], (原始内容存档于2012-01-06) 
  4. ^ AMD64 Architecture Programmer’s Manual Volume 6: 128-Bit and 256-Bit XOP, and FMA4 Instructions (PDF), AMD, 2009-05-01 [2009-05-08], (原始内容存档 (PDF)于2009-05-20) 
  5. ^ Striking a balance, Dave Christie, AMD Developer blogs, 2009-05-07 [2009-05-08], (原始内容存档于2012-04-05) 
  6. ^ 2011至2012年最新AMD產品發表時程大公開 (PDF). AMD. 2011第一季 [2011-12-21]. (原始内容 (PDF)存档于2011-04-09) (中文(臺灣)). 去年11月9日,AMD在加州陽光谷總公司所舉辦的2010年度財務分析日上,除了展示2011年初正式面市的AMD Fusion加速處理運算單元(APU)技術,當天也首次公開展示全新一代的高效能x86多核心架構「Bulldozer」,並且揭露並更新關於APU和Bulldozer上市時程的消息。 
  7. ^ AMD Sets New Mark in x86 Innovation with First Detailed Disclosures of Two New Core Designs, AMD: 1, 2011-08-24 [2011-09-18], (原始内容存档于2012-06-14) 
  8. ^ 8.0 8.1 新浪北京. AMD公佈更多Bulldozer處理器消息. 新浪網. 2011-02-24 [2011-02-24]. (原始内容存档于2014-08-26) (中文(香港)). 
  9. ^ Analyst Day 2009 Presentations, AMD, 2009-11-11 [2009-11-14], (原始内容存档于2016-01-21) 
  10. ^ 10.0 10.1 Analyst Day 2009 Presentations. AMD. 2009-11-11 [2009-11-14]. (原始内容存档于2016-01-21). 
  11. ^ Analyst Day 2009 Summary, AMD, 2009-11-11 [2009-11-14], (原始内容存档于2009-11-15) 
  12. ^ AMD bestätigt: "Zambezi" ist inkompatibel zum Sockel AM3, Planet3dnow.de, [2012-01-23], (原始内容存档于2012-01-18) 
  13. ^ soothepain. AMD Zambezi Bulldozer處理器2011年4月登場. 滄者極限. 2010-12-24 [2011-02-24]. (原始内容存档于2019-09-19) (中文(臺灣)). AMD Zambezi Bulldozer處理器將有8個核心,採用32nm製程、L3快取8MB、AM3+腳位設計。同時所搭配的平台「Scorpius」天蠍座,最頂級的將採用990FX北橋搭配SB950南橋,990FX可提供2個PCI-E x16的通道,新的SB950南橋將支援RAID 5、16個USB 2.0、SATA 6Gb/s,很遺憾的並沒有原生的USB 3.0。 
  14. ^ 14.0 14.1 机密揭露:Intel超线程技术有多少种?页面存档备份,存于互联网档案馆) - IT168服务器专区
  15. ^ 全面解析AMD Bulldozer集群多线程架构_组件芯片_服务器频道_至顶网. [2012-06-12]. (原始内容存档于2013-05-13). 
  16. ^ AMD推土机集群多线程/Intel HT全对比 Archive.is存檔,存档日期2012-09-17 - 硬派
  17. ^ Bulldozer microarchitecture block, AnandTech, 2010-08-24 [2012-06-12], (原始内容存档于2012-03-30) 
  18. ^ Bulldozer module functional schematic, AMD, 2010-08-24 [2012-06-12], (原始内容存档于2012-10-01) 
  19. ^ More On Bulldozer, Tomshardware.com, 2010-08-24 [2012-01-23] 
  20. ^ AMD Reveals Details About Bulldozer Microprocessors, AMD Reveals Details About Bulldozer Microprocessors, Xbitlabs.com, [2012-01-23], (原始内容存档于2011-09-03) 
  21. ^ Real World Technologies, AMD's Bulldozer Microarchitecture, Realworldtech.com, 2010-08-26 [2012-01-23], (原始内容存档于2011-12-10) 
  22. ^ Bulldozer design power efficiency, AMD, 2010-08-24 [2012-06-12], (原始内容存档于2012-03-30) 
  23. ^ 23.0 23.1 23.2 AP (PDF), [2012-01-23], (原始内容存档 (PDF)于2012-01-20) 
  24. ^ XOP and FMA4 Instruction set in SSE5, Techreport.com, 2009-05-06 [2012-01-23], (原始内容存档于2012-06-05) 
  25. ^ 25.0 25.1 AMD64 Architecture Programmer’s Manual Volume 6: 128-Bit and 256-Bit XOP, FMA4 and CVT16 Instructions (PDF). AMD. 2009-05-01 [2009-05-08]. (原始内容存档 (PDF)于2009-05-20). 
  26. ^ Striking a balance. Dave Christie, AMD Developer blogs. 2009-05-07 [2009-05-08]. (原始内容存档于2012-04-05). 
  27. ^ Striking a balance. Dave Christie, AMD Developer blogs. 2009-05-07 [2009-05-08]. (原始内容存档于2012-04-05). 
  28. ^ AMD Financial Analyst Day 2010, Server Platforms Presentation, Ir.amd.com, 2010-11-09 [2012-01-23], (原始内容存档于2013-11-12) 
  29. ^ AMD Roadmap, [2012-01-23] 
  30. ^ Timothy Prickett Morgan, AMD laughs at Intel with Opteron Bulldozers, theregister.co.uk, 2010-11-15 [2012-01-25], (原始内容存档于2012-02-26) 
  31. ^ 31.0 31.1 31.2 ugmbbc. AMD:桌面推土机将采用AM3+接口兼容AM3处理器. cnbeta.com. 2010-08-28 [2011-12-24]. (原始内容存档于2010-08-31) (中文(中国大陆)). AMD近日公布了下一代处理器架构推土机的大量技术细节,不过还有一个问好萦绕在很多人心头:新架构是否会向Intel那样频频更换新接口而导致无法向下兼容?AMD桌面处理器目前的主力封装接口为AM3,首选搭配AM3插座主板,而之前的AM2+插座主板通过更新BIOS也能支持AM3处理器,只是损失高速HT总线等新特性。 
  32. ^ 32.0 32.1 AMD為資料中心樹立價格、效能與功耗新標竿页面存档备份,存于互联网档案馆) - amd.com.tw
  33. ^ AMD Bulldozer FX-8150 vs i7-2600K完整效能測試页面存档备份,存于互联网档案馆),Page1 - VR-Zone中文版
  34. ^ 明年中期上市AMD 9系主板芯片组前瞻页面存档备份,存于互联网档案馆) - CPU新闻_电脑之家PChome.net
  35. ^ 天底下沒有永遠的敵人,輝達將SLI能力賦予AMD新一代990晶片組页面存档备份,存于互联网档案馆) - engadget中文版
  36. ^ ASUS confirms AM3+ compatibility on AM3 boards, Event.asus.com, [2012-01-23], (原始内容存档于2013-06-06) 
  37. ^ MSI confirms AM3+ compatibility on AM3 boards, Event.msi.com, [2012-01-23], (原始内容存档于2012-01-16) 
  38. ^ AM3 processors will work in the AM3+ socket, but Bulldozer chips will not work in non-AM3+ motherboards. [2012-06-12]. (原始内容存档于2010-12-10). 
  39. ^ Bulldozer時脈創金氏記錄,單核效能被Phenom II打臉?页面存档备份,存于互联网档案馆) - T客邦
  40. ^ 全新「Bulldozer」微架構AMD AM3+處理器產品最新規劃{Page1}. 
  41. ^ Unlock Your Record Setting AMD FX Series Processor Today, Amd.com, [2012-01-23], (原始内容存档于2012-01-22) 
  42. ^ 全新「Bulldozer」微架構AMD AM3+處理器產品最新規劃{Page2}. 
  43. ^ 43.00 43.01 43.02 43.03 43.04 43.05 43.06 43.07 43.08 43.09 43.10 43.11 udn數位資訊. AMD全新Opteron處理器伺服器更具效能、更省電. 聯合新聞網. 2011-11-14 [2011-11-24]. (原始内容存档于2014-08-26) (中文(臺灣)). Intel在今天正式宣佈Sandy Bridge-E系列處理器解禁消息,AMD陣營則是在同一天宣佈推出針對伺服器等級效能的Opteron 6200與4200系列處理器(先前代號分別為Interlagos與Valencia),主要提供企業更具效能的虛擬化運算,但整體耗電量卻更少的表現。 
  44. ^ 44.00 44.01 44.02 44.03 44.04 44.05 44.06 44.07 44.08 44.09 44.10 44.11 新款AMD Opteron™處理器帶來極致的效能、擴充性與效率页面存档备份,存于互联网档案馆) - AMD.COM.TW
  45. ^ 45.0 45.1 效能居然倒退?AMD FX与Intel P4的故事_CPU内存硬盘评测. [2011-11-09]. (原始内容存档于2011-10-25). 
  46. ^ [www.mobile01.com/newsdetail.php?id=11386 AMD Phenom II X6 1100T與同門FX-8120效能解析] - Mobile01
  47. ^ AMD Bulldozer FX-8150 vs i7-2600K完整效能測試页面存档备份,存于互联网档案馆) - VR-Zone中文版
  48. ^ Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs: 13, 2011-10-11 [2012-01-23], (原始内容存档于2012-01-13) 
  49. ^ Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs: 14, 2011-10-11 [2012-01-23], (原始内容存档于2012-01-16) 
  50. ^ 全方位认识推土机:AMD FX-8120最全面解析与评测_文库_PC绝对领域. [2012-05-12]. (原始内容存档于2012-07-25). 
  51. ^ 终极版超频FX-8150同i7-2600K对比测试页面存档备份,存于互联网档案馆) - 新浪數碼
  52. ^ 52.0 52.1 Tom's Hardware review", Tomshardware.com, 2011-10-12 [2012-01-23] 
  53. ^ 对决推土机、APU:Core i7-2700K全方位评测-Intel,Core i7-2700K,i7-2600K,推土机,FX-8150,对比,评测-驱动之家. [2011-10-27]. (原始内容存档于2011-10-27). 
  54. ^ AMD Bulldozer FX-8150 vs i7-2600K完整效能測試页面存档备份,存于互联网档案馆),Page8 - VR-Zone中文版
  55. ^ 全方位认识推土机:AMD FX-8120最全面解析与评测页面存档备份,存于互联网档案馆) - pceva.com.cn
  56. ^ 史上最高频!AMD推土机FX-4170性能测试页面存档备份,存于互联网档案馆) - 硬派
  57. ^ AMD FX Vs. Intel Core i3: Exploring Game Performance With Cheap GPUs - Tom's Hardware.com
  58. ^ 同样的显卡:i3-2100、FX-4100谁更快?页面存档备份,存于互联网档案馆) - 驅動之家
  59. ^ 结果竟然是?AMD六核推土机FX-6100评测页面存档备份,存于互联网档案馆) - pconline.com.cn
  60. ^ Our Take on AMD FX, Blogs.amd.com, 2011-10-13 [2012-01-23], (原始内容存档于2012-07-07) 
  61. ^ AMD Trinity On The Desktop: A10, A8, And A6 Get Benchmarked! - Tom’s hardware
  62. ^ 大起底!AMD台式机版Trinity APU首测页面存档备份,存于互联网档案馆) - 驅動之家翻譯自Tom's Hardware
  63. ^ 屢獲獎的新款AMD Opteron™處理器打造全球頂尖超級電腦
  64. ^ Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan. TOP500. 2012-11-12 [2012-11-15]. (原始内容存档于2013-01-21). 
  65. ^ Williams, Leo. Titan is Also a Green Powerhouse. Oak Ridge Leadership Computing Facility. 2012-11-14 [2012-11-15]. (原始内容存档于2013-02-16). 
  66. ^ 在【更新】以最佳化AMD Bulldozer Cpu的效能. [2011-12-17]. (原始内容存档于2011-12-18). 
  67. ^ 67.0 67.1 Theo Valich. Microsoft Releases AMD Bulldozer Patch by Mistake: Incomplete Update. Bright Side Of News. 2011-12-16 [2011-12-21]. (原始内容存档于2012-01-07) (英语). 
  68. ^ 68.0 68.1 ChrisR. AMD:微软的推土机补丁不完整就拿出来了. 驅動之家. 2011-12-17 [2011-12-21] (中文(中国大陆)). 昨日微软发布了KB2592546,即传说中的推土机线程调度补丁,不过据实测结果来看,理论性能方面几乎没有什么变化,反倒是WinRAR性能大幅降低。游戏性能方面目前并没有人拿出可信服的数据来证明有提升幅度。 
  69. ^ 69.0 69.1 安裝Windows 7更新檔,實測AMD FX處理器效能增加多少? - 第3頁页面存档备份,存于互联网档案馆) - T客邦
  70. ^ Matt Kan. 金氏世界紀錄超頻秀登「台」 八核心推土機處理器來囉!. 今日新聞網. 2011-10-14 [2011-12-24]. (原始内容存档于2011-12-17) (中文(臺灣)). 
  71. ^ AMD Bulldozer CPU beats world record again achieving 8.461GHz. [2013-03-19]. (原始内容存档于2012-04-28). 
  72. ^ AMD行動產品Roadmap曝光,2012 Q1 Llano接班人Trinity上場页面存档备份,存于互联网档案馆) - T客邦
  73. ^ AMD下代APU改用「Piledriver」微架構13年升級至28nm進入異類多核心時代页面存档备份,存于互联网档案馆) - hkepc

外部連結 编辑

參見 编辑