AMD keluarkan Opteron 2435 Six-Core

June 10, 2009

Reading time ~6 minutes

Logo AMD opteronLogo AMD opteron

Setelah hadirnya 45 nm Quad-core Opteron CPU membuat AMD menjadi the best server CPU saat di luncurkan, beberapa bulan kemudian kesuksesan AMD dihapuskan oleh kehadiran tsunami yang disebut dengan  “Nehalem”. Nehalem arsitektur yang unik mengkombinasikan tweak terhadap superior integer engine dengan menggunakan metode brute force tactic dengan di integrasikanya triple channel integrated memory controller. Dengan begitu IMC akan menghasilkan low latency dan jumlah bandiwth massive yang sangat tinggi akibat DDR-3 DIMM. Namun itu saja belum cukup bagi para Intel engineer. Mereka juga menambahkan MultiThreading (SMT), dan ini merupakan pukulan hebat untuk kompetitor manapun yang membuatnya dapat berdiri di dunia pasaran server. SMT atau Hyperthreading sebagaimana Intel katakan akan mendongkrak hingga 30% lebih untuk aplikasi khusus seperti SAP, Oracle dan MS SQL Server. Ini mengakibatkan Xeon versi lama dan AMD best CPU  tetinggal kemampuanya dari 60 hingga 85% dan menjadikanya processor pra-sejarah.

Perdebatan detail mengenai benchmark ini pun terjadi walaupun hasilnya tidak selalu signifikan. karena masing masing score didapat dengan menggunakan DDR3-1333, Sementara mayoritas X55xx server menggunakan DDR3-1066. dan selain itu konsumsi daya untuk Xeon tercepat adalah 20W lebih tinggi CPU dibandignkan dengan “Shanghai” Opteron. Jadi kalau kita ingin membandingkanya berdasarkan konsumsi daya yang digunakan maka processor ini cocok di bandingkan degnan E5540 pada kecepatan 2.53 GHz. Namun walaupun dengan menggunakan DDR3-1066 pada 2.53 GHz, Xeon maka AMD quad-core pun dapat unjuk gigi dengan perbandingan dari 40 hingga 70%. Bahkan AMD memiliki bandwidth yang lebih tinggi untuk beberapa intensive application. Jadi kesimpulanya adalah, AMD dapat mengirimkan jumlah Gigaflop yang sama pada keadaan konsumsi daya yang rendah dan harga yang murah. Namun sayangnya benchmark ini hanya menggunakan 1% dari jenis aplikasi yang ada di pasaran. 

Sejak dikeluarkanya 45 nm CPU, AMD sepertinya mengulang generasi K75,  yang telah dikeluarkan pada bulan October 1999, AMD memperkenalkan “K75” pada arsitektur 250 nm dan mempercepat “x86-Alpha” hingga 1 GHz pada bulan Maret tahun 2000, hanya terpaut 5 saja untuk mengeluarkan generasi yang lebih canggih. Seperti halnya 10 tahun yang lalu semenjak AMD berhasil mengeluarkan 45 nm quad-core, kini AMD mengeluarkan hex-core “Istanbul” pada kecepatan 2.6 GHz lebih awal dari yang diharapkan. Pada dasarnya ini menggunakan platform “Shanghai” Opteron dengan 2 extra core dan dilakukanya tweak pada memory controller. Hingga akhirnya AMD mengeluarkan produk yang cukup menarik perhatian dalam waktu dekat yaitu hex-core pada kecepatan 2.6 GHz, CPU ini akan mengkonsumsi daya yang lebih kecil dibandingkan dengan quad-core sebelumnya pada kecepatan 2.7 GHz. Ini merupakan improvisasi yang sangat berani dilakukan oleh AMD, dimana ini akan menjadi pertanyaan untuk para IT professional

Apakah AMD six-core ini penting ?

Dalam beberap aplikasi CPU ini menggunakan teknologi yang berbasis pada “Istanbul”, lalu pertanyaan berikutnya adalah, apakah 2 ekstra core sudah cukup untuk mengembalikan nama AMD Opteron untuk kembali ke high performance server?

Pertanyaan ini bisa terjawab saat Intel mengeluarkan teknologi hex-core “Dunnington”, namun beberapa aplikasi saat itu banyak mengalami bug dan tidak kompatibel. Sedangakan quad-socket “Istanbul” diperkirakan akan memiliki masalah yang sama seperti halnya “Dunnington”: beberapa server application lebih menyukai perhitungan “2n core”, beberapa aplikasi saat ini belum ada yang mammpu memaksimalkan proses nya hingga ke 8 core apalagi melampaui 16 core. Jadi kenyataanya adalah dalam dunia server banyak application yang belum memiliki skala penggunaan CPU dari 8-16 cores. Mailserver, webserver dan bahkan beberapa database server pun belum sampai kesitu.

Ada yang berbeda dari Istanbul.

Six-core “Istanbul” CPU ternyata tidak seperti yang dibayangkan, CPU ini bekerja dengan metode yang berbeda dari Nehalem Xeon yang menawarkan 8 logical core, Pada Nehalem 2 thread pada masing masing core telah di bagi kepada 32 KB L1 dan 256 KB L2 yang lebih kecil. Sedangkan Istanbul dapat bekerja dengan hanya menggunakan 6 thread, namun masing masing thread akan melalui 64 KB L1 dan ini mengakibatkan pengguanan 512 KB L2 akan lebih leluasa. Kasarnya AMD “Istanbul” Opteron menawarkan proses komputasi yang lebih intensive khususnya untuk HPC application, Database yang besar dan berat nya proses virtualisasi akan menjadi makanan ringan bagi processor ini. Six-core CPU ini akan menjadi replacement dari quad-core Opteron yang sudah ada saat ini. Ini berarti kapasitas memory dari server yang menggunakan six-core ini mungkin akan sama.

Peningkatan pada Istanbul

Core yang terdapat dalam “Istanbul” tidak berbeda jauh dengan yang ditemukan pada Shanghai. Istanbul memperkenalkan beberapa teknologi yang dapat meningkatkan performance CPU mereka yaitu:

  • HT assist,
  • HT speed yang lebih tinggi,
  • APML dan
  • x8 ECC.

X8 ECC: Masing masing DRAM chip pada DIMM menghasilkan 4 bits atau 8 bits dari 64-bit data word. Chip yang menghasilkan 4 bit disebut dengan x4 (faktor pengali 4), dan sedangkan chip yang menghasilkan 8 bit disebut dengan x8 (faktor pengali 8). Untuk itu, ini akan membutuhkan setidaknya 8 x8 chip atau 16 x4 chip untuk menghasilkan 64-bit word, Sehingga setidaknya ada 8 chip yang tersimpan pada masing masing DIMM. Istanbul memory controller saat ini mensupport error correction baik untuk x4 ataunpun x8 DIMM.

APML Remote Power Management Interface: APML memberikan anda sebuah interface yang mengizinkan anda untuk memonitor dan mengkontrol konsumsi daya pada CPU melalui P-state limit. Anda membutuhkan CPU dan sebuah BMC (management processor) yang mensupport APML pada server dan anda juga membutuhkan software khusus (OS atau management software) yang mensupport APML untuk mengizinkan anda untuk memonitor daya dan membuat perubahan pada power management parameter.


Kecepatan hyper transport dapat di set melalui biosKecepatan hyper transport dapat di set melalui bios

HT Speed yang lebih cepat: Versi berikutnya dari “Shanghai” dan Opteron adalah didukungnya teknologi HyperTransport 3.0 atau HT3. HT3 akan memberikan clockspeed yang lebih tinggi dibandingkan HyperTransport link yang ada pada Opteron lama saat ini (1GHz). Clockspeed di percepat hingga 2.2 GHz DDR, dan mampu mentransfer data hingga 8.8 GB/s untuk masing masing arah. Istanbul mendongkrak clock dari HyperTransport hingga 2.4GHz DDR, dan mampu mentransfer data hingga 9.6 GB/s untuk masing masing arah. dan ini tentu saja mengalahkan QPI links yang ditemukan pada “Nehalem” Xeon. CPU interconnect speed ini dapat dikontrol langsung melalui BIOS seperti gambar berikut ini.

HT Assist : HT assist adalah snoop filter AMD yang telah di implementasikan untuk mengetahui cara kerja teknologi ini, kita dapat melihat nya sebagai contoh pada quad Shanghai system. Kuncinya terletak pada CPU 3 membutuhkan sebuah cacheline khusus untuk berkomunikasi dengan CPU 1 yang memiliki akses terhadapnya.

Praktek tampa HT Assist.

Dimulai dari CPU 3 dan mengikuti operasi sequence:

Tampa menggunakan HT AssistTampa menggunakan HT Assist

  1. CPU 3 meminta dari CPU 1 (biru = “data request” panah pada diagram)
  2. CPU 1 akan membroadcast untuk melihat apakah CPU lainya memiliki data (3 panah merah = “probe request” pada diagram)
  3. CPU 3 akan idle salama probe ini di selesaikan (4 panah merah dan putih = “probe response” pada diagram)
  4. Data yang diminta akan dikirimkan dari CPU 2 ke CPU 3 (2 panah biru dan putih = “data response” pada diagram)

Dari mekanisme ini ada beberapa masalah yang cukup serius khususnya dalam pendekatan broadcasting. Pertama, ia akan menghabiskan banyak bandwidth sebagaimana setidaknya membutuhkan 10 transaksi untuk melakukan aksi yang sederhana. Kedua, 10 transaksi ini akan menambahkan banyak latency kepada CPU 3 yang dibutuhkan oleh sebuah data (yang diminta CPU 3 ke CPU 1).

Solusinya adalah dengan menggunakan directory-based system, yang disebut AMD sebagai HT Assist. HT assist akan memberikan porsi 1MB untuk masing masing CPU L3 cache untuk bertingkah laku sebagai direktori. Direktori ini akan melakukan track pada barisan CPU cache yang digunakan pada system. Dengan kata lain L3-caches hanya menggunakan 5 MB, ini mengakibatkan banyaknya snoop traffic akan di eliminasi untuk memahami lebih seksama dapat melihat diagram berikut ini:

Praktek dengan HT Assist.

Dimulai dari CPU 3:

Dengan menggunakan HT AssistDengan menggunakan HT Assist

  1. CPU 3 meminta informasi dari CPU 1 (Garis biru)
  2. CPU 1 akan memeriksa L3 directory cache untuk mengalokasikan data yang diminta (garis merah gemuk)
  3. Hasil bacaan dari CPU 1 terhadap L3 directory cache mengindikasikan CPU 2 memiliki data tersebut dan secara langsung akan memproses CPU 2 (Garis merah gelap)
  4. Data yang diminta akan dikirim dari CPU 2 ke CPU 3 (garis biru dan putih)

yang awalnya membutuhkan 10 transaksi kini di perpendek menjadi 4 dengan begitu ini akan mereduksi latency dan bandwidth yang sia sia.

Komparasi Processor

Sebagai referensi, berikut ada tabel komparasi processor antara AMD dan Intel CPU saat ini.

Bandwith yang diberikan masing masing processorBandwith yang diberikan masing masing processor

Jumlah transistor dan coreJumlah transistor dan core

Harga GHZ / USD nya untuk masing masing processorHarga GHZ / USD nya untuk masing masing processor

Salah satu Benchmark dari Vapus Mark1Salah satu Benchmark dari Vapus Mark1

[Sumber: Anandtech]

comments powered by Disqus