AMD’de Yeni Dönem: Zen 5 Mimarisine Ait Tüm Detaylar

AMD, donanım meraklılarının beklediği Zen 5 mikro mimarisinden ilk kez Computex 2024’te bahsetmişti. Teknoloji devleri sadece bugünü ve yarını değil, yıllar sonrasını düşünerek planlamalar yapar. Kırmızılıların “Zen” serüveni Zen 5 ile devam ediyor, yeni mikro mimari ile geleceğe yönelik adımlar atılıyor.

Şirket yeni mimarisini masaüstü, mobil ve sunucu alanları dahil olmak üzere sayısız işlemcide benimseyecek. Zen 5 çekirdeklerinin ismini sık sık Ryzen AI 300 “Strix Point” mobil ve Ryzen 9000 “Granite Ridge” masaüstü işlemci serileriyle duyacaksınız. Yeni çipler ilk piyasaya çıktığında teknoloji dünyasında çok fazla tartışma yarattı, halen bu tartışmalar devam ediyor. Biz de bugün AMD’nin neler yapmak istediğini, gelecek planlarını ve son nesil mimari ile neler değiştiğini konuşacağız.

Hem grafik hem de yapay zeka performansında bazı temel geliştirmelerle birlikte gelen Zen 5 CPU mikro mimarisi çeşitli alanlarda iyileştirmeler sunacak. Ryzen AI 300 Serisi dizüstü bilgisayar işlemcileri, yapay zeka performansını 50 TOPS düzeyine çıkaran yeni XDNA 2 NPU ile destekleniyor.

AMD ayrıca entegre grafiklerin performansını da geliştirdi. Masaüstü Ryzen 9000 platformunda bunun pek bir önemi olmasa da mobil APU’larda önemli. Daha önce kullanılan RDNA 3 mobil grafiklerin yerini bazı yükseltmeler alan RDNA 3.5 GPU’lar dolduracak.

Daha da önemlisi, CPU’ların kalbinde yer alan Zen 5 çekirdeklerinde ciddi değişimler söz konusu. Belki kullanıcılar kıyaslama yaparken doğrudan “ortalama FPS skorlarına” bakıyor olabilir. Ancak mimari bazda önemli adımlar atıldığını söyleyebiliriz. Zen 5’i ileriye götüren temel ilerleme, Zen 4’e kıyasla sağlanan IPC kazançları. Yani döngü başına daha yüksek komut işleme becerisi.

Zen 5 (2024)	Zen 4 (2022)	Zen 3 (2020)	Zen 2 (2019)	Zen 1 (2017)
IPC Gelişimi	+16%	+13%	+19%	+15%	+52%

AMD’nin Zen 5 destekli yongaları, döngü başına talimat (IPC) veriminde ortalama %16 artış sağlayan yepyeni bir mikro mimariyle piyasaya çıkıyor. Yol haritasında da görebileceğiniz gibi, Zen 5 mimarisi ömrü boyunca hem 4nm (N4P) hem de 3nm işlem teknolojilerini kapsayacak. Peki bu ne anlama geliyor? Daha gelişmiş üretim teknolojileriyle birlikte daha fazla performansa sahip ikinci nesil modeller bekleyebiliriz.

İşlemcilerde IPC Nedir?

Zen 5’in değişim sürecini en iyi çekirdek merkezli olarak incelediğimizde anlayabiliriz. Çekirdek sayısında, saat hızında veya önbellek kapasitesinde önemli değişiklikler görmüyoruz, ancak performans önemli ölçüde arttı.

Bu ilerlemeyi sağlamak için çeşitli mimari iyileştirmeler uygulandı. Örneğin AMD, işlemcinin bir dallanma talimatının yönünü onaylanmadan önce tahmin etme verimliliğini artırmak için dallanma tahmin doğruluğunu optimize etti ve gecikme süresini azalttı. Şirket ayrıca, aynı anda daha fazla verinin işlenmesini kolaylaştıran ve çekirdeğin paralel işleme yeteneğini geliştiren işlem hatlarını ve vektör boyutlarını genişleterek verim yeteneklerini de iyileştirdi. Diğer yandan, Zen 5 işlemcilerin işlem hattında daha fazla talimata izin veren ve genel hesaplama verimini artıran genişletilmiş pencere boyutlarına sahip olduğu söyleniyor.

Veri işleme açısından AMD, Zen 5 mimarisinin ön uç talimatları için bant genişliğini iki katına çıkardığını bildirdi. Bu gelişme aynı zamanda L1 ve L2 önbellekleri arasında ve L1 önbellekten kayan nokta (FP) birimine artan veri aktarım hızlarına da yansıyor ve bu da işlemcinin karmaşık hesaplamaları ve yoğun veri gerektiren görevleri yerine getirme verimliliğini önemli ölçüde artıracak.

İşlem Hattı ve Dal Tahmin Sistemi

Yeni mimarinin temel kilit noktası, AMD’nin gelişmiş dallanma tahmini olarak adlandırdığı süreçle birleştirilen çift işlem hattı. Zen 5 işlemciler, çift kod çözme becerisine sahip işlem hattıyla geliştirilmiş bir dal tahmin sisteminden yararlanıyor. Bu değişiklik dal tahmin motoru için önemli ölçüde daha yüksek verim sağlarken, AMD bunun aynı zamanda gecikmeyi azaltmaya ve doğruluğu artırmaya yardımcı olduğunu vurguluyor. Gönderme ve yürütme motorlarının sayısı da 8 genişlikli bir tasarıma yükseltildi. Yani ne demek istiyoruz? İşlemcinin her saat döngüsünde talimatlar üzerinde daha fazla iş yapması sağlandı.

Sonuç olarak gecikme azaldı, doğruluk arttı ve verimlilik daha iyi hale geldi. Geliştirilmiş komut önbelleği gecikmesi ve bant genişliği optimizasyonları, doğruluktan ödün vermeden veri akışını ve veri işleme hızını daha da artırıyor.

Daha düşük gecikme, CPU’nun dallanma tahmini verilerine daha hızlı erişmesini ve işlemesini sağlamakta. Geliştirilmiş doğruluk, CPU kaynaklarını koruyarak yanlış tahminleri azaltacak. Zen 5’in daha geniş çekirdek tasarımı göz önüne alındığında, artan dal tahmin verimi optimum performansı korumak için çok önemli. Ek kod çözme işlem hattı, verimli veri akışı sağlayarak bu süreci daha daha iyileştirecek şekilde destekliyor.

Zen 5, önceki Zen mimarilerinin 6 genişlikli dağıtımına kıyasla kayda değer bir gelişme olan 8 genişlikli bir dağıtım sunuyor. Bu genişleme, Zen 5 CPU çekirdeklerinin yeterli veri alması koşuluyla aynı anda daha fazla işlemi gerçekleştirmelerine olanak tanıyacak.

Önbellek ve Bant Genişliği

AMD, performans artışını kolaylaştırmak için işlemci genelinde bant genişliğini daha yüksek noktaya taşıdı. L1 önbelleğin toplam maksimum bant genişliği iki katına çıkarılırken, her işlemci çekirdeğindeki kayan nokta birimine (FPU) giden bant genişliği de iki kat arttı. Buna ek olarak, L2 önbelleği de 8 yönlü ilişkisel tasarımdan 16 yönlü ilişkisel tasarıma geçirilerek bant genişliği aynı şekilde iki kat yükseldi.

Zen 4’te 32 KB veri önbelleği vardı ve Zen 5 ile 48 KB 12 yollu L1 veri önbelleğine (L1D) genişletildi. L1D’nin artan kapasitesine rağmen, birim 4 çevrimli yükleme gecikmesini koruyor. L1 önbelleğine ve kayan nokta birimine iki katına çıkarılan bant genişliği, artık tam 512 bitlik bir yolu destekleyen genişletilmiş AVX motoru ile daha iyi uyum sağlayacak.

Yürütme Motoru ve AVX-512

Yürütme motoru Zen 5 ile önemli değişiklikler görüyor. Integer motorunda 3 çarpma birimine sahip 6 ALU, iyileştirilmiş bir ALU zamanlayıcısı ve daha büyük bir yürütme penceresi var. Yürütme birimindeki belki de en büyük değişiklik, tam 512 bit veri yoluna sahip AVX-512 için fiziksel bir 512 bit FP işlem hattına sahip Kayan Nokta Birimi (FPU). AMD, önceden Zen 4’te AVX-512’yi çift yollu 256-bit FPU kullanarak uygulamıştı ve bu enerji açısından verimli bir uygulama olarak görülüyordu.

512 bit FPU, Zen 4’e kıyasla AVX-512 performansında önemli bir gelişme sağlayacaktır. Elbette AVX-512’nin etkili olduğu alanlar kısıtlı. Tam olarak oyunculara yönelik olmasa da, yapay zeka ve video/fotoğraf düzenleme gibi işlerde etkisini kesinlikle hissettirecek. AVX-512, vektör işleme odaklı yoğun iş yükleri için performansı artırabilen bir talimat dizisi.

AVX-512 desteği Zen 4’te tam anlamıyla mevcut değildi. AMD, yeni mimariyle AVX-512’nin tam hızda çalışmasını sağlayan 512 bit veri yoluna yükseltme yaptı. Daha önce Zen 4, Intel’in yaklaşımına benzer şekilde önemli frekans dalgalanmalarını önlemek için 512 bit AVX-512 iş yüklerini iki 256 bitlik parçaya bölerek işliyordu. Diğer yandan Zen 5, 512 bitlik veri yolunun tamamını entegre ederek bu sorunu ortadan kaldırıyor. Zen 5’teki kayan nokta (FP) ve vektör matematik birimi, kayan nokta toplama (FADD) talimatları için azaltılmış gecikme süresine sahip altı işlem hattı içeriyor ve artık üç yerine yalnızca iki döngü gerektiriyor.

AVX-512 konusu zaman zaman AMD ve Intel arasında bir çekişme noktası oldu. Rakip Intel, “Raptor Lake” veya “Meteor Lake” işlemcilerinde AVX-512’yi doğrudan desteklemiyor. Ayrıca Arrow Lake masaüstü işlemcilerde böyle bir destek beklenmiyor. Zen 4 ile kısıtlı destek sunan AMD, Zen 5 ile yeni talimatlar ekleyerek ve verimliliği iyileştirerek işleri geliştiriyor.

%16 IPC Kazancı

Bu faktörler bir araya gelerek Zen 5’in performansını Zen 4’e göre artırmaya yardımcı oluyor ve saat başına talimatlarda (IPC) ortalama %16’lık bir artış sağlıyor. AMD’nin söylediği gibi, Ryzen 9000 serisi işlemciler Ryzen 7000 serisiyle benzer saat hızlarında çalışıyor. Yani performansta ortalama %16’lık bir artış söz konusu.

Ancak değinmemiz gereken bir nokta var. Bu performans artışları her alanda ve her senaryoda gerçekleşmeyebilir. Bazı iş yüklerinde performans artışı %35’e bile varabiliyor. Geliştirilmiş FPU’dan yararlanan oyun ve uygulamalar artık çok daha hızlı çalışacak.

Performansta %16’lık artış devrimsel bir sıçrama olarak nitelendirebileceğimiz bir şey değil. Önemsiz mi? Elbette önemli. Ancak Zen 5 işlemcilerde çok daha etkileyici olan bir şey var: Enerji verimliliği.

AMD, Zen 4 için kullanılan 5nm ve 6nm üretim süreçlerinden daha yeni 3nm ve 4nm üretim süreçlerine geçiş yaparken TSMC ile çalışmaya devam ediyor. Zen 4 işlemcilerde yer alan çekirdekler 5nm sürecinde üretilmişti. Radeon entegre grafik işlemcisi (IGP), PCI Express kontrolcüsü, bellek kontrolcüsü ve farklı bileşenleri barındıran I/O kalıbı ise 6nm sürecinde üretildi.

Çip geliştiricisi, Zen 5 CPU çekirdekleri için 3nm sürecinin ve I/O kalıbı için 4nm sürecinin kullanılacağını açıkça söylemedi. Ancak geçmişe bakarsak durumun bu şekilde olduğunu yorumlayabiliriz. I/O kalıbında pek bir değişiklik yok gibi görünüyor, bu yüzden ayrı bir parantez açmaya gerek duymuyoruz.

Düşük Sıcaklıklar

AMD’nin iddia ettiği farklı şeyler de var: CPU’ların genel termal direncini iyileştirildi ve Ryzen 9000 işlemcilerle (Zen 5) önceki Ryzen 7000 (Zen 4) serisine göre çalışma sıcaklıkları düşürüldü. Yeni üretim süreçlerine geçiş yapan AMD, Ryzen 9000 çiplerin daha verimli olmasını, yani daha düşük güç tüketmesini sağladı. Yongaların %15 daha az termal dirence sahip olduğu ve bunun da aynı termal tasarım gücünü (TDP) korurken ortalama sıcaklıkları 7 dereceye kadar düşürmeye yardımcı olduğu belirtiliyor.

Daha önce sözünü ettiğimiz gibi, Ryzen 9000 serisi işlemciler benzer saat hızlarını korurken Ryzen 7000’e kıyasla daha serin çalışıyor ve daha düşük TDP değerlerine sahip. Şirket bunu nasıl başardığını detaylıca söylemiyor lakin anlattıklarımız doğrultusunda bu şaşırtıcı bir şey değil.

Ryzen 7000 serisi yongaların biraz sıcak çalıştığını söylesek yanılmış olmayız. Bu nedenle termal konulardaki iyileştirme hoş oldu ve termal kısıtlama olmadan yüksek saat hızlarına ulaşmak mümkün olacak. Ayrıca overclock yapabilmek için daha fazla alana sahip olacağız.

Yenilenen entegre grafik mimarisinin masaüstünde pek bir şey ifade etmediğini dile getirmiştik. iGPU performansı mobil platform için daha önemli. Örneğin Ryzen AI HX, güncellenmiş RDNA 3.5 grafik mimarisini kullanan Radeon 890M ile birlikte geliyor.

Bu mimari, temel yapısı bakımından RDNA 3’e benzemekle birlikte, watt başına verimliliği ve performansı artırmak için çeşitli geliştirmeler sunarak pil ömrünü uzatarak mobil cihazları bir adım ileriye taşıyor. Özetle RDNA 3.5, enerji verimliliği ve işlem gücüne odaklanarak RDNA 3’ü birazcık daha geliştirdi.

İlk olarak, doku işleme hızını ve bağlantılı olarak oyun performansını artıran Doku Eşleme Birimlerinin (Texture Mapping Unit, TMU) sayısı iki katına çıkarıldı. Diğer iyileştirmeler arasında daha akıcı grafik işleme için çok önemli olan interpolasyon ve sıkıştırma oranlarının artırılması yer alıyor. Radeon 880M entegre grafik işleme birimi, 8 Çalışma Grubu İşlemcisi (Workgroup Processor, WGP) içeren bir Shader Engine ile birlikte tasarlandı. Böylelikle toplamda 16 Hesaplama Birimi (Compute Unit, CU) kullanılabiliyor.

16 CU ise 1.024 akış işlemcisi, 32 AI hızlandırıcı ve 16 Iıın hızlandırıcıya denk. iGPU, 16 raster işlem birimini (ROP) destekleyen 4 render arka ucu içermekte. Maksimum 2,90 GHz hızında çalışacak şekilde tasarlandı ve 11 teraflopun (TFLOPS) üzerinde FP32 hesaplama gücüne ulaşabiliyor.

Önceki Phoenix serisi işlemciler, RDNA 3 mimarisini kullanan 12 CU’ya kadar çıkabiliyordu. Yukarıda bahsettiğimiz iyileştirmelerle birlikte %30’a varan performans artışları sağlandı. Ayrıca bunu güç tüketimini çok az oranda artırarak başardılar.

Yeni nesil nöral işlem birimleri Ryzen AI 300 mobil CPU’larda yer almakta. NPU, Saniyede 50 Tera İşlem (TOPS) hesaplama gücüne sahip. Bu performans seviyesi Microsoft’un 40 TOPS olan Copilot+ gereksinimlerini rahatlıkla karşılayabiliyor.

Ryzen AI 300 Strix Point işlemci, yapay zeka yeteneklerini üç ana bileşenine yayıyor, ilk olarak Zen 5 çekirdekleri, ikinci olarak RDNA 3.5 entegre grafik birimi ve son olarak XDNA 2 nöral işleme birimi (NPU). Zen 5 çekirdekleri güçlü bir 512-bit kayan nokta birimine sahip ve yapay zeka görevleri için çok önemli olan AVX-512 ve VNNI gibi özel yapay zeka talimatlarını desteklemekte.

Bu arada, RDNA 3.5 grafik birimi 1,024 akış işlemcisi ve 32 özel yapay zeka hızlandırıcısı içeriyor. Bu işlemcinin öne çıkan yapay zeka özelliklerinden biri saniyede 50 trilyon işlem (TOPS) sağlayan XDNA 2 NPU ve geleneksel CPU çekirdeklerine kıyasla yapay zeka görevleri için watt başına performansta 35 katlık önemli bir artış sağlamakta.

XDNA 2 NPU, karşılaştırıldığında Intel’in 48 TOPS’a ulaşan Lunar Lake NPU’sundan biraz daha iyi performans gösteriyor. XDNA 2, geleneksel önbellek katmanlarını ortadan kaldıran benzersiz bir uzamsal veri akışı tasarımı kullanıyor. Bunun yerine, her yönde hızlı ve verimli veri hareketi sağlayan, birden fazla işlem birimine doğrudan bağlı özel bir belleğe sahip.

Mimari, dinamik bölümlendirmeyi destekleyen, birbirine bağlı, uyarlanabilir şekilde tasarlandı. Böylelikle NPU’nun kaynakları video işleme, ses geliştirme veya AI içeriği oluşturma gibi farklı görevlerin taleplerine göre ayarlanabiliyor. Bu kaynakları geçici olarak bölümlendirme yeteneği, aynı anda birden fazla uygulamanın NPU’yu etkili bir şekilde kullanabileceği ve kapasitesini çok yönlü ve verimli bir şekilde paylaşabileceği anlamına geliyor.

Ryzen 9000 serisi işlemcilerin eksikliklerinden biri de NPU dediğimiz özel yapay birimi. Yapay zeka patlaması yaşanırken neden yeni masaüstü çiplere bunlardan birer tane koymadılar? AMD Kurumsal Üyesi ve Zen Baş Mimarı Mike Clark, Ryzen 9000 sistemlerinin çoğunda zaten yapay zeka konusunda son derece yetenekli ekran kartları kullanılacağı için NPU’nun gerekli olmadığını söylüyor.

Granite Ridge ayrıca AVX512-VNNI (Vector Neural Network Instructions) komut setini de içeriyor. AMD, I/O biriminin yeniden tasarlanmasının mantıklı olmadığını söylüyor.

DDR5 desteği ‘resmi olarak’ 5600 MT/s’ye yükseltildi ve 8000 MT/s’ye kadar EXPO profilleri de desteklenmekte. G.Skill, Computex etkinliğinde DDR5-10600 bellek kullanan bir Ryzen 5 8500G sistemi göstermişti. AMD, Granite Ridge’in daha da fazlasını yapabileceğini söylüyor. Hatta DDR5-11000 gibi bellek hızlarından bahsediliyor lakin 11.000 MT/s’ye ekstra soğutma olmadan ulaşmak oldukça zor.

AMD, Zen 5 için en uygun noktanın uyumluluk, maliyet ve performans açısından 6000-6400 MT/s aralığında olduğunu söylüyor.

Ryzen 7000 serisi işlemciler yerel DDR5-5200 bellek desteğiyle geldi, DDR5-6000 “en iyi” hız aşırtma noktasıydı. Buna “tatlı nokta” da diyoruz. Başka bir deyişle, FCLK ve MCLK saat alanları arasında 1:1 eşitlikle elde edebileceğiniz en yüksek kararlı bellek hızı.

Ryzen 9000’de birkaç güncelleme var. Yerel DDR5 hızı DDR5-5600’e çıkarıldı ve DDR5-8000 kadar hızlı hız aşırtılmış bellek desteği eklendi. Bunu nasıl yaptılar? Bellek saati DDR5-6000’den daha yüksek bir değere ayarlandığı anda FCLK ve MCLK arasında 1:2 saat bölücü devreye giriyor. 1:1 bölücüyü manuel olarak zorlayabilirsiniz ve “biraz şansla” DDR5-6400’ü çalıştırabilirsiniz; yani temelde daha öncekiyle aynı. DDR5-8000 desteği, AMD tarafından anakart satıcılarının eski AMD 600 serisi yonga seti ürünleriyle bile entegre edebilmeleri için AGESA mikro kodunun bir güncellemesi olarak yayınlanıyor. DDR5-8000 ve altındaki her ürün (örneğin DDR5-7200, DDR5-6800) için AMD EXPO profillerine sahip yeni bir ürün grubu bekleniyor.

Performans açısından, DDR5-8000 1:2’nin çok çeşitli senaryolarda DDR5-6000 1:1’i geçip geçemeyeceğini görmek için testlere ihtiyaç var.

Her seri, farklı teknik tasarımlarla birlikte hizmet ettiği platformun isteklerini karşılamak üzere hazırlandı.

Strix Point işlemciler, büyük 24 MB L3 önbelleğin(16+8 MB) paylaşan dört yüksek performanslı Zen 5 çekirdeği ve sekiz verimli Zen 5c çekirdeği olmak üzere on iki CPU çekirdeğinin bir kombinasyonunu entegre eden güçlü bir çekirdek kompleksi (CCX) barındırıyor.

Strix Point tasarımındaki Zen 5c çekirdekleri daha düşük saat frekanslarında çalışacak ve maksimum güç kullanıldığında biraz daha az performans sunacak. Ancak bu çekirdekler AMD’nin GPU ve NPU işlevleri için çipte ek alanı verimli bir şekilde kullanmasını sağlıyor.

Her çekirdek kendine özel L1 ve L2 önbelleğe sahip. L3 önbellek ise Zen 5 ve Zen 5c çekirdekleri için ayrı ayrı belirlenmiş iki bölüme ayrılmış. Böyle bir tasarım, önbellekler etkileşime girmesi gerektiğinden küçük gecikmelere neden olabilse de AMD bunun performansı etkilemeyeceğini söylüyor. İşlemciler ayrıca görevleri verimli bir şekilde yönetmek için gelişmiş zamanlama teknikleri kullanmakta ve öncelikli olmayan görevler 5c çekirdeklerine yönlendiriliyor.

Öte yandan Granite Ridge olarak adlandırılan Ryzen 9000 masaüstü işlemciler daha karmaşık bir tasarıma sahip. Ryzen 7000 serisine benzer şekilde, bu işlemciler bir IO kalıbı ile birlikte birden fazla işlem kalıbı kullanıyor. Büyük önbellek kapasiteleri sağlanırken, gelişmiş performansa ihtiyaç duyan masaüstü bilgisayar ortamlarında daha yüksek ölçeklenebilirlik ve performans sağlanıyor.

Son olarak, AMD’nin sunumunda Zen 6 ve daha verimli Zen 6c çekirdeklerinin adını ilk kez gördük. Zen 5 ve Zen 5c çekirdekleri 4nm ve 3nm üretim bantlarından çıkacak.

Hem Granite Ridge’deki Zen 5 CCD’ler hem de Strix Point monolitik işlemciler 4nm üzerine inşa edildi. Zen 6 ve Zen 6c’den bahsedilmesine rağmen bunların kullanacağı herhangi bir teknolojiden bahsedilmiyor. Tahmin yürütecek olursak, bu çekirdekler TSMC 2nm ve 1,8nm işlemleriyle üretilebilir.