Cerebras Systems tarafından dünyanın en süratli yapay zeka çıkarım tahlili olarak Cerebras Inference duyuruldu. Yeni tahlil, Microsoft Azure dahil olmak üzere hiper ölçekli bulutlarda bulunan NVIDIA GPU tabanlı AI çıkarım tahlillerinden neredeyse 20 kat daha süratli olan Llama 3.1 8B için saniyede 1.800 token ve Llama 3.1 70B için saniyede 450 token sağlıyor.
Yeni çıkarım tahlilinin fiyatı tanınan GPU bulutlarının da çok altında. Örneğin, yalnızca 10 sente bir milyon token elde etmek ve böylelikle yapay zeka iş yükleri için 100 kat daha yüksek fiyat-performans oranı sağlamak mümkün.
Cerebras’ın 16 bitlik doğruluğu ve 20 kat daha süratli çıkarım davetleri, yapay zeka uygulama geliştiricilerinin süratten yahut maliyetten ödün vermeden yeni kuşak yapay zeka uygulamaları oluşturmasına imkan tanıyacak. Bu fiyat-performans oranının Cerebras CS-3 sistemi ve Wafer Scale Engine 3 (WSE-3) yapay zeka işlemcisi sayesinde mümkün olduğu tabir ediliyor. CS-3, NVIDIA H100’den 7.000 kat daha fazla bellek bant genişliğine sahip olup üretken yapay zekanın bellek bant genişliği teknik zorluğunu çözüyor.

Cerebras Inference üç kademede sunuluyor. Bunlar:
Daha süratli ve daha uygun maliyetli yapay zeka çıkarım tahlillerine olan talep ağırlaştıkça NVIDIA’nın hakimiyeti, bilhassa çıkarım alanında bozulabilir.
AirPods Pro 3 Daha Uygun Etkin Gürültü Tedbire İle Gelebilir
1
NVIDIA Studio’da Yaratıcılığı ve İnovasyonu Destekleyen Yeni Uygulamalar
9561 kez okundu
2
LG DukeBox ve CineBeam Qube CES 2024’te Uzunluk Gösterecek
4182 kez okundu
3
300 Milyon Bireye İlişkin Bilgileri Ruslara Satan Ukraynalı Hacker Tutuklandı
3886 kez okundu
4
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek
2340 kez okundu
5
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek tasarısı
1343 kez okundu
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.