DeepSeek’in yeni R1 AI modeli çok daha az enerji tüketecek

DeepSeek, Güç Tüketiminde Yeni Bir Seviyeye Ulaşıyor

Çin menşeli ve ChatGPT’ye rakip olarak gösterilen DeepSeek, güncellenmiş R1 AI modeli ile dikkatleri üzerine çekiyor. Yapılan yeni haberlere göre, DeepSeek’in güncellenmiş modeli tek bir GPU üzerinden çalışabilecek seviyeye geldi ve güç tüketiminde yeni bir dönemi başlatabilir. DeepSeek-R1-0528-Qwen3-8B modelinin piyasaya sürülmesiyle, şirket belirli benchmark testlerinde benzer modelleri geride bıraktığını söylüyor.

Alibaba’nın Qwen3-8B modelinden esinlenerek geliştirilen yeni R1 versiyonu, Google’ın Gemini 2.5 Flash modeline göre AIME 2025 testinde daha iyi performans sergiledi. Aynı zamanda Microsoft’un Phi 4 modeliyle HMMT matematik beceri testinde benzer başarıyı elde etti.

Ufaltılmış modeller genellikle tam boyutlu modellere kıyasla daha az yetenekli olabilir ancak performanslarıyla öne çıkabiliyorlar. Ayrıca bu ufaltılmış modellerin hesaplama açısından daha az kaynak gerektirdiği biliniyor.

Qwen3-8B’nin çalışması için 40 GB – 80 GB RAM’e sahip bir GPU gerekiyor. Tam boyutlu yeni R1 modeli ise yaklaşık on iki adet 80 GB GPU gerektiriyor. DeepSeek-R1-0528-Qwen3-8B modeli, ticari kullanıma açık bir MIT lisansı altında sunuluyor ve birçok dağıtıcı tarafından API aracılığıyla kullanılabiliyor.

Related Posts

Şehir Katili bilim dünyasını alarma geçirdi: Bütün uyduları yok edebilir

Bilim dünyası, 2032 yılında Ay ile çarpışma rotasında seyreden 2024 YR4 kodlu “Şehir Katili” lakaplı asteroit için alarmda. Yakın zamanda yapılan gözlemler, bu çarpışmanın gerçekleşme olasılığını yüzde 3.8’den yüzde 4.3’e yükseltti. Başlangıçta Dünya …

Çin, Ay mekiği Mıngcou’nun “sıfır irtifa kaçış uçuşu testini” yaptı

Çin’in, 2030 yılında başlamayı planladığı insanlı Ay görevlerinde kullanacağı personel taşıyıcı mekiğinin “sıfır irtifa kaçış uçuşu testini” yaptığı bildirildi.

Microsoft’a Alman darbesi

Almanya’nın kuzeyindeki Schleswig-Holstein eyaleti, küresel teknoloji şirketlerinin artan gücüne karşı radikal bir duruş sergiliyor. Eyalet, önümüzdeki üç ay içinde kamu çalışanlarının, polis memurlarının ve yargıçların neredeyse tamamının Microsoft …

2024 rekor kırdı: Siber saldırılarda ‘yapay zeka’ etkisi

Dijital dünyada 2024 yılına kötü amaçlı yazılımlarla yapılan siber saldırılar damga vurdu. Saldırılarda yapay zeka teknolojisinin etkisine dikkat çekildi.

Milli motosikletçi Deniz Öncü’den tarihi zafer

Milli motosikletçi Deniz Öncü, İspanya’da düzenlenen Moto2 Dünya Şampiyonası’nın 8. etabını birincilikle bitirdi.

Yapay zeka kılıklı mühendislerden büyük vurgun: CEO itifasını verdi

Yazılım geliştirme sürecini “pizza siparişi kadar kolaylaştırdığını” ileri süren Builder.ai, Natasha adını verdiği sistemin tamamen AI tabanlı olduğunu savunuyordu. Ancak Bloomberg’in nisan 2025 tarihli araştırmasına göre, Hindistan’daki Noida ve …