Teknoloji

Gemini, ChatGPT ve DeepSeek'in Görsel İşleme Karşılaştırması

Son dönemde yapay zekâ dünyasının dikkat çeken ismi DeepSeek, özellikle metin tabanlı görevlerdeki hızlı çıktılarıyla adından söz ettiriyor. Çin merkezli bu model, karmaşık sorgulara verdiği yanıtlarla kullanıcıların beğenisini kazanırken ChatGPT’ye de dişli bir rakip o

Gemini, ChatGPT ve DeepSeek'in Görsel İşleme Karşılaştırması
29-01-2025 21:48

Aynı ÖZETİ| şekilde Gemini de ChatGPT’nin rakibi olma konusunda aday durumda. Peki bu üç büyük yapay zekâ modeli, görsel yeteneklerde de aynı yeteneklere sahipler mi?

Görsel verilerin yapay zekâ tarafından işlenmesi, günümüzde kullanıcı deneyiminin ayrılmaz bir parçası hâline geldi. ChatGPT, GPT-4V entegrasyonuyla fotoğraflardaki nesneleri tanımlayabilirken Google Gemini, çoklu modal yaklaşımıyla görsel ve metni birleştirerek âdeta "düşünen bir göz" işlevi görüyor. Peki DeepSeek, bu rekabetin neresinde yer alıyor?

Üç modelin de görsel işleme yeteneklerini tek tek test ettik.

Gemini, ChatGPT ve DeepSeek’e tamamen aynı promptları girerek görseller oluşturduk. Bakalım hangi modelin görsel işleme yeteneği diğerlerinden daha iyi?

Not: DeepSeek, görsel üretiminde Janus Pro-7B'yi kullanıyor.

İlk olarak gün batımında, sakin bir gölün etrafında yeşilliklerle kaplı dağlar, gökyüzü turuncu ve pembe tonlarda, suyun üzerinde hafif bir sis ve göl kenarında renkli çiçekler, gerçekçi ve huzur dolu bir atmosfer çizmelerini istedik.

Gemini

gemini

ChatGPT

chatpgt

DeepSeek

deepseek

İkinci olarak basit bir köpek çizimi istedik.

“Güneşli bir parkta oturan dost canlısı ve oyuncu bir Golden Retriever yavrusunun ayrıntılı bir görüntüsünü oluşturun. Köpeğin Güneş ışığında parıldayan yumuşak, meraklı gözleri ve şakacı bir şekilde dışarı çıkmış dili olsun. Yavru köpeğin etrafında yeşil çimenler, rengarenk çiçekler ve top ve frizbi gibi dağınık birkaç oyuncak var. Arka planda uzun ağaçlar ve berrak mavi bir gökyüzü var ve bu da neşeli ve canlı atmosfere katkıda bulunsun.”

Gemini

gemini

ChatGPT

chatgpt

DeepSeek

deepseek

Bu kez de ülkemizin güzelliklerinden devam ettik.

“Türkiye'nin kültürel ve doğal güzelliklerinin bir karışımını sergileyen ikonik manzarasının ayrıntılı bir görüntüsünü oluştur. Eşsiz kaya oluşumlarını ve gün doğumunda Kapadokya üzerinde süzülen sıcak hava balonlarını, sahneyi aydınlatan yumuşak altın ışıkla birlikte ekle. Ön planda karmaşık desenli bir halı ve küçük bir masa üzerinde dumanı tüten bir fincan Türk çayı tasvir et. Arka planda ülkenin zengin mirasını ve nefes kesici manzarasını vurgulayan uzak dağlar ve açık bir gökyüzü yer alsın.”

Gemini

gemini

ChatGPT

chatgpt

DeepSeek

deepseek

Biraz da hayal güçlerini konuşturalım…

“Uzak bir gezegendeki uzaylı manzarasının ayrıntılı bir görüntüsünü oluştur. Sahnede mavi ve morun canlı tonlarıyla parlayan, biyolüminesan bitkilerden oluşan başka bir dünyaya ait ormanla çevrelenmiş yüksek kristal yapılar yer alsın. Gökyüzü, ruhani bir ışık saçan iki Güneş’le dolu ve devasa halkalı bir gezegen ufka hâkim oluyor. Yarı saydam vücutlara ve yumuşak, ışıltılı parıltılara sahip canlılar havada zarafetle hareket ederek bu gerçeküstü ve dünya dışı ortama bir yaşam ve gizem duygusu katsın.”

Gemini

gemini

ChatGPT

chatgpt

DeepSeek

deepseek

Metin odaklı çıkış yapan DeepSeek, bariz bir şekilde görsel işleme konusunda Gemini ve ChatGPT'nin biraz altında kalıyor. Ancak ilerleyen zamanlarda geliştirilen modeli, her ikisinin de önüne geçebilir mi bilmiyoruz.

Siz bu üç modelin görsel işleme yeteneğini nasıl buldunuz? Yorumlarda bizimle paylaşmayı unutmayın!

İlginizi çekebilir:


Editor : Şerif SENCER
SİZİN DÜŞÜNCELERİNİZ?
TÜRKİYE GÜNDEMİ
BUNLAR DA İLGİNİZİ ÇEKEBİLİR
ÇOK OKUNAN HABERLER