# LLM API Fiyatlandırmasını Anlama
Büyük Dil Modeli API'leri zaman veya istek olmaktan ziyade token kullanımına göre ücret alırlar. Her API çağrısı iki maliyete sahiptir: giriş maliyeti (prompt'unuzu işleme) ve çıkış maliyeti (yanıt oluşturma). Bu ayrımı anlamak, aylık faturanızı doğru şekilde tahmin etmenin anahtarıdır.# Giriş token'ları vs çıkış token'ları
Giriş token'ları
Giriş token'ları modele gönderilen her şeyi temsil eder: sistem prompt'unuz, sohbet geçmişi ve kullanıcı mesajı. Model bunları paralel olarak işlediği için daha ucuzdurlar. 200 sözcüklük tipik bir sistem prompt'u yaklaşık 267 giriş token'ı maliyete sahiptir.
Çıkış token'ları
Çıkış token'ları sırayla, teker teker oluşturulur ve bu onları hesaplamalar açısından daha pahalı hale getirir. Çoğu sağlayıcı çıkış token'ları için 3–5 kat daha fazla ücret alır. 300 sözcüklük bir yanıt yaklaşık 400 çıkış token'ı üretir. Yanıtları kısa tutmak en etkili maliyet tasarrufu stratejilerinden biridir.
# Bütçeniz İçin Doğru Modeli Seçme
GPT-4o mini veya Gemini 1.5 Flash gibi yetenekli bir orta katman modeliyle başlayın ve yalnızca kalite yetersizse yükseltin. Küçük ve büyük bir model arasındaki maliyet farkı 10–100× olabilir. claude-3-opus veya o1 gibi büyük sınır modelleri, kalite sonuçları doğrudan etkilediği karmaşık akıl yürütme görevleri için rezerv tutun.