Google Ajan Beyaz Kitap
GPT-4 ve Gemini gibi dil modelleri, sohbet yetenekleriyle kamuoyunun dikkatini çekerken, daha derin bir devrim gerçekleşiyor: AI ajanlarının yükselişi. Google'un son beyaz kitabında detaylandırıldığı gibi, bu ajanlar sadece akıllı sohbet botları değil – gerçek dünyayı aktif olarak algılayabilen, akıl yürütebilen ve etkileyebilen AI sistemleridir.
AI Yeteneklerinin Evrimi
Geleneksel AI modellerini, internet veya telefon olmadan bir odaya kapatılmış son derece bilgili profesörler olarak düşünün. Harika bilgiler sunabilirler, ancak yalnızca odaya girmeden önce öğrendiklerine dayanarak. AI ajanları ise, modern araçların tam bir setine sahip profesörler gibidir – güncel bilgileri arayabilir, e-postalar gönderebilir, hesaplamalar yapabilir ve karmaşık görevleri koordine edebilirler.
Ajanları geleneksel modellerden ayıran özellikler şunlardır:
- Gerçek Zamanlı Bilgi: Modeller eğitim verileriyle sınırlıyken, ajanlar harici araçlar ve API'ler aracılığıyla güncel bilgilere erişebilir
- Eylem Alma: Ajanlar sadece eylem önermekle kalmaz – işlev çağrıları ve API etkileşimleri yoluyla bunları gerçekleştirebilirler
- Bellek Yönetimi: Ajanlar, birden fazla etkileşim boyunca bağlamı korur, her değişimden öğrenerek yanıtlarını geliştirir
- Araç Entegrasyonu: Harici araçları ve API'leri kullanma yeteneği, mimarilerine doğrudan entegre edilmiştir, sonradan eklenmiş bir düşünce değildir
Ajanların Düşünme Şekli: Bilişsel Mimari

Ajanların gerçek büyüsü, nasıl akıl yürüttüklerini ve karar verdiklerini yöneten "bilişsel mimarilerinde" yatar. Beyaz kitap, üç ana yaklaşımı detaylandırır:
-
ReAct: Ajanların durumları hakkında akıl yürütme ve somut eylemler alma arasında gidip geldiği bir çerçeve. Sürekli ilerlemesini değerlendiren ve pişirme stratejisini ayarlayan bir şef hayal edin.
-
Düşünce Zinciri: Ajanlar, karmaşık problemleri daha küçük, yönetilebilir adımlara böler ve yol boyunca çalışmalarını gösterir. Bu, bir matematikçinin karmaşık denklemleri adım adım çözmesine benzer.
-
Düşünce Ağacı: Ajanlar, bir satranç oyuncusunun farklı hamleleri ve sonuçlarını düşünmesi gibi, aynı anda birden fazla olası çözüm yolunu keşfeder.

Beyaz kitaptan bir ajanın uçuş rezervasyonu talebini nasıl ele alabileceğine dair gerçek bir örnek:
Kullanıcı: "Austin'den Zürih'e bir uçuş rezervasyonu yapmak istiyorum"
Ajan Düşüncesi: Önce uçuşları aramalıyım
Eylem: [Uçuş arama API'sini çağırır]
Gözlem: Birden fazla uçuş seçeneği bulundu
Ajan Düşüncesi: En iyi fiyatları ve rotaları kontrol etmeliyim
Eylem: [Arama sonuçlarını analiz eder]
Gözlem: Optimal bağlantılar ve fiyatlar bulundu
Ajan Düşüncesi: Kullanıcının seçeneklerin net bir özetine ihtiyacı var
Son Yanıt: "İşte en iyi uçuş seçenekleri..."
Ajanların Araç Seti: Dünya ile Nasıl Etkileşim Kurarlar
Beyaz kitap, ajanların harici sistemlerle etkileşim kurabileceği üç farklı yolu tanımlar:
1. Uzantılar
Bunlar, doğrudan API çağrılarına izin veren ajan tarafı araçlardır. Onları ajanın elleri olarak düşünün – doğrudan harici hizmetlerle etkileşim kurabilirler. Google'un beyaz kitabı, bunların uçuş fiyatlarını kontrol etmek veya hava durumu tahminlerini almak gibi gerçek zamanlı işlemler için nasıl özellikle yararlı olduğunu gösteriyor.

2. Fonksiyonlar
Uzantılardan farklı olarak, fonksiyonlar istemci tarafında çalışır. Bu, daha fazla kontrol ve güvenlik sağlar, bu da onları hassas işlemler için ideal kılar. Ajan ne yapılması gerektiğini belirtir, ancak gerçek yürütme istemcinin gözetimi altında gerçekleşir.

Uzantılar ve fonksiyonlar arasındaki fark:

3. Veri Depoları
Bunlar, ajanın referans kütüphaneleridir ve hem yapılandırılmış hem de yapılandırılmamış verilere erişim sağlar. Vektör veritabanları ve gömme teknikleri kullanarak, ajanlar geniş veri setlerinde hızlıca ilgili bilgileri bulabilir.

