Araç kullanımı, function calling, çok adımlı planlama
Yalnızca metin yazan bir LLM, süslü bir otomatik tamamlamadır. Araçları çağırabilen, yapılandırılmış veriyi geri okuyabilen ve sonra ne yapacağına karar verebilen bir LLM ise bir agent'tır — ve bu iki şey arasındaki uçurum, ilginç olan her konaklama AI iş akışının yaşadığı yerdir. Terminoloji son 18 ayda oturdu: "tool use" veya "function calling" mekanizmadır, "multi-step planning" ise onun üzerine inşa ettiğiniz şeydir.
Function calling gerçekte nedir
Modele çağırabileceği bir fonksiyon listesi verirsiniz — her biri ad, açıklama ve girdi-çıktı için tiplenmiş bir şema ile. Model, kullanıcı komutuna dayanarak hangi fonksiyonu hangi argümanlarla çağıracağına karar verir. Fonksiyonu kendi kodunuzda çalıştırırsınız, sonucu döndürürsünüz ve model bu sonucu kullanarak bir sonraki adıma karar verir. OpenAI, Anthropic ve Google Gemini'deki fonksiyon spec'i benzer bir JSON-schema şekline yakınsadı; Anthropic'in 2024 sonunda yayımladığı MCP (Model Context Protocol) ise ciddi dağıtımların çoğunun geçtiği çapraz-tedarikçi sarmalayıcısıdır.
Somut olarak, 180 odalı bir şehir otelindeki rezervasyon-değişiklik agent'ı dört fonksiyon alır: lookup_reservation(confirmation_code), check_availability(date_range, room_type), modify_reservation(reservation_id, changes) ve send_confirmation(reservation_id, channel). Model herhangi bir dilde misafir mesajını alır, hangi fonksiyonları hangi sırada çağıracağına karar verir ve eskiden bir rezervasyon görevlisinin dört dakikasını alan akışı çalıştırır.
Multi-step planning, pratikte
Tek bir fonksiyon çağrısı bir agent değildir. Birinin çıktısının bir sonrakinin girdisine karar verdiği üç-dört çağrılık bir zincir, agent'tır. Yararlı konaklama agent'larının çoğu 3-7 adımlıdır: niyeti ayrıştır, durumu sorgula, kısıtlamaları kontrol et, eylemi yürüt, sonucu logla, insana bildir. Zor olan kısım bireysel çağrılar değildir — hangi çağrıların hangi sırada yapılacağına ve bir adım başarısız olduğunda ne yapılacağına karar veren planlama katmanıdır.
İki örüntü baskındır. Birincisi "ReAct" — model bir sonraki adımın ne olacağına dair düz metinde akıl yürütür, sonra bir aracı çağırır, sonra tekrar akıl yürütür. Gecikme daha yüksektir (adım başına 4-12 saniye), ama akıl yürütme denetlenebilir. İkincisi "structured planning" — model planı önceden bir JSON nesnesi olarak üretir ve her adımı çalıştırır. Daha hızlı ama bir adım başarısız olduğunda kurtarmak daha zor. Konaklama için ReAct neredeyse her zaman kazanır çünkü denetim izi önemlidir ve gecikme bütçesi hoşgörülüdür (rezervasyon değişikliği için 20 saniye bekleyen bir misafir tamamdır; bir sohbet konuşmasında 20 saniye bekleyen bir misafir değildir).
Bu ne kadar tutar
Claude Sonnet veya GPT-4o üzerinde tipik bir 5 adımlı konaklama agent'ı için agent-çalıştırma başına maliyet, bağlam uzunluğuna bağlı olarak yaklaşık €0,02 ila €0,08'dir. 180 odalı bir mülkte ayda 600 çalıştırma yaptığınızda, bu ayda model maliyetlerinde €12-50 demektir. Rutin rezervasyon değişikliklerinde bir FTE azaldığında elde edilen tasarruf ise ayda €2.400'dür. Ekonomi açıktır; mühendislik ise işin kendisidir.
Bu ne değildir
"Oteller için ChatGPT" değildir. Tıkandığında bir insana devreden bir chatbot değildir. Sizin PMS'inize, channel manager'ınıza ve e-posta sisteminize karşı mülk adına aksiyon alan yazılımdır — loglarla, rollback ile ve gerektiğinde insan incelemesiyle. Bu kursun geri kalanındaki her kelime bu ayrımı anladığınızı varsayar. Hala agent'ları süslü chatbot'lar olarak düşünüyorsanız, hem değeri hem de riski yanlış değerlendireceksiniz.
Varşova'daki bir zincirde ilk rezervasyon-değişiklik agent'ımı 2023'te dağıttım. Dört hafta içinde gelen değişikliklerin %40'ını işledi. Diğer %60'ı ilginç şekillerde başarısız olmaya devam etti — ve bu kurs gerçekten orada başlar.