Bir AI karar hatasının anatomisi: pahalı hatalar nerede doğar?

Kurumsal AI hataları çoğu zaman modelin 'aptal' olmasından değil, yapısal kör noktalardan doğar: yanlış bağlam, eksik eval, kayan kapsam, sahipsiz çıktı ve denetimsiz aksiyon. Bu, bir teşhis yazısıdır.

Kurumsal AI başarısızlıkları konuşulduğunda, suç genellikle modele atılır: “model yetersizmiş”, “AI henüz hazır değilmiş”, “halüsinasyon yaptı”. Bu açıklamalar rahatlatıcıdır çünkü sorumluluğu dışarı, teknolojiye verir.

Ama pahalı AI karar hatalarının çoğu, modelin zekâsından değil, etrafındaki sistemin tasarımından doğar. Aynı model, bir yapıda güvenilir çalışırken başka bir yapıda ciddi hata üretir. Fark modelde değil, modeli saran katmanlardadır.

Bu yazı bir teşhis girişimidir: pahalı bir AI karar hatası tipik olarak nerede doğar? Hatayı bir “kötü model” olayı olarak değil, bir dizi yapısal kör noktanın birikimi olarak ele alalım. Çünkü bir hatayı önlemenin ilk koşulu, onu doğru yerde aramaktır.

Doğru soru “model neden hata yaptı?” değildir. Doğru soru şudur:

Bu hatayı mümkün kılan yapısal boşluk neydi ve o boşluk hangi katmanda açıldı?

Katman 1: Yanlış veya eksik bağlam

İlk ve en yaygın hata kaynağı bağlamdır. Model, kendisine verilen bağlama göre cevap üretir. Bağlam yanlış, eksik veya güncel değilse, model güvenle yanlış cevap verir.

Pratikte bu birçok biçimde görünür: modele eski bir doküman verilir, model onu güncel sanır; ilgili veri context penceresine sığmaz, model eksik resimle karar verir; yanlış kaynak çekilir, model onu doğru kabul eder. Hiçbiri modelin “aptallığı” değildir; hepsi, bağlam katmanının zayıflığıdır.

Bağlam hatasının sinsi yanı, çıktının akıcı görünmesidir. Model eksik bağlamla bile düzgün, kendinden emin bir cevap üretir. Akıcılık, doğruluğun kanıtı değildir — ama eksik bağlamı gizler.

Katman 2: Eval setinin yokluğu

İkinci kör nokta ölçümdür. Birçok AI sistemi, hiçbir zaman zor örneklerle sistematik test edilmeden üretime alınır. Demo iyi gitmiştir; bu, “çalışıyor” sanılır.

Eval seti olmadan, sistemin gerçekte ne zaman doğru, ne zaman yanlış olduğu bilinmez. Bir değişiklik bir hatayı azaltırken başka bir hatayı artırabilir, ama bu takas görünmez. Sistem bir yerde iyileşirken başka yerde sessizce bozulur ve kimse fark etmez — ta ki pahalı bir hata üretene kadar.

Eval setinin yokluğu, hatayı yaratmaz ama görünmez kılar. Ve görünmeyen bir zayıflık, düzeltilemeyen bir zayıflıktır. (↔ 21 eval seti)

Katman 3: Kayan kapsam

Üçüncü hata kaynağı, kapsamın zamanla genişlemesidir. Sistem dar ve net bir iş için kurulur, iyi çalışır. Sonra “madem çalışıyor, şunu da yapsın” denir. Kapsam yavaşça genişler.

Sorun, kapsam genişledikçe, sistemin test edildiği ve güvenilir olduğu sınırların dışına çıkmasıdır. Dar bir görevde güvenilir olan bir model, geniş ve belirsiz bir görevde kırılgandır. Kayan kapsam, sistemi sessizce, kimse yeniden test etmeden, güvenilir olmadığı bir alana taşır.

Hata, kapsamın genişlediği o belirsiz kenarda doğar. (↔ 06 AI pilotları, 03 agent nerede çalışır)

Katman 4: Sahipsiz çıktı

Dördüncü kör nokta sahipliktir. AI bir çıktı üretir, ama o çıktının kalitesinden kimin sorumlu olduğu belirsizdir. Hata olduğunda kim görecek, kim düzeltecek, kim öğrenecek?

Sahipsiz bir AI sistemi çürür. Çıktı kalitesi düşer ama kimse fark etmez; kullanıcı geri bildirimi toplanmaz; tekrar eden hatalar düzeltilmez. Sistem teknik olarak çalışmaya devam eder, ama kalitesi sessizce erir. Pahalı hata, çoğu zaman aylardır kimsenin bakmadığı bir sistemin birikmiş bozulmasıdır. (↔ 06 sahiplik)

Katman 5: Denetimsiz aksiyon

Beşinci ve en pahalı hata kaynağı, AI’ın insan denetimi olmadan dış aksiyon almasıdır. Sistem sadece cevap üretmez; bir e-posta gönderir, bir fiyat değiştirir, bir taahhüt verir. Ve bunu, bir insan onay noktası olmadan yapar.

Önceki katmanların hepsi (yanlış bağlam, eksik eval, kayan kapsam, sahipsizlik) tek başına zarar verir; ama denetimsiz aksiyonla birleştiğinde, hata içeride kalmaz, dışarı taşar. Müşteriye yanlış bir taahhüt gider, bir fiyat yanlış değişir, geri dönülmez bir aksiyon alınır. İnsan onay noktasının yokluğu, küçük bir iç hatayı büyük bir dış hataya çevirir. (↔ 11 insan onaylı agent, 49 karar dağılımı)

Hata bir olay değil, bir zincirdir

Bu beş katmana ayrı ayrı bakıldığında görülen şey şudur: pahalı bir AI karar hatası, tek bir anda doğmaz. Bir zincirdir. Yanlış bağlam, eksik evalle birleşir; eksik eval, kayan kapsamla; kayan kapsam, sahipsizlikle; sahipsizlik, denetimsiz aksiyonla. Her halka tek başına yönetilebilir; ama hepsi açık olduğunda, hata kaçınılmaz hale gelir.

Bu yüzden “model neden hata yaptı?” sorusu yanlış sorudur. Doğru teşhis, zincirin hangi halkalarının açık olduğunu sormaktır. Ve iyi haber şu: bu halkaların hiçbiri model değiştirmekle kapatılmaz; hepsi tasarımla kapatılır.

Sonuç

Kurumsal AI hatalarını “model yetersizdi” diye açıklamak rahatlatıcı ama yanıltıcıdır. Pahalı karar hatalarının çoğu modelin zekâsından değil, onu saran katmanların boşluklarından doğar: yanlış bağlam, eksik eval, kayan kapsam, sahipsiz çıktı ve denetimsiz aksiyon. Bunlar bir olay değil, bir zincirdir.

Bir hatayı önlemenin ilk koşulu, onu doğru yerde aramaktır. Teşhis modele değil, zincirin halkalarına bakmalıdır. Ve bu halkaların hepsi, daha iyi bir modelle değil, daha iyi bir tasarımla kapanır.

Doğru soru şudur:

AI hatasını modelin suçu olarak mı görüyoruz, yoksa hatayı mümkün kılan tasarım zincirinin hangi halkasının açık olduğunu mu teşhis ediyoruz?