Yapay Zeka Ajanlarında Hukukta Önemli Sıçrama

Mercor kıyaslamasıyla başlayan tartışma

Geçen ay yayımlanan bir kıyaslama, yapay zeka ajanlarının hukuk ve kurumsal analiz gibi profesyonel görevlerdeki yetkinliğini ölçmüştü. O çalışmanın sonuçları, birçok büyük laboratuvarın skorlarının %25’in altında olduğunu gösteriyordu; bu da kısa vadede avukatların yerini makinelerin almayacağı izlenimi yaratmıştı.

Hızla değişen yetenekler

Ancak yapay zekâdaki yetenekler birkaç hafta içinde belirgin şekilde değişebiliyor. Bu hafta çıkan yeni bir model sürümü, liderlik tablosunda çarpıcı bir yükselişe neden oldu: tek denemede yaklaşık %30 skor ve tekrar şansları verildiğinde ortalama %45 düzeyine ulaşan sonuçlar görüldü. Sürümle birlikte gelen çoklu ajan özellikleri ve özellikle “ajan sürüleri” gibi mekanizmalar, çok adımlı problem çözmede etkili olmuş olabilir.

APEX-Agents lider tablosuna dair görsel.

Büyük ama henüz tamamlanmamış bir atılım

Bu artış, önceki en iyi sonuçlarla kıyaslandığında kayda değer bir sıçrama anlamına geliyor. Örneğin bazı ölçümlerde skorların birkaç ay içinde ~%18 civarından ~%30‘lara çıkması, temel model araştırmalarının hız kesmediğine işaret ediyor.

Ne anlama geliyor?

%30 hâlâ %100‘den uzak ve bu tablo, avukatların önümüzdeki hafta yerlerini kaybedeceğini göstermiyor. Yine de bu gelişme, hukuk gibi uzmanlık gerektiren alanlarda yapay zekânın hızla yetkinleşebileceğini ve profesyonellerin tamamen rahat olmaması gerektiğini gösteriyor. Kısa vadede insan uzmanlığı önemini korurken, orta ve uzun vadede iş süreçlerinin ve rol dağılımının yeniden değerlendirilmeye alınması gerekebilir.

Exit mobile version