Federal maske görevini deviren dilbilim arama motoru
COVID-19 pandemisi, Florida’daki bir federal yargıç, Tarihsel Amerikan İngilizcesi Korpusunun arama çubuğuna “sanitasyon” yazmak için kader kararını verdiğinde hala öfkeliydi.
Ülkenin pek çok yerinde maske gereklilikleri çoktan düşmüştü, ancak uçaklar ve diğer toplu taşıma araçları konusunda federal bir maske görevi hala devam ediyordu. Göreve itiraz eden bir dava, Adalet Clarence Thomas’ın eski katibi Yargıç Kathryn Mizelle’den önce gelmişti. Biden yönetimi, görev süresinin, Hastalık Kontrol ve Önleme Merkezlerine (CDC) hastalığın yayılmasını önlemek için “sanitasyon” ile ilgili kurallar getirme yetkisi veren bir yasaya dayanarak geçerli olduğunu söyledi.
Mizelle, soruya metinsel bir yaklaşım getirdi — özellikle yasadaki kelimelerin anlamlarına bakarak. Ancak sözlüklere danışmanın yanı sıra, bir Brigham Young Üniversitesi dilbilim profesörü tarafından diğer dilbilimciler için inşa edilen bir korpus adı verilen bir dil veritabanına danıştı. 1930’dan 1944’e kadar “sanitasyon” kelimesinin her örneğini çekerek, “sanitasyonun” bir şeyi temiz tutmanın bir yolu olarak değil, aktif olarak temiz bir şey yapmayı tanımlamak için kullanıldığı sonucuna vardı. Bu yüzden, maskelerin aslında “sanitasyon” olmadığına karar verdi.”
Maske görevi vardı bozdu, bir son adımda dişlerin sökülmesi halk sağlığı yetkilileri, hatta bulaşıcı hastalığın yaygın koştu.
Yeni bir yasal araç
Hukuki soruları cevaplamak için corpora kullanmak, genellikle yasal korpus dilbilimi olarak adlandırılan bir strateji, son on yılda bazı yasal çevrelerde giderek daha popüler hale gelmiştir. Michigan Yüksek Mahkemesi ve Utah Yüksek Mahkemesi’ndeki hakimler tarafından kullanıldı ve geçtiğimiz Mart ayında ABD Yüksek Mahkemesi tarafından ilk kez sözlü tartışmalar sırasında atıfta bulunuldu.
Georgetown Hukuk profesörü Kevin Tobia, ”2018’den bu yana hızla büyüyor” diyor. “Ve sadece büyümeye devam edecek.”
Bir korpus, yüz milyonlarca satır veya daha fazla metin içeren kitaplar, makaleler, konuşmalar ve diğer metinler gibi şeyleri içerebilen geniş bir yazılı dil veritabanıdır. Dilbilimciler genellikle dilin nasıl kullanıldığını ve hangi kelimelerin ne için kullanıldığını yıkmak için bilimsel projeler için kurumsal kullanırlar.
Dilbilimciler, hakimlerin aslında araçları doğru kullanacak kadar iyi eğitilmediğinden endişe duyuyorlar. Şu anda emekli olan Brigham Young Üniversitesi dilbilim profesörü Mark Davies, ”Naif yargıçların öğle saatlerini hızlı ve kirli şirket aramaları yaparak ve fikirlerini bildirecek veriler elde ederek geçirecekleri beni gerçekten endişelendiriyor” diyor. Tarihsel Amerikan İngilizcesi Corpus. Bu iki şirket, yasal korpus dilbilimini destekleyen hakimler tarafından en çok kullanılan araçlar haline gelmiştir.
Corpora kullanımı, genellikle muhafazakar olan belirli bir yargıçlara hitap eder. Bir anlamda, yasal korpus dilbilimi, milletvekillerinin niyetini veya geçişine yol açan yasama tarihini göz önünde bulundurmadan sayfadaki belirli kelimelere dayalı kararlar alınmasını gerektiren bir yasal düşünce okulu olan metinsel bir alt kategoridir. Tekstüalizm, Adalet Antonin Scalia ve diğer muhafazakar hakimler ile en güçlü şekilde ilişkilidir, ancak temel dayanağı hukuk mesleğinde yaygındır. (2015’te yaptığı konuşmada Adalet Elena Kagan, ”Artık hepimiz metin yazarlarıyız” dedi.)
Ancak yasal korpus dilbilimi, tekstüalistlerin teknolojinin ve büyük verinin cazibesiyle gizlenmiş çok özel bir araca yönelmelerini sağlar. Tarihsel Amerikan ingilizcesi Korpusu 475 milyon satırlık metin içerir; Çağdaş Amerikan İngilizcesi Korpusu 1 milyar içerir. Eleştirmenler, yargıçlar tarafından kullanılmasının yanıltıcı bir nesnellik kaplaması yaratabileceği konusunda uyarıyorlar; ancak yine de siyah—beyaz cevaplar vermeyen şirketler, bunları iyi kullanmak için ek düzeyde yetenekli bir yorum gerektiriyor.
Hukuk yorumunu inceleyen profesör Anya Bernstein, ”Bence bu, hakimlerin ve hukuk teorisyenlerinin cephaneliğinde, yasa yorumlarını kabul etmek için gerekçeler vermek istemeyen, ancak bazı nesnel veya dışsal koşullar nedeniyle sadece kabul edilemez bir doğruluk iddia etmek isteyen başka bir araçtır” diyor Buffalo Üniversitesi Hukuk Fakültesi’nde. “Bu, bilgisayardaki bir düğmeye basarak yapabileceğiniz bir şey olduğunu ima ediyor.”
Tekstüalizm üzerine bir bükülme
Tekstüalizm geleneksel olarak büyük ölçüde sözlüklere dayanıyordu. Bir tüzükteki sözcüklerin tanımlanmadığı durumlarda, hakimler, yapım kanunları olarak bilinen bir dizi yorumlama yöntemine geri dönerler. Çoğu durumda, hakimler bir kelimenin “sıradan anlamını” aramalıdır — sözlüklerin devreye girdiği yer burasıdır. (Antonin Scalia ve Bryan Garner’ın metinselci yorumuyla ilgili bir el kitabı olan Reading Law, sözlüklere ve bunların nasıl kullanılacağına adanmış bir ek içerir.)
“Sıradan anlam” genellikle ABD’deki ortalama bir insanın belirli bir kelimenin anlamını anlama şekli olarak tanımlanır. Sıradan bir anlam bulmaktan, olsa, zor, ve en iyi uygulama üzerine nasıl yapmak için anlaştık. Sözlük tanımları ve etimolojileri genellikle yeterli değildir. Byu’nun J. Reuben Clark Hukuk Fakültesi’nde hukuk ve korpus dilbilimi kıdemli üyesi olan James Heilpern, hakimleri ve avukatları uygulama konusunda eğiten James Heilpern, ”Bu araçların tümü son derece yetersiz” diyor. Bir sözlük aslında tanımlarında sıradan bir anlam sunmuyor, diyor ve bir kelimenin etimolojisi, zamanın diğer noktalarında nasıl kullanıldığı hakkında mutlaka bir şey söylemiyor.
Heilpern, hakimlerin kendilerine uzun süredir güvenmelerine rağmen, metin yazarlarının yaklaşımlarını desteklemek için sadece sözlüklerden daha iyi araçlara ihtiyaç duyduklarını düşünüyor. “Bu geleneği yenilikle aşılayacağız” diyor. “Ve işlerimizi daha iyi yapmak için araçlar geliştireceğiz.”
Fakat korporayı kuranlar metinçiler değildi – dilbilimciler öyleydi. Bir anlamda Çağdaş Amerikan İngilizcesi Korpusu ile Tarihsel Amerikan İngilizcesi Korpusu’nu yaratan dilbilimci Davies aynı sayfada. Fikrin, kelimelerin ve dilin gerçek dünyada nasıl kullanıldığını yakalayabilen bir metin gövdesi oluşturmak olduğunu söylüyor.
Aynı zamanda Davies, çalışmalarının yasal bir araç olarak bitmesini beklemiyordu. “Ben bir dilbilimciyim, bu yüzden herkesin benim gibi bir egghead olduğunu ve sözdizimsel yapılara bakmak istediğini düşünüyorum” diyor.
Fakat Davies’in dilbilim öğrencilerinden Stephen Mouritsen hukuk fakültesine devam etti. 2010, Mouritsen yayınlanan bir kağıt içinde AZERBAYCAN Hukuku Dergisi savunarak, corpus dilbilim olabilir yardım hakimler anlamaya “sıradan anlam” sözleri. Mouritsen daha sonra Utah Yüksek Mahkemesi’nden Adalet Thomas Lee’ye katiplik yaptı.
2011 Yılında, korpus dilbilimi ilk kez Adalet Lee tarafından adli bir görüşte ortaya çıktı. Georgetown profesörü Tobia’nın Chicago Üniversitesi Law Review Online’da yaptığı bir analize göre, 2011-2017 yılları arasında Utah Yüksek Mahkemesi ve Michigan Yüksek Mahkemesi’nde diğer beş görüşte kullanıldı. Kullanımı 2017 ve 2020 arasında çarpıcı bir şekilde arttı — bu pencerede çeşitli eyalet ve federal mahkemelerdeki hakimler tarafından 24 kez gösterildi.
En yargıçları tartışırken corpus dilbilim kendi görüşleri olduğunu Cumhuriyetçiler atanmış göre Tobia analizi. Ve Cumhuriyetçi atanan hakimler korpus dilbilimi hakkında konuştuklarında, bunun lehine olma olasılıkları daha yüksekti; Demokratik atamaların aracı eleştirme olasılıkları daha yüksekti.
Tekstüalizmin yasaya daha muhafazakar yaklaşımlarla ilişkili olduğu göz önüne alındığında bu şaşırtıcı değil. Ama Heilpern bunun olması gerekmediğinde ısrar ediyor. ”Korpus dilbiliminin tamamen apolitik ve ateoretik bir araç olduğuna gerçekten inanıyorum” diyor.
“Ölümcül kusurlu” kullanımlar
Hakimler aslında uygun corpus dilbilim kullanarak olup olmadığını dilbilimciler, ama, bir sorum var. Santa Barbara’daki California Üniversitesi’nde dilbilim profesörü olan Stefan Gries, genel olarak konuşursak, üç korpus dilbilimsel analiz kategorisi olduğunu söylüyor. Birincisi en basit olanı: Tarihsel Amerikan İngilizcesi Corpus gibi bir web sitesinde arama yapmak. İkincisi, daha gelişmiş analizler yapmak için özel korpus dilbilim yazılımı kullanır. Üçüncüsü, insanlar metinleri analiz etmek için kendi kodlarını yazarlar.
Gries, çoğu yasal korpus dilbiliminin birinci kategoriye girdiğini söylüyor. “Bu hakimler, korpus dilbilimi ve hukuk üzerine bir hafta sonu eğitim oturumunun bir parçasıydı ve esasen COHA veya COCA web sitelerine gitmeyi öğrendiler” diyor. “Bir arama terimi giriyorlar ve çoğu zaman çok temel sayımlar yapıyorlar ve bu da bir korpus analizi olarak rapor ettikleri şey.”
Genellikle – Florida’daki Yargıç Mizelle gibi – web sitesini bir dil veritabanında belirli bir kelimenin veya cümlenin göründüğü her zaman aramak için kullanıyorlar ve daha sonra bu kelimenin veya cümlenin nasıl kullanıldığını görmek için kontrol ediyorlar. Chapman Üniversitesi Fowler Hukuk Fakültesi’nde yardımcı doçent olan James Phillips, ”Zamanın yüzde 90’ı kelimenin bir anlamı kullanılıyorsa, muhtemelen insanlar bu kelimeyi nasıl anlayacaklardı” diyor.
Ama dilbilimci Gries aynı fikirde değil. Gries, bir kelimenin en sık kullanılan uygulamasının her zaman bu kelimenin en “sıradan” veya en çok anlaşılan kullanımı olmayacağını söylüyor. Örneğin, corpora, özellikle yasal korpus dilbilimi için kullanılan corpora, TV programlarından, dergilerden ve gazetelerden — haber kaynaklarından milyonlarca kelime içeriyor. Bu nedenle, bir Stanford Law Review makalesine göre, bir kelime belirli bir şekilde daha sık kullanılabilir, çünkü kelimenin bu kullanımı daha fazla haber değeri taşır.
Davies ayrıca yargıçların kullandığı metodolojiye yeterince dikkat edilmediğinden endişe ediyor. Arama yöntemini değiştirme ya da kelime arama içinde sayılır şekilde, ya da çok ufak oynamalar herhangi bir sayıda analiz sonuçlarını etkileyebilir. “Bunu başka bir şekilde yapmış olsaydın, farklı sonuçlar alırdın” diyor. En yasal corpus analizi de yok sorma birden fazla kişi için aynı analiz verileri, hangi yardım azaltmak önyargı, göre Tobia var analizi.
Korpus dilbilimi, soruları cevaplamanın daha objektif bir yolu gibi görünse bile, dil etrafında net cevaplar sunamaz. “Bu nicelik gibi görünüyor, bu yüzden bir şekilde daha güvenilir, çünkü her şey sayılar. Ama aslında hepsi kalitatif, ”diyor Bernstein. İnsanlar hala korpusun onlara verdiği sonuçları yorumlamak zorundadır ve farklı insanlar onları farklı şekillerde tanımlayabilir.
“Gerçekten iyi bir dilbilimciyseniz, diğer insanları açıklamalarınızın doğru olduğuna ikna edebilirsiniz” diyor. “Ama burada doğru bir cevap yok gibi.”
Ben tamamen tarafsız bir aracı olabilir corpus dilbilim taraftarları biliyor ve avukatlar ve içerik ve yorumlama anahtarı olan hakimlere vurguluyor bu Heilpern diyor. ”Korpus dilbilimi, kararlarını vermek için hakime daha iyi kanıtlar sağlayabilir” diyor. “Yargıcın ne yaptıklarını biliyorlarsa kendi başlarına kullanmasında yanlış bir şey yok.”
Ancak Bernstein, yargıçların korpus dilbilimini kullanma becerilerine sahip olduklarından şüphelidir. ”Diyorlar ki, ‘Ve bunu tamamen yapabiliriz, çünkü son derece rafine konuşmacılarız ve işimiz dili yorumlamak” diyor. “Karşılaştırmalı edebiyattaki insanlar da dili yorumluyor. Metinleri çok yorumluyorlar ama dilbilimci değiller.”
Özellikle eleştirmenlerle ilgilidir, çünkü yetersiz bir korpus araştırmasının sonuçları gerçek dünyayı etkiler — sadece akademiyi değil.
Uçaklardaki herhangi bir maske gereksinimini engelleyen maske görevi davasını ele alalım: insanların maskelemek zorunda kaldığı son yerlerden biri. Bu kurallar gittiğinde, COVID-19 pandemisi ABD’de yanmaya devam etse de, çoğu maskeleme de yaptı. Gries, Tobia ve Columbia Hukuk İnceleme Forumu’nda yazan diğer uzmanlara göre, bu davadaki korpus dilbilimsel analizinin önemli sorunları vardı. Örneğin, hakim, kelimelerin farklı kullanımları olmasına rağmen, “sanitasyon” ile birlikte “sıhhi” ve “sterilize” yi aradı. Bu bilim adamları, yargıcın “sanitasyon” un bir yeri temiz tutmak anlamına gelebileceği durumları görmezden geldiğini savunuyorlar.
”Bölge mahkemesinin corpora hakkındaki değerlendirmesi ölümcül derecede kusurlu” diye yazdılar ve “opak ve üretilemez.”
Gries ve diğer dilbilimciler, korpus dilbilimsel analizinin uzmanlar tarafından mahkemede sunulması veya bir davanın her iki tarafının da kendi analizlerini yapması ve bir duruşma sırasında kanıt olarak sunması durumunda daha rahat olacağını söylüyorlar. Heilpern bunun da ideal olacağını söylüyor.
Ancak Gries, yargıç olmanın onları bir korpus dil aracını kullanmak için eşit derecede nitelikli hale getirdiğini düşünen hakimler gördüğünü söylüyor. “Hakimler tarafından uzman özetleri atıldım” diyor. “Bu kelimeleri tam olarak kullanmıyorlar, ama temelde diyorlar ki, ‘Bu boka ihtiyacım yok, yapabilirim.’”
Bu tür problemler korpus dilbilimine özgü değildir — dindar metin bilimciler bile kelimelerin anlamlarını bulmak için kullanılan stratejilerin yanlış kullanıldığında sorun yaratabileceğini söylerler. Scalia ve Garner, Yasayı okurken, “sözlüklere eleştirel olmayan bir yaklaşımın hakimleri yanıltabileceği konusunda uyarıyorlar.” Ancak, nesnel bir teknolojinin parlaklığına sahip bir korpus gibi büyük bir veri aracıyla direnmeleri tartışmasız daha zor. “Bu bir yanlışlık olsa da, tek bir doğru cevabı iddia etmenin bir yolu. Bu bir yanılsama ”diyor Bernstein.
Yasal korpus dilbiliminin kullanımı son birkaç yılda hızla büyüdü ve Heilpern, geleceğin neye benzeyebileceğinin hala net olmadığını söylüyor. Ancak bu tekniğin hukuk fakültelerinde öğretilmeye başlanacağını ve giderek daha fazla yargıcın bu yaklaşıma aşina olmaya başlayacağını ve avukatları da bunu anlamaya zorlayacağını düşünüyor. Davies, birincisi, bir Yargıtay adaletiyle konuştuğunu ve yakın çalıştığı birinin bir saniye konuştuğunu söylüyor.
Phillips, ”Herkesin aşina olması gereken bir araç olduğu bir gün hayal edebiliyorum” diyor. “Bu nihai hedef ve bu yönde adımlar atacağız.”
Gries için – aracı eleştirmesine rağmen – bu mutlaka kötü bir şey değil. Corpus dilbilim yayılmasını Olası sonuçlarını kullanıyor kim bağlıdır, diyor. Eğer bir tartışma her iki tarafında da üzerinde avukat ve bilirkişi varsa, o ayrı bir şey. Yargıçlar kendi odalarında arama yapıyorsa, bu başka bir şeydir.
Gries, ”Çok iyi olabilir ama aynı zamanda çok tehlikeli olabilir” diyor. “Kimin yaptığına bağlı.”