Yirmi beş yüzyıl önce, İran’ın Akhamenid İmparatorluğu’na ait kil tabletlere yazılmış on binlerce “doküman” 1933 yılında günümüz İran’ında, Chicago Üniversitesi Oriental Institute arkeologları tarafından keşfedildi. Yıllardır araştırmacılar, bu eski belgeleri özenle okuyup elle tercüme ediyordu ancak bu şekilde çeviri yapma süreci oldukça zor, yavaş ve hata yapmaya daha yatkın.
1990’lardan beri bilim insanları bu konuda bilgisayarlardan yararlanıyor fakat kil tabletlerin üç boyutlu yapısı ve çivi yazısı karakterlerinin karmaşıklığı nedeniyle çok da başarılı oldukları söylenemez. Ancak Chicago Üniversitesi’ndeki bir teknolojik atılım, sonunda Akhamenid’lerin tarihi, toplumu ve dili hakkında zengin bilgileri ortaya koyan bu kil tabletlerin otomatik bir şekilde transkripsiyonunu yaparak arkeologların daha üst düzey incelemeler yapmalarına olanak sağlayacak.
OI’daki araştırmacılar ve Chicago Üniversitesi Bilgisayar Bilimleri Bölümü arasındaki bir işbirliğinden doğan DeepScribe‘ın kurulma nedeni de tam olarak buydu. Persepolis’i Geliştirme Arşivi’nden, Veri Merkezi ve Bilgisayar destekli projelerden alınan 6.000’den fazla açıklamalı baskıdan oluşan eğitim seti sayesinde, koleksiyonda henüz incelenmemiş kil tabletleri “okuyabilen” bir model oluşturulabilecek ve olanaklar dahilinde arkeologlar bu teknolojiyi diğer antik yazılar üzerine yapılan çalışmalara uygulayabileceği bir araç haline getirilebilecek.
(Yapay Zekaya Göre Denisovalılar 38 Yıl Yaşayabiliyordu)
Asur Bilimleri Doçenti Susanne Paulus, “Eğer farklı alfabelere ve zaman aralıklarına uygulanabilen esnek ve genişletilebilir bir araç geliştirebilirsek, bu gerçekten alanımız için bir dönüm noktası olabilir.” diyor.
“Bu iyi bir makine öğrenimi sorunu.”
İşbirliği, OI’dan Susanne Paulus, Sandra Schloen ve Miller Prosser’ın dijital beşeriler üzerine yapılan Neubauer Collegium adlı bir etkinlikte, Bilgisayar Bilimleri Bölümü’nden Doçent Sanjay Krishnan ile tanışmasıyla başladı. Bu dönemde Schloen ve Prosser, arkeolojik kazılardan ve diğer araştırma türlerinden veri yakalamak ve düzenlemek için OI tarafından desteklenen bir veritabanı yönetim platformu olan OCHER’i denetlemekle uğraşıyordu. Krishnan ise video ve diğer karmaşık veri türleri de dahil olmak üzere, veri analizlerine derin öğrenme ve yapay zeka tekniklerini uygulama işiyle ilgileniyordu. İşbirliği her iki taraf için de kaçınılmaz bir fırsattı.
Krishnan, “Bilgisayar görüntüsü bakımından bu durum gerçekten ilginç çünkü bunlar daha önce karşılaştığımız zorluklar. Son beş yılda bilgisayar görüntüleri önemli ölçüde gelişti, on yıl önce bu işe kalkışsak çok eksiğimiz olurdu, bu kadar yol kat edemezdik.” diyor.
“Bu iyi bir makine öğrenimi sorunu çünkü burada doğruluk nesnel, elimizde daha önceden bildiğimiz bir eğitim setimiz var ve alfabeyi oldukça iyi anlıyoruz, bu bilgiler bize yardımcı olacak. Yani tamamen bilmediğimiz bir sorunla karşılaşmıyoruz.”
Bu eğitim seti İran’a gönderilmeden önce, OI ve Chicago Üniversitesi araştırmacıları tarafından 80 yılı aşkın bir süredir sıkı çalışmalar yürütülmesi ve yakın zamanda tablet koleksiyonun yüksek çözünürlüklü görüntülerinin dijitalleştirmesi sayesinde, şu anda 60 terabaytın üzerinde bir birikime sahip ve hala büyümeye devam ediyor. Araştırmacılar bu koleksiyonu kullanarak, tabletlere yazılmış Elam dilinin bir sözlüğünü oluşturdu ve çivi yazısını nasıl çözüleceklerini öğrenen öğrenciler ise 100.000’den fazla “önemli noktanın” yer aldığı bir veritabanı oluşturdu ve bireysel işaretler belirledi.
(Antik Yunan Yazıtlarını Çözen Yapay Zeka Geliştirildi)
Chicago Üniversitesi Araştırma ve Bilgi İşlem Merkezi’nden alınan kaynaklarla birlikte Krishnan, bu açıklamalı veri kümesini, diğer bilgisayar görüntüsü projelerinde kullanılanlara benzer bir makine öğrenim modeli geliştirmek için kullandı. Eğitim setine dahil olmayan kil tabletler üzerinde test edildiğinde model, çivi yazısı işaretlerini yaklaşık %80 oranında başarıyla çözebildi. Devam eden çalışmalar, kalan %20’yi neyin oluşturduğunu incelemenin yanı sıra bu sayıyı daha da artırmaya çalışacak.
Birçok Dijital Ağır Yük
Ancak %80 oranında bir doğruluk olması bile, transkripsiyon yapılmasında bize yardımcı olabilir. Paulus, tabletlerin çoğunda, “Walmart’tan alınmış bir kutu fişe” benzer ticari işlemlerin betimlendiğini ve tamamen karar veremeyen bir sistemin bile faydalı olabileceğini söylüyor.
OI’daki Tablet Koleksiyonu Küratörü Paulus, “Bilgisayarlar yalnızca tekrar eden kısımları çevirebilir ya da tanımlayabilirse ve zor yer adlarını, fiilleri veya biraz yorumlanması gereken kısımları tamamlamak için işi bir uzmana bırakırsa, işin çoğunluğunu halletmiş oluruz.” dedi. “Ayrıca bilgisayarlar kesin bir karar veremezse, bize olasılıklar ya da ilk dört dize hakkında biraz fikir verebilirse bile, uzmanlar için bir çıkış noktası olacak. Böyle bir şey harika olur.”
Daha sevindirici bir haber ise ekibin DeepScribe‘ı diğer arkeologlarla paylaşabilecekleri genel amaçlı bir şifre çözme aracı haline getirmeyi düşünüyor olması. Model, Elam dili dışındaki çivi yazılarını çözmesi için tekrardan geliştirilebilir ya da eksik kalmış tabletlerin eksik parçalarında hangi metinlerin yazıldığı hakkında mantıklı önerilerde bulunabilir. Bir makine öğrenme modeli, günümüzde kimyasal deneylerin görevi olan tabletlerin ve bilinmeyen kaynaklardaki diğer eserlerin kökenlerini belirlemede bize yardımcı olabilir.
Benzer Veri Merkezi ve Bilgisayar destekli projeler de çift kabuklu yumuşakçaların biyoçeşitliliğini incelemek ya da sanatsal çalışmalarda içeriği tarzdan ayırmak gibi uygulamalar için bilgisayar görüntüsü yaklaşımlarını kullanıyor. Dijital arkeolojinin ve gelişmiş bilgisayımsal yaklaşımların yollarının giderek daha fazla kesişmesinden dolayı, yapılan bu işbirliğinin OI ve Bilgisayar Bilimleri Bölümü arasındaki gelecekteki işbirliklerine ilham olması umuluyor.
Krishnan, “Bir etkinlik sonrası unutulabilecek bir fikrin, gerçek bir işbirliğine dönüşmesi gerçekten etkili oldu.” dedi. “Konuşmaktan daha fazlasını yapabilmemizi sağladı.”
Phys. Chicago Üniversitesi. 12 Mart 2020.
You must be logged in to post a comment Login