Çocuklar Gibi Dil Öğrenen Makineler Geliştirildi

09

Araştırmacılar, bir çocuğun dil öğrenim sürecini daha iyi taklit etmek için gözlem yaparak öğrenen ve programlama yeteneklerini büyük ölçüde artırabilecek bir “semantik ayrıştırıcı” geliştirdi. Bu çalışma kapsamında oluşturulan bilgisayar modeli, insan-makine etkileşimini geliştirebilir ve çocukların nasıl dil öğrendiğine yeni bir bakış açısı sağlayabilir. Çocuklar çevrelerini gözlemleyerek, çevrelerindeki insanları dinleyerek, gördükleri ve duydukları arasındaki noktaları birleştirerek dili öğrenirler. Bu öğrenme biçimini sayesinde, çocuklar kendi dilinde özne, yüklem gibi ögelerin sıralamasını oluşturmayı ve cümle kurabilmeyi öğrenirler.

Programlamada, sentaks bir dilin sözdizim kurallarıdır ve bir deyimdeki her kelimenin nasıl yazılabileceğini belirler. Semantik ise bir dilin anlam kurallarıdır ve bir program çalıştırıldığında gerçekleşecek işlemleri tanımlar. Sentaks ve semantik analiz yapan modüle ayrıştırıcı(parser) adı verilir. Ayrıştırıcılar, web aramaları, Alexa ve Siri gibi ses algılayan sistemler için git gide daha önemli olmaktadırlar.

Bu sene 31 Ekim- 4 Kasım tarihleri arasında Belçika’da yapılan  Doğal Dil Öğrenme Sürecinde Deneysel Metotlar Konferansı’nda(EMNLP) sunum yapan MIT araştırmacıları,  bir çocuğun dil öğrenim sürecini taklit etmek için gözlem yoluyla öğrenen bir ayrıştırıcıdan bahsettiler. Ayrıştırıcının bir çocuğun dil öğrenme sürecini taklit ederek yeteneklerini büyük ölçüde arttırdığı ortaya konuldu. Ayrıştırıcı, dilin yapısını öğrenmek için altyazılı videoları başka hiçbir bilgi olmadan gözlemleyebiliyor kelimeleri kaydedilen nesneler ve eylemlerle ilişkilendirebiliyor. Yeni bir cümle verildiğinde, cümlenin anlamını video olmadan doğru bir şekilde tahmin etmek için dilin yapısı hakkında öğrendiklerini kullanabiliyor.

“Devasa Bir Bulmacanın Parçalarını Çözmek Gibi”

Bu “hafif destekli” yaklaşım ile çocukların çevresini gözlemleme biçimini taklit ederek, hiçbir ek içeriğe sahip olmadan, dil öğrenimi gerçekleştirilebiliyor. Araştırmacılara göre, bu yaklaşım robotları eğitirken yaşanan güçlükleri azaltıp, elde edilen verilerin kapsamını ise arttırabilir. Örneğin direkt olarak açıklanmış birkaç cümle, kayıtlı videolarla birleştirilerek performans artışı sağlanabilir. Gelecekte ayrıştırıcı, insanlar ve kişisel robotlar arasındaki doğal etkileşimi geliştirmek için kullanılabilir. Örneğin, ayrıştırıcı ile donatılmış bir robot, konuşulan cümleler dil bilgisi kurallarına tam uymadığında veya net olmadığında dahi anlamaları pekiştirmek için çevresini sürekli olarak gözlemleyebilir. Araştırmacı Andrei Barbu bu konuda “İnsanlar birbirleriyle konuşurken yarım cümleler ve devrik anlatımlar kullanırlar ve evlerinde, kendi konuşma tarzlarına uyum sağlayacak, ne demek istediklerini anlayacak bir robot isterler.” diyor.

Ayrıca, ayrıştırıcı araştırmacıların küçük çocukların dil öğrenmelerini daha iyi anlamalarına yardımcı olabilir. Bir diğer araştırmacı Boris Katz’ e göre küçük bir çocuk dünyayı daha iyi anlamasını sağlayacak görme ve dokunma bilgilerine çok değişik kaynaklardan kolayca erişebilmektedir. Buna ebeveynlerinin ve kardeşlerinin konuşmaları örnek verilebilir. Bu nedenle Katz, eş zamanlı bu duyusal veri girişlerinin tümünü işleyebilmeyi, devasa bir bulmacanın parçalarını çözmek gibi inanılmaz bir iş olarak görüyor.

Araştırmacılar, çalışmalarında videodaki nesneleri, insanları ve olayları tanıma konusunda geliştirilmiş “computer vision” bileşenleri ile semantik bir ayrıştırıcıyı birleştirdiler. Bilgisayarlı görme olarak dilimize çevrilmiş “computer vision” insan görsel sisteminin yapabileceği görevleri otomatikleştirmeyi amaçlar ve görüntü işleme kavramının üst kategorisi olarak nitelendirilebilir. Bir görüntü üzerindeki nesneleri tanıma ve ayırt etme işlemi bilgisayarlı görme sürecinin parçasıdır. Semantik ayrıştırıcılar genellikle, her bir kelimeye anlam yükleyen ve kelimeler arasındaki ilişkiyi açıklayan kodlarla cümle kurmak için oluşturulur.

Ross, yeni ayrıştırıcının video kullanılarak eğitilen ilk ayrıştırıcı olduğunu söyledi. Kısmen, videolar belirsizliği azaltmada daha kullanışlıdır. Ayrıştırıcı, bir cümledeki bir eylem veya nesne hakkında emin değilse, bunları netleştirmek için videoya başvurabilir. Araştırmacılar, bir nesneyi bir yere koymak, bir yerden almak veya taşımak gibi bir dizi eylem gerçekleştiren insanları gösteren yaklaşık 400 videoluk bir veri seti derlediler. Kitle kaynak platformu olan Mechanical Turk'e katılanlar, bu videolar için 1.200 başlık sağladı. Eğitim ve ayarlama için 840 video başlık örneği ayırdılar ve test için geriye kalan 360 taneyi kullandılar. Çalışmada, araştırmacılar ayrıştırıcıya, bir cümlenin belirli bir videoyu doğru bir şekilde açıklayıp açıklayamadığını belirleme amacını verdi. Ayrıştırıcıyı bir video ve uyumlu alt yazı ile beslediler. Ayrıştırıcı, altyazının olası anlamlarını mantıksal matematiksel ifadeler olarak çıkarttı. Bu ifadeler ve video Barbu ve diğer araştırmacılar tarafından geliştirilen "Sentence Tracker" isimli bilgisayarlı görme algoritmasına girildi. Algoritma, her video karesine, nesnelerin ve insanların zaman içinde nasıl değiştiğini izlemek ve eylemlerin anlatıldığı gibi yürütülüp yürütülmediğini belirlemek için bakar. Bu şekilde, anlamın video için doğru olup olmadığını belirler.

Nesneler, insanlar ve eylemler için en sık resimle eşleşen söz, altyazının en olası anlamı haline gelir. İfade, başlangıçta, videodaki birçok farklı nesneye ve eyleme atıfta bulunabilir, ancak olası anlamlar seti, ayrıştırıcının sürekli olarak olasılıkları elemesine yardımcı olur. Barbu, “Bütün cümlelerin aynı kurallara uyması, hepsinin aynı dilden gelmesi ve birçok altyazılı video görmesi gerektiği varsayılarak, anlamları daha da sınırlandırabilirsiniz” diyor. Çalışma, öğrendiği kelimeler için sentaktik(sözdizim) ve semantik(anlamsal) bir dilbilgisi üretir. Yeni bir cümle verildiğinde, derleyici artık video gerektirmez, ancak cümle yapısını ve anlamını belirlemek için dilbilgisini ve veri sözlüğünü kullanır.

Sonuçta, Barbu, bu yöntemin “bir çocukmuş gibi” öğrendiğini söylüyor ve ekliyor “Çevrenizdeki dünyayı görüyor ve cümlelerin anlamlarını öğrenmek için konuşan insanları duyuyorsunuz. Bir gün size bir cümle verebilir ve ne anlama geldiğini sorabilirim, siz hiçbir şey bilmeseniz dahi cümlenin anlamını söyleyebileceksiniz. ” Brown Üniversitesi'nde bilgisayar bilimi profesörü olan Stefanie Tellex ise bu araştırmayı, doğal dil süreci için tam olarak doğru yol” olarak tanımlıyor. Gelecekteki çalışmalarda, araştırmacılar sadece pasif gözlemleri değil, ilişkileri modellemekle ilgileniyorlar. Ross “Çocuklar, öğrenirken çevre ile etkileşim kuruyor. Bizim fikrimiz, öğrenmek için sezgileri de kullanacak bir modele sahip olmaktır, ”diyor.

 

Kaynak: MITNews, Interestingengineering

 

Yazar: Muhammed Ali Beyazıt