RSS

Türkçe'deki fiil sayısı, türleri ve istatistikler

11 Dec

Türkçe’deki tüm eylemleri kapsamlı olarak incelemek ve eylem sayısını belirlemek açısından bu çalışma bir ilki oluşturmaktadır. TDK Szölüğü ve Yazım Kılavuzu’nun taranması sonucunda günümüz Türkçesi’nin eylem sayısının yaklaşık 4600 (4577) olduğu ortaya çıkmıştır. Söz konusu eylemlerin yalnızca 230 tanesi tek seslemlidir. Tek seslemli eylemlerin alfabetik olarak dağılımı Ek I’de verilmiştir.

Yukarıdaki paragraf Dilbilim Araştırmaları 2006‘daki “Türkçe’de eylem sayısı ve biçimbirimsel özelliklerine göre eylem sınıfları” başlıklı makaleden alınma. Mine Nakipoğlu ve Aslı Üntak tarafından yazılmış makale bileşik olmayan Türkçe fiillere odaklanıyor ve epey detaylı listeler, açıklamalar içeriyor.

Bu tür teorik çalışmaların ne zaman işe yarayacağı ise hiç belli olmuyor, söz gelimi bir doğal dil işleme uygulamasında, özel olarak doğal dil damgalama araçları bağlamında bilgisayar programları geliştirilirken böyle bir makale beklenmedik anda yarar sağlayabiliyor.

Bir başka ilginç nokta: yine DDİ (Doğal Dil İşleme) üstüne yazıların yer aldığı Zemberek projesi geliştiricilerinin blogundaki “Kelime İstatistikleri” başlıklı girdi göz önünde bulundurulduğunda kullanılmış olan 5,160,619 sözcüklük derlemde 2,068 kadar fiil kökü bulunduğu belirtilmiş. Bu da, yukarıda adı geçen makaledeki veriler göz önünde bulundurulduğunda, mevcut bileşik olmayan fiillerin %45.18’i gibi bir orana karşılık geliyor. Tabii bu oran tek başına anlamlı değil, söz konusu fiillerin frekanslarının yani mevcut Türkçe yazılarda geçme sıklığının bilinmesi de önemli. Bunun için de ne kadar büyük ve farklı yazı türlerinden cümle içeren bir derlem olursa o kadar iyi olacaktır.

Gerek dilbilimcilerin gerekse DDİ (Doğal Dil İşleme) ile uğraşan bilgisayarcıların bu tür verileri, bilgileri derleyip toplayıp kamu ile paylaşması gün geçtikçe daha çok önem kazanıyor çünkü dile dair bir şeyler üretmek isteyen insanlar yukarıdaki bir örnekte belirtildiği gibi hiç beklenmedik anlarda bu tür verilerden, istatistiklerden, listelerden epey faydalanabiliyorlar. Bu tür çalışmaların ivmelenerek artmasını diliyorum.

 
Leave a comment

Posted by on December 11, 2006 in General, Linguistics

 

Leave a comment