RSS

Doğal dil işleme üstüne kısa kısa…

22 Dec

Security, Steganography, and Watermarking of Multimedia Contents IX (EI120) konferansı için hazırladığımız doğal dil damgalama (natural language watermarking) makalesi için zaman gittikçe daralıyor, stres gittikçe artıyor. Uygulamasını Common Lisp ile gerçekleştirmeye çalıştığımız araçlardan edilgenleştirme aracı bazı birkaç kritik durum haricinde düzgün çalışıyor, bir yandan da daha basit araçların kodlanması ve testleri devam ediyor.

Bu DDİ (Doğal Dil İşleme) çalışmasının yürütücülerinden Bülent Sankur‘un verdiği habere göre Türk Dil Kurumu doğal dil işleme için bir kitap hazırlama kararı almış ve bunun için katkıda bulunabilecek hocalara da haber vermiş:

Türk Dünyası Bilgisayar Destekli Dil Bilimi Çalışma Grubu 12.07.2006 tarihinde toplanmış ve:

5. Doğal Dil İşleme adlı kitabın ekte sunulan içeriğinin ilgili bilim adamlarına gönderilerek hazırlamak istedikleri bölümleri seçebilmeleri için bir üst yazının Necdet Kesmez tarafından hazırlanmasına;

oy birliği ile karar vermiştir.

Umarım 1-2 yıl içinde böyle bir kitap güzel bir baskı ile raflardaki ve arşivlerdeki yerini alır da bundan sonra bilgisayarda DDİ ile uğraşan heveslilere, araştırmacılara gösterilecek derli toplu düzgün bir başvuru kaynağına kavuşuruz.

Tabii doğal dil işlemenin karşımıza nerede çıkacağı hiç belli olmuyor, misal HB, Common Lisp ile yazdığı heceleme programından bahsetmiş. Bunun üzerine cs-lisp e-posta listesinde konu ile ilgili çıkan tartışmada farklı yöntemler ve algoritmalar önerilmeye başlanmış.

Bu konularla ilgili Internet’te gezinirken yapay-zeka.org sitesinde doğal dil işlemeye dair iki önemli uygulama ile karşılaştım:

  • Türkçe için Verimli Bir Cümle Sonu Belirleme Yöntemi: “Doğal Dil İşleme” (DDİ) çok farklı amaçlarda kullanılan bir araştırma alanıdır ve günümüzde hızla yaygınlaşmaktadır. Konuşma analizi, konuşma tanımlama, imla doğrulama DDİ uygulama alanlarından sadece birkaçıdır. Bir dilin biçimbilimsel özelliklerinin belirlenebilmesi için o dili anlatan ve üzerinde istatistiksel ve biçimbilimsel analizlerin kolayca yapılabildiği bir derlem oluşturulması gereklidir. Böyle bir derlem oluşturmanın ilk aşaması cümle sonu belirleme işlemidir. Bu işlem oldukça karışık ve çözülmesi zor bir işlemdir, ancak derlem oluşturmanın en önemli aşamasıdır. Bu çalışmada cümle sonu belirleme problemini çözmek için yeni bir yöntem geliştirilmiştir. Cümle sonu belirleme işlemi için kullanılan kısaltma ve kural listeler XML yapısında kaydedilmiştir; bu dosyalar cümle sonu belirleme işleminde basarı oranının artmasını sağlamıştır. Bu yeni yöntem cümlelerin doğru ve verimli biçimde ayrıştırılmalarını sağlayarak, araştırmacılara yardım edecektir. (Özlem AKTAS – Dokuz Eylül Üniversitesi – Bilgisayar Mühendisliği Bölümü – ozlem at cs.deu.edu.tr
  • Türkçe Doğal Dil Arayüzülü bir Kişisel Takvim Programının, Tasarım ve Kodlaması: Günümüzde hızla gelişmekte olan yapay zeka konularından birisi de doğal dil işlemedir. Bu konuda teorik pek çok çalışmanın yanı sıra, sınırlı sayıda pratik uygulama mevcuttur. Bu eksikliklerden birini doldurmak amacıyla yazılmış olan TuSA, doğal dil ara yüzüne sahip bir takvim programıdır. Amacımız, bilgisayar kullanma konusunda hiçbir bilgisi olmayan insanların, kolay bir şekilde randevularını kayıt edebilecekleri ve daha sonra sorgulayabilecekleri bir kişisel asistan geliştirmektir. Boğaziçi Üniversitesi?nde halen devam etmekte olan, TOY projesinde geliştirilen altyapıyı kullanan TuSA için yapılan sözdizimsel çalışmalarda, Türkçe?deki olası kişi, yer, konu, zaman ve soru cümle grupları analiz edilmiş ve listelenmiştir. Anlambilimsel alandaki çalışmalarda Türkçedeki bu kelime grupları için birer gösterim tasarlanmış, kayıtların tutulması için bir veritabanı oluşturulmuş ve girilen bilgilerin sorgulanabilir halde veritabanında tutulması sağlanmıştır. (Şadi Evren ŞEKER, Dr. Birol Aygün, Prof. Dr. A. C. Cem Say)
Advertisements
 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: