Kas 032013
 

Türkçe metinlerde sözcük ayırma algoritması

Türkçe metinlerdeki sözcükleri bilgisayar programları aracılığıyla birimlerine – sözcüklerine ayırmak oldukça kolay.

Temel olarak, harf olmayan tüm karakterler bir ayraç işlevi görür. Bunların başında da boşluk işareti yer alır. En sık kullanılan ayırma işareti, boşluk işaretidir.

İyi tanıdığımız bir başka ayırma işareti, tire (-) işaretidir. Tire işareti (-), satır sonunda kelime bölme işareti olarak kullanılır. Türkçe de bu işaret, heceler arasına konur. Heceler bölünmez.

Tire işareti, bazı terimlerde ikili sözcükleri birbirine bağlayıcı bir karaktere dönüşür: Türk-İslam, Hint-Avrupa gibi.

Aynı kesme işaretinin sözcük gövdesi ve eki arasında bağlantı işlevi gördüğü durumlar da mevcuttur: bab-ı ali, ab-ı kevser, arş-ı ala, devran-ı alem gibi. Bu terimler, arapça veya farsçadan aktarılmıştır. Son dönemlerde bu ayracın kullanım sıklığı oldukça azalmıştır. Aynı terimler babı ali, abı kevser, arşı ala, devranı alem şeklinde de yazılmaktadır.

Nokta (.), ünlem (!), soru işareti (?) gibi işaretler cümlelerin sonunda yer alırlar.

Tire (-), virgül (,), parantez işaretleri (), kesme (/), ters kesme (\), artı (+) gibi işaretler ise sözcüklerin arasına konur.

W, x, q gibi bazı harf işaretleri türkçe alfabede yer almadığı halde, ayraç işlevi görmez. Sadece içinde geçtiği sözcüğün yabancı bir sözcük olduğunu vurgular.

Kısacası, ister cümle sonunda, ister sözcükler arasında yer alsın, satır sonu (-) işareti dışındaki tüm işaretler sözcük sınırını belirler.

Bu durumda “ardışık harf grupları sözcükleri oluşturur” diyebiliriz.

Eklerin Durumu

Türkçede ekler, sözcük gövdesine ulanırlar.

Az sayıda ek te tıpkı sözcük gövdeleri gibi  bağımsız ve ardışık harf gruplarından oluşur.

  • mı?, mi?, mu?, mü? soru ekleri dilbilgisi kuralı uyarınca ayrı yazılır.
  • Özel isimlerin sonuna eklenen kesme(‘) işaretini, bağımsız yazılan bir ek izler.
  • Bab-ı ali, ab-ı kevser gibi sözcük gruplarında yer alan tire (-) işareti de kök ve ek arasında yer alan bir ayraçtır.

Bu örneklerin dışında yer alan bütün ekler, sözcük gövdelerine doğrudan eklenir.

Sözcük gövdeleri kök veya türetilmiş olabilir. Türetilmiş olsalar da bunlar da kökler gibi özel anlamlar ifade eder. Ekler ise kelime gövdesinin anlamını değiştirme özelliğine sahip değildir.

Örneğin ak sözcüğü bir köktür. Çünkü anlamını yitirmeksizin daha fazla bölünemez.

Oysa akça (beyazca), akmak (sıvı veya gaz halinde yer değiştirmek), akın (ortak hareket halindeki sürü), akıntısal (akıntı halinde) gibi kelime gövdelerinin hepsi farklı anlamlara sahip olsalar da, alt gövde ve köklerine ayrıştırılabilir: ak-ça, ak-mak, ak-ın, ak-ıntı-sal.

Türkçe, kök sözcüklere dayalı bir dil. Türetme yoluyla elde edilebilen ayrıntılarsa onun zenginliğinin temelini oluşturuyor. Ancak, günümüzün tüketime dayalı kültürü, yabancı hayranlığıyla da birleşerek yabancı sözcüklerin giderek daha fazla kullanılmasına neden oluyor.

İnsanoğlu, elinin altındaki hazinelerin değerini bilmekten çok, başkalarının elindekilerle ilgilenmeye yönelmiş durumda. Elimizdekilerin değerini, ancak onu yitirdikten sonra farkediyoruz. Ama, iş işten geçmiş oluyor.

Dilimiz, en önemli kültürel varlıklarımızın başında yer alıyor. Onu korumak, paylaşmak ve geliştirmek hepimizin görevi.

Ahmet Aksoy

 

 

Eki 052013
 

Acı Sözcüğü ve Türevleri

“A” harfinden başlayarak sırayla gitmek istedim ama, ilk baştaki sözcükler hep yabancı kökenli. Onlara da sonradan dönüş yaparız ama, ilk yazımız, her ne kadar olumsuz anlam içerse de öz Türkçe bir sözcük olsun. Bu durumda en uygun adayımız, “acı” sözcüğü. Bu sözcükle ilgili temel bilgiler ve yapım ekleri alarak oluşturulmuş türevleri aşağıda.

Sözcük: Acı
Anlam: Biber gibi yakıcı tadı olan; duygusal veya fiziksel açıdan rahatsızlık oluşturan duygu.
Kaynak: Türkçe
Tür: Ad

Yapım ekiyle türetilmiş diğer gövde sözcükler:
acıca: acı-ca (ad)
acılanma: acı-lan-ma (ad)
acılaşma: acı-laş-ma (ad)
acılaşmak: acı-laş-mak (fiil)
acılaştırma: acı-laş-tır-ma (ad)
acılaştırmak: acı-laş-tır-mak (fiil)
acılı: acı-lı (ad)
acılık: acı-lık (ad)
acılılık: acı-lı-lık (ad)
acıma: acı-ma (ad)
acımak: acı-mak (fiil)
acımasız: acı-ma-sız (ad)
acımasızca: acı-ma-sız-ca (ad)
acımasızlık: acı-ma-sız-lık (ad)
acımsı: acı-(ı)-msı (ad)
acımtırak: acı-(ı)mtırak (ad)
acınacak: acı-n-acak (ad)
acındırma: acı-n-dır-ma (ad)
acındırmak: acı-n-dır-mak (fiil)
acınılacak: acı-n-ıl-acak (ad)
acınılma: acı-n-ıl-ma (ad)
acınılmak: acı-n-ıl-mak (fiil)
acınma: acı-n-ma (ad)
acınmak: acı-n-mak (fiil)
acırak: acı-rak (ad)
acısız: acı-sız (ad)
acıtış: acı-t-ış (ad)
acıtma: acı-t-ma (ad)
acıtmak: acı-t-mak (fiil)
acıyıcı: acı-y-ı-cı (ad)
acıyış: acı-y-ış (ad)

Aynı sözcüğün yardımcı fiillerle birlikte – acı vermek, acı çekmek- türetilen örneklerine yer vermedik.  Ancak bu örnek gösteriyor ki, tek bir sözcükten benzer ama farklı anlamlar içeren yüzlerce yeni sözcük türetmek mümkün oluyor.

Ahmet Aksoy