Önbilgiler: ‘Semantik arama’ deyince, sözcükleri morfemlerine göre değil
de, anlamlarına göre arayabilmeyi anlıyoruz. Türkçe’de yakın anlamlı veya
çağrışımlı sözlük yok. İngilizce’dekiler de oldukça sınırlı kapsamda. Artı, programların
dilbilgisi altprogramları oldukça hatalı durumda.
Konuyu örnekleyelim: 8 Nisan - 8 Mayıs 2013 tarihleri arasında, Blogcu’daki
bir sayfama gelinen taramada kullanılan anahtar sözcükler şunlarmış:
türkiyedeki sağ partiler 3
çıplak zenci erkekler 3
aristonun 10 temel 2
türkiye'deki sağ ve sol partiler 2
www.geylerin foto 2
nu erkek 1
aristo'nun 10 kategorisi 1
sanatçınin önemi̇ 1
geyler nu 1
docs.google.com e-kitap 1
ülkemizdeki sağ partiler 1
nü foto 1
kasımpaşa çingene pazarı 1
sağ ve sol partiler 1
türkiyede sağ partiler 1
çin aile yapısı 1
turkiyede sag partiler 1
turkiyede sag sol partiler 1
yazisma tekst nedir 1
akp nin başarısızlıkları 1
lübnan trajedisi 1
sağcı ve solcu partiler 1
türkiye'deki sağcı partiler 1
koninin hangi 1
sağ sol partiler 1
türki̇yede hangi̇ parti̇ler sağci 1
Ön saptama: Bu aramaların bir öğrenci ödevi nedeniyle yapılmış olması büyük
olasılık. Ancak bu durum aynı zamanda, konuyu arayan örnekleme kümesinin
oldukça geniş, baştan tanımlı ve istatiksel açıdan anlamlı olmasını sağlıyor.
Ayrıca, sınırlı da olsa bilgisel bir arayış sözkonusu.
Devam: Görüldüğü gibi aynı konu, 10 farklı biçimde aranabiliyor. Konunun
bir bölümü bir biçimde çözülmüş durumda (gözlem sonucunda belirtiliyor) ama
tamamı değil. Orayı geçip, çözümsüz olan duruma varalım:
Konuyla ilgili Türkçe’de 4 temel kitap var:
‘Türkiye’de Sağ Partiler’: Faik Bulut
‘Türkiye’de Sol Partiler’: Faik Bulut
‘Popüler Türk Solu Sözlüğü’: İnönü Alpat
‘Türk Sağı Sözlüğü’: Hüdavendigar Onur
(Duverger’in ve Berkes’in siyasi partiler tarihi ile ilgili kitapları var
ama onlar 1900-1950 arası döneme ilişkin, aramacıların onlarla pek ilgilenmeyeceğini
kabul edebiliriz. Bir de Türkiye’deki siyasal partilerin listesi her zaman
tutulur ama onu güncellemek zor, çünkü ülkemizde yılda 3-5 tane yeni parti
kuruluyor ve toplam sayı 100’ün üzerinde, yine de birkaç ay geriden gelse de
tam liste var.)
Şimdi, ilk aramadan bu kitaplara
nasıl varılabilir?:
Örneğin, ‘parti’ ile ‘popüler’ arasında bir anlam ilintisi kurmak gerekli.
Ancak, ‘popüler’ ‘halk’ ile de ilintili. Eğer, ikisini de kurarsanız, bir
semantik totolojik döngü oluşabilir.
Bunun yerine, 1.-5. derecede anlam yakınlığı listesi tercih edilebilir.
Bunun da Google’sal göstermesi yapılabilir ama Google ticari bir kurum, bir
Wikipedia değil.
Bu 1.-5. derecede anlam ilintilendirilmesinin her 5-10 yılda bir, değişik
kültürel / eğitimsel / demografik fragmanlardaki insanlar için de taranması ve
listelenmesi gerekli.
Devam: Zaten bu kitapların bilgisini internette bulunca, onları temin etmek
gerek. İnternet kullanıcısı böyle bir derde katlanmıyor.
Varılan yer ne?: İnternetin konuyla ilgili bilginin yalnızca % 1-5’ini
verebileceği gerçeği.
Bu, Wikipedia ve yakın tarihli konular için limit % 100 durumda. Türkçe
Wikipedia ise feci durumda. Hem o sayfa, hem de Google Translate Türkçe için, bu
işi yapabilecek çevirmenlerimiz ekmek paralarına kan doğrandığı için tavır
koymuş gibiler.
Çıkarsama: Her kim yapacaksa, söz edilen anlamsal taramanın sonu bitmeyecek
biçimde, yapılabilirse geçmişe ve eski sözcüklere de yönelik olarak, (sonuç çok
para edeceği için) gerekirse genel aramaya kapalı olarak, sürekli olarak
yapılması gerek. Birileri anket yapılmasına zaman ayırabildiğine göre, bu
biçimde uygulama da bir yöntem olabilir.
En önemli vurgu: Hakia gibi
örneklerden biliyoruz ki yapılmış olanların hepsinin çöpe atılması gerekli ve
Google tekeli orada heyula gibi duruyor, yani Google konunun en büyük engeli
durumunda.
Dipnot: Bilgisayarımda, arama listesindeki ilk altı çizili ibare
yazıldığında, ne Google’da, ne de Blogcu’da, benim sayfama gelinmiyor. Böylelikle
buradan çıkan bir sonuç daha var: Döküm, aramanın yapıldığı bilgisayara göre
değişiyor.
Hiç yorum yok:
Yorum Gönder