Perşembe, Mayıs 09, 2013

Semantik Arama: Bir Örnekleme


Önbilgiler: ‘Semantik arama’ deyince, sözcükleri morfemlerine göre değil de, anlamlarına göre arayabilmeyi anlıyoruz. Türkçe’de yakın anlamlı veya çağrışımlı sözlük yok. İngilizce’dekiler de oldukça sınırlı kapsamda. Artı, programların dilbilgisi altprogramları oldukça hatalı durumda.

Konuyu örnekleyelim: 8 Nisan - 8 Mayıs 2013 tarihleri arasında, Blogcu’daki bir sayfama gelinen taramada kullanılan anahtar sözcükler şunlarmış:

türkiyedeki sağ partiler        3
çıplak zenci erkekler             3
aristonun 10 temel                2
türkiye'deki sağ ve sol partiler           2
www.geylerin foto               2
nu erkek                                 1
aristo'nun 10 kategorisi       1
sanatçınin önemi̇                  1
geyler nu                               1
docs.google.com e-kitap     1
ülkemizdeki sağ partiler       1
nü foto                                   1
kasımpaşa çingene pazarı   1
sağ ve sol partiler                 1
türkiyede sağ partiler           1
çin aile yapısı                        1
turkiyede sag partiler           1
turkiyede sag sol partiler    1
yazisma tekst nedir              1
akp nin başarısızlıkları         1
lübnan trajedisi                     1
sağcı ve solcu partiler         1
türkiye'deki sağcı partiler    1
koninin hangi                        1
sağ sol partiler                      1
türki̇yede hangi̇ parti̇ler sağci                             1

Ön saptama: Bu aramaların bir öğrenci ödevi nedeniyle yapılmış olması büyük olasılık. Ancak bu durum aynı zamanda, konuyu arayan örnekleme kümesinin oldukça geniş, baştan tanımlı ve istatiksel açıdan anlamlı olmasını sağlıyor. Ayrıca, sınırlı da olsa bilgisel bir arayış sözkonusu.

Devam: Görüldüğü gibi aynı konu, 10 farklı biçimde aranabiliyor. Konunun bir bölümü bir biçimde çözülmüş durumda (gözlem sonucunda belirtiliyor) ama tamamı değil. Orayı geçip, çözümsüz olan duruma varalım:

Konuyla ilgili Türkçe’de 4 temel kitap var:

‘Türkiye’de Sağ Partiler’: Faik Bulut

‘Türkiye’de Sol Partiler’: Faik Bulut

‘Popüler Türk Solu Sözlüğü’: İnönü Alpat

‘Türk Sağı Sözlüğü’: Hüdavendigar Onur

(Duverger’in ve Berkes’in siyasi partiler tarihi ile ilgili kitapları var ama onlar 1900-1950 arası döneme ilişkin, aramacıların onlarla pek ilgilenmeyeceğini kabul edebiliriz. Bir de Türkiye’deki siyasal partilerin listesi her zaman tutulur ama onu güncellemek zor, çünkü ülkemizde yılda 3-5 tane yeni parti kuruluyor ve toplam sayı 100’ün üzerinde, yine de birkaç ay geriden gelse de tam liste var.)

Şimdi, ilk aramadan bu kitaplara nasıl varılabilir?:

Örneğin, ‘parti’ ile ‘popüler’ arasında bir anlam ilintisi kurmak gerekli. Ancak, ‘popüler’ ‘halk’ ile de ilintili. Eğer, ikisini de kurarsanız, bir semantik totolojik döngü oluşabilir.

Bunun yerine, 1.-5. derecede anlam yakınlığı listesi tercih edilebilir. Bunun da Google’sal göstermesi yapılabilir ama Google ticari bir kurum, bir Wikipedia değil.

Bu 1.-5. derecede anlam ilintilendirilmesinin her 5-10 yılda bir, değişik kültürel / eğitimsel / demografik fragmanlardaki insanlar için de taranması ve listelenmesi gerekli.

Devam: Zaten bu kitapların bilgisini internette bulunca, onları temin etmek gerek. İnternet kullanıcısı böyle bir derde katlanmıyor.

Varılan yer ne?: İnternetin konuyla ilgili bilginin yalnızca % 1-5’ini verebileceği gerçeği.

Bu, Wikipedia ve yakın tarihli konular için limit % 100 durumda. Türkçe Wikipedia ise feci durumda. Hem o sayfa, hem de Google Translate Türkçe için, bu işi yapabilecek çevirmenlerimiz ekmek paralarına kan doğrandığı için tavır koymuş gibiler.

Çıkarsama: Her kim yapacaksa, söz edilen anlamsal taramanın sonu bitmeyecek biçimde, yapılabilirse geçmişe ve eski sözcüklere de yönelik olarak, (sonuç çok para edeceği için) gerekirse genel aramaya kapalı olarak, sürekli olarak yapılması gerek. Birileri anket yapılmasına zaman ayırabildiğine göre, bu biçimde uygulama da bir yöntem olabilir.

En önemli vurgu:  Hakia gibi örneklerden biliyoruz ki yapılmış olanların hepsinin çöpe atılması gerekli ve Google tekeli orada heyula gibi duruyor, yani Google konunun en büyük engeli durumunda.

Dipnot: Bilgisayarımda, arama listesindeki ilk altı çizili ibare yazıldığında, ne Google’da, ne de Blogcu’da, benim sayfama gelinmiyor. Böylelikle buradan çıkan bir sonuç daha var: Döküm, aramanın yapıldığı bilgisayara göre değişiyor.

Hiç yorum yok: