RSS

Bilim 2.0: Bilimsel Keşif Yapmak İstatistiksel Bir Modeldeki Parametreleri Tespit Etmekten Mi İbarettir?

05 Jan

Augmented Social Cognition blogundaki ‘Cloud Computing, Science2.0, and the Social Web‘ başlıklı yazı ve özellikle de aşağıdaki kısmı dikkatimi çekti.

Jim Gray’s fourth paradigm is rooted in his belief that data is at the heart of science — essentially a kind of fundamental ‘empiricism’. This kind of empiricism certainly has been at the heart of social experiments in Web2.0 applications. This viewpoint was argued by Shneiderman in the recent Science journal as being a kind of ‘Science2.0′. The label ’2.0′ certainly has some relation to Web 2.0 and cloud computing in that the same computational techniques being invented to handle social analytics and cloud computing are needed to do this new kind of empirical science.

The big bet is that big data sets will enable bigger science to be done (if you believe that all science derives fundamentally from observations.) I do worry that this viewpoint places too much faith is placed in blackbox science (i.e. input large data set into database, apply MapReduce or other parallelized machine-learning techniques, and then wham! Patterns emerge!) This seems to place too much faith on machine learning to do much of the heavy lifting. True scientific model building isn’t just finding some parameters on some statistical algorithm. Science has more creativity than that.

Yazıda bahsi geçen ve Ben Shneiderman tarafından yazılmış ‘Science 2.0 (Ben Shneiderman, “Traditional scientific methods need to be expanded to deal with complex issues that arise as social systems meet technological innovation”)’ başlıklı makalenin PDF olarak tam metnine şuradan erişilebilir: http://www.cs.umd.edu/~ben/Science%202%200-AAAS-3-7-2008.pdf

Blogdaki eleştiri zaman zaman yapay sinir ağları ve SVM (support vector machine) gibi makine öğrenme yöntemleri için dile getiriliyor ancak bu durumda makine öğrenme denen şeyin sadece istatistiksel öğrenme yöntemlerinden ibaret olmadığını, açık ilişkiler ve ilişkisel yapılar tespit etmeye yönelik ‘inductive logic programming’ ve ‘statistical relational learning’ gibi yöntemlerin de varlığını ve üzerlerinde epey çalışıldığını, bazı alanlarda meyvelerini vermeye başladıklarını hatırlamak gerekmez mi?

About these ads
 
2 Comments

Posted by on January 5, 2009 in Science

 

2 responses to “Bilim 2.0: Bilimsel Keşif Yapmak İstatistiksel Bir Modeldeki Parametreleri Tespit Etmekten Mi İbarettir?

  1. shadow

    January 8, 2009 at 15:22

    Konuya uzaktan alakalı fakat meraklı biri olarak (belkide yanlış düşünüyorum ve daha fazla kafa patlatmam gerek) aslında aynı noktaya çıkmıyor muyuz…

    istatiksel öğrenme yöntemleri aslında bizlerin bir düşünce yapısı kurmak için makinalara kullandırmak istediğimiz bir yol.

    Çok doğal bir sonuç bu. çünkü bizde yazıda da geçtiği gibi çoğunlukla sonuca ulaşmak adına bu yöntemi kullanıyoruz.

    Statistical relational learning isminin çağrıştırması bir yana temel de yine istatistiğe dayanmakta, inductive logic programming (ILP) ise keza bana göre yine “temel bilgiye” ihtiyac duyduğundan aynı kategori altına köşesinden girebilir… Bu bilginin nereden geldiğine bağlı olarak yine istatikseldir diyemez miyiz?

    Sesli (daha doğrusu şimdi yazılı bir düşünce silsilesi) olarak aklımdan geçti bunlar…

    yazı çok ilginç, paylaşım için tsk..

     
  2. Emre Sevinc

    January 8, 2009 at 15:33

    > inductive logic programming (ILP) ise keza
    > bana göre yine ?temel bilgiye? ihtiyac
    > duyduğundan aynı kategori altına
    > köşesinden girebilir? Bu bilginin nereden
    > geldiğine bağlı olarak yine istatikseldir
    > diyemez miyiz?

    İstatistiksel yöntem derken kast ettiğim bir olasılık modelindeki parametrelerin belirlenmesi (misal EM yani Expectation Maximization yöntemi ile). Klasik ‘inductive logic programming’de görebildiğim kadarı ile böyle bir şey yok.

    Ancak son yıllarda gittikçe daha çok araştırılmaya başlanan ‘probabilistic inductive logic programming’ her iki dünyanın (istatistiksel öğrenme ve mantıksal öğrenme) avantajlarını sentezlemeye çalışıyor gördüğüm kadarı ile. Dolayısı ile bu yöntemle edinilen bilgilere istatistikseldir diyebiliriz diye düşünüyorum.

     

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
Follow

Get every new post delivered to your Inbox.

Join 53 other followers

%d bloggers like this: