Knowledge Discovery in Scientific Documents
Posted by admin on August 18th, 2006Penyaji : Dr. Igg Adiwijaya (AdvanTechnologies, Inc. & University of Maryland, USA)
Abstrak:
Pesatnya pengunaan dan adopsi Internet telah memacu pertumbuhan dan pertukaran informasi yang sangat pesat dibandingkan era sebelumnya. Sebagai akibatnya, jumlah informasi terus meningkat secara exponensial, lebih dari 550 triliun dokumen. Walau perkembangan ini memungkinan informasi untuk di akses penguna dengan mudah, jumlah yang terkendalikan ini telah menimbulkan isu and tantangan yang besar. Dilain pihak, situasi ini juga telah menghasilkan ’success story’ di bidang solusi dan tool untuk membantu penguna mencari dan mengorganisasi informasi dalam jumlah besar, mulai dari AltaVista sampai Google sekarang. Tidak hanya di Internet, jumlah informasi, terutama dalam bentuk dokumen atau text, juga di hasilkan, koleksi, dan konsumsi dalam jumlah yang tidak kalah besar di berbagai institusi dan perusahaan pada umumnya. Akses dan pengunaan akan informasi text yang tidak lagi di dominasi oleh ahli riset, spesialis analisa dan informasi, dan librarian seperti di era sebelumnya telah membuat tantangan menjadi lebih komplex. Pencarian dan konsumsi informasi text telah menjadi sesuatu yang umum untuk semua tipe pengguna dengan kepentingan yang berbeda.
Untuk e-Kolokium text mining ini, saya akan memberikan gambaran secara garis besar terhadap bidang text mining yang sedang berkembang. Didalamnya, saya akan diskusikan issue dan tantangan yang di hadapi di bidang text mining. Untuk setiap tantangan, saya akan presentasikan solusi-solusi yang telah di hasilkan oleh ahli-ahli riset di dunia dan kekurangannya. Bilamana tepat, akan saya berikan sedikit ulasan akan product komersial yang ada. Pada akhir makalah, saya akan ulas issue dan tantangan text mining yang saya hadapi sekarang, khususnya di bidang “knowledge discovery”.
Catatan : tema ini akan dipresentasikan di e-kolokium bersama komunitas datamining dan komunitas softcomputing Indonesia, pada tanggal 1-15 September 2006.
Pengantar Data Mining
Posted by admin on August 13th, 2006Penyaji : Iko Pramudiono (Nippon Telegraph & Telephone Co.)
Abstrak:
Data Mining (DM) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Definisi umum dari data mining itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data. Dalam tulisan ini, penulis mencoba memperkenalkan data mining dengan membandingkannya dengan bidang ilmu yang sudah ada, dan juga memberikan beberapa ilustrasi tentang teknik-teknik yang umum dipakai di data mining.
Catatan : tema ini dipresentasikan di e-kolokium bersama komunitas datamining dan komunitas softcomputing Indonesia, pada tanggal 18-31 Agustus 2006.
Joint e-kolokium Datamining & Text-mining (16 Agustus - 15 September 2006)
Posted by admin on August 13th, 2006Kemajuan di bidang ilmu pengetahuan dan teknologi mendorong pertumbuhan data di dunia. Berbagai fenomena alam semakin mudah diobservasi dan didokumentasikan. Keberadaan data sebagai nyawa dari tumbuh dan berkembangnya teknologi menjadi sangat mudah diperoleh. Apalagi perkembangan teknologi hardware dan software yang semakin pesat dan semakin murah, membuat proses dokumentasi menjadi semakin mudah. Faktor-faktor ini yang akhirnya menyebabkan terjadinya ledakan data di berbagai bidang. Misalnya kalau di biologi, pertumbuhan pesat data genome dapat dilihat di situs genbank (http://www.ncbi.nih.gov/Genbank/genbankstats.html ) Sedangkan informasi yang berupa teks, pertumbuhannya tidak kalah pesat. Di situs Medline, jumlah abstrak yang didokumentasikan tahun 2003 dilaporkan sekitar 12 juta. Kalau satu abstrak terdiri dari 200 kata, maka sekitar 2.4 milyar kata terekam di Medline.
Kendali Cerdas: Definisi, Prinsip Teknologi dan Arah Pengembangannya
Posted by admin on August 1st, 2006Penyaji: Son Kuswadi (dosen Politeknik Elektronika Negeri Surabaya, PENS ITS).
Abstrak:
Istilah kendali cerdas sering muncul dalam pembicaraan baik dalam forum ilmiah maupun dagang dalam berbagai konteks dan penafsiran, yang sering kali tidak berdasar. Untuk mengurangi kesalahpahaman tersebut, maka dalam makalah ini akan dibahas tentang definisi kendali cerdas menurut para pakar beserta prinsip-prinsip teknologi yang digunakan. Beberapa contoh aplikasi nyata akan dipaparkan, termasuk robot ruang angkasa. Makalah ini akan ditutup dengan beberapa petunjuk (hint) tentang arah pengembangan teknologi kendali cerdas, baik yang berada di depan mata mau pun yang bersifat futuristik.
Kata Kunci:
Sistem Kendali, Kecerdasan, Sains-Kognitif, Pembelajaran, Kompleksitas
Pemodelan hidrolika sistem akuakultur terkendali
Posted by admin on July 19th, 2006Penyaji : Rudiyanto (Program Studi Ilmu Keteknikan Pertanian IPB)
Latar Belakang
Kebutuhan protein asal ikan. mendorong kegiatan akuakultur terutama pada sektor pembenihan/hatchery. kegiatan ini membutuhkan banyak air. Untuk ikan patin 1~2 hari air harus diganti. biaya produksi akan meningkat. maka pada penelitian ini dicoba aplikasi sistem resirkulasi akuakultur terkendali (SRAT), dimana kesegaran air dipertahankan
dengan perlakukan tertentu melalui resirkulasi. Pada penelitian ini dibahas pengendalian level air untuk melindungi pompa dari kerusakan; pompa yang digunakan jenis celup.
Metodologi
Pemodelan berdasarkan water balance dan hukum Bernoulli. Akusisi data level air dengan PC yang dilengkapi interface, dan pressure tranducer sebagai sensor. Smoothing data dengan filter Kalman. Simulasi pengendalian dilakukan dengan ANN yang mempunyai 2 input berupa error dan perubahan error dan output menambah mengurangi debit pompa. time domain spesefication untuk analisis kendali ANN. Software simulator ditulis dalam bahasa pemrograman Borland Delphi 5.
Hasil dan Kesimulan
Filter Kalman dapat bekerja dengan baik mengikuti trend data. Verifikasi menununjukkan model cukup handal dan masih perlu dilakukan optimisasi parameter head loss pada model.
Dari ketiga skenario, kendali ANN mampu mengendalikan debit pompa dengan baik.
Hasil away survey pasca gempa Jogja-Jateng
Posted by admin on July 3rd, 2006Colloquium disajikan oleh Irwan Meilano (JSPS Postdoctoral Fellow Nagoya University, on leave from Faculty of Civil Eng. and Environment Insitute of Technology Bandung, Indonesia)
Resume
Pada tanggal 3 Juni atau seminggu sesudah bencana Gempa Jogja-Jateng, tim peneliti kegempabumian yang terdiri dari: Nagoya Univ, ITB, UGM dan Ristek melakukan survey pasca bencana. Lamanya waktu pengamatan yaitu 5 hari, dengan 11 peneliti dan dibantu 23 mahasiswa. Kami melakukan pengamatan GPS sebanyak 48 titik, dan memasang 6 buah seismometer serta mengunjungi 631 lokasi untuk menyelidik kerusakan bangunan.
Target dari penelitian kami yaitu :
- assessment of damage and casualties.
- search for an evidence of surface rupture associated with the earthquake
- aftershock observation for determining the configuration of the main-shock fault
- GPS observation of coseismic crustal deformation
Beberapa hasil awal survey
A. Survey Kerusakan
- Tidak ditemukannya bukti surface fault rupture. Beberapa rekahan yang banyak ditemukan di sebelah timur Bantul merupakan hasil dari ground motion.
- Terdapat tiga wilayah dengan kerusakan maksimum yaitu di sekitar: Kec. Banguntapan dan Kec. Bambanglipuro Kab bantul, serta Kec. Wedi Kab. Klaten.
B. Pengamatan GPS
- Pergeseran horizontal akibat gempabumi di Kota Bantul yaitu sekitar 7cm dan di sebelah timur Kota Jogja sekitar 8 Cm dengan arah Barat-laut (South-west).
- Tidak ditemukan pergeseran horizontal yang signifikan di Kota Klaten.
- Pola pergeseran horizontal menunjukan bahwa gempabumi Jogja-Jatengdihasilkan oleh pergerakan sesar dengan arah left-lateral.
C. Pengamatan Kegempaan
- Selama tiga hari pengamatan satu minggu sesudah gempa utama berhasil dideteksi sebanyak 245 gempa susulan.
- Magnitude rata-rata dari gempa susulan yaitu 2.2 . Gempa dengan magnitude terbesar yaitu 5.1, pada tanggal 8 Juni 2006 jam 11:45.
- Kedalaman dari gempa susulan yaitu 2 -15 km.
- Pola distrubusi susulan mengidentifikasikan bahwa wilayah kegempaan terkonsentrasi pada wilayah dengan panjang 20 km dan lebar 5 km, dengan azimuth 50 derajat dari utara ke timur.
Kesimpulan dari survey awal pasca-gempa Jogja-Jateng
- Pengamatan GPS serta kegempaan mengindentifikasikan bahwa geometri dari sumber gempa Jogja-Jateng yaitu: sesar left-lateral dengan panjang 20 km, lebar 10 km. Dan sesar ini tidak mencapai Klaten.
- Ground observation menunjukan bahwa sesar penyebab gempa cukup dangkal tetapi tidak mencapai kepermukaan. Kedalaman maksimum diperkirakan sekitar 2km.
- Besarnya kerusakan dan efek dari gempa disebabkan oleh :
- Bangunan di sekitar Jogja-Jateng tidak dipersiapkan untuk menghadapi gempa. Hal ini disebabkan karena kegempaan disekitar Jogja-Jateng sangat rendah dalam kurun 150 thn terakhir.
- Sedimen tebal hasil letusan gunung merapi yang membentuk kota Bantul, Jogja dan Klaten (Kota klaten dulunya adalah rawa), mengamplifikasi gelombang gempa sehingga efeknya sangat luar biasa.
- Kerusakan di Kota Klaten selain oleh amplikasi gelombang gempa juga oleh efek direktifitas dari gempa. Inisialisasi gempa yaitu disekitar kota Bantul, dan arah dari rupture (rupture direction) yaitu timur-laut (NE).
Informasi lainnya mengenai hasil survey kami bisa dilihat di:
http://www.seis.nagoya-u.ac.jp/~irwan/jogjaeq/jogjaeq.html
Metrologi dan Akustik
Posted by admin on June 22nd, 2006Colloquium disajikan oleh Denny Hermawanto, Lembaga Ilmu Pengetahuan Indonesia
Resume
Metrologi adalah ilmu mengenai pengukuran. Ada 3 hal utama yang menjadi fokus metrologi yaitu penetapan definisi satuan ukur, perwujudan satuan ukur dan penetapan rantai ketertelusuran. Dalam ilmu metrologi dikenal mengenai ketidakpastian yaitu ukuran kuantitatif mutu dari sebuah hasil pengukuran, sehingga hasil pengukuran tersebut dapat diperbandingkan dengan hasil- hasil pengukuran lain, acuan, spesifikasi atau standar karena setiap semua pengukuran cenderung mengandung kesalahan. Akustik metrologi adalah salah satu bidang metrologi yang mengkhususkan pada pengukuran suara, khususnya alat ukur akustik. Microphone dan sound level meter adalah alat ukur utama dalam bidang akustik yang perlu dijamin bahwa hasil pengukurannya sesuai dengan nilai yang sebenarnya. Untuk menjamin kebenaran besaran yang terukur maka alat ukur akustik seperti microphone dan sound level meter tersebut perlu dikalibrasi. Hasil pengukuran akustik yang benar akan berpengaruh pada kebenaran hasil analisa dan merupakan jaminan kepercayaan terhadap sebuah kebijakan.
Non-Linear Classification Using Ensemble of Linear Perceptrons
Posted by admin on June 8th, 2006Colloquium disajikan oleh Pitoyo Hartono, Future University-Hakodate, Hakodate City, Japan
Resume
Recently, several models of neural networks ensemble have been proposed, generally with the objective of achieving a higher generalization performance compared to the singular neural network. Some of the ensembles, represented by Boosting and Mixture of Experts, proposed mechanisms to divide the learning space into a number of sub-spaces and assign each sub-space into one of the ensemble's member, hence the learningload of each member can be relaxed, leading to better convergence and performance. In this paper, an ensemble of linear perceptron (ELP) with an algorithm that effectively divides the learning space in a linear manner, and assign the classification task of each sub-space to a linear perceptron, is proposed. The objective of this algorithm is to achieve a linear decomposition of a nonlinear problem through an automatic divide and conquer approach. In ELP, in addition to the ordinary output neurons, each linear perceptron has an additional neuron in its output layer. The additional neuron is called confident neuron, and produces an output that indicates the gconfidence levelh of the perceptron with regard to its ordinary output. An output of the perceptron which has a high confidence level can be considered as a reliable output, while an output with low confidence level is an unreliable one. The proposed ELP is equipped with a competitive mechanism for learning space division based on the confidence levels and at the same time to train each member to perform in the assigned sub learning space. The linearity of each member also enables us to analyze the division of the problem space that can be useful in understanding the structure of the problems and also to analyze the overall performance of the ensemble.
Pengembangan sistem prediktor efektifitas terapi interferon bagi pasien Hepatitis C kronis
Posted by admin on June 8th, 2006Colloquium disajikan oleh Anto Satriyo Nugroho, PTIK-BPPT & Chukyo University, Japan
Resume
Di journal Science tahun 1989, Chiron Co. melaporkan penemuan virus yang deretgenome-nya berlainan dengan virus hepatitis A dan hepatitis B. Virus itu kemudian disebut Hepatitis C. Hepatitis C dewasa ini merupakan satu penyakit penting di dunia, yang menyerang sekitar 170 juta orang (tahun 2005). Adapun di Jepang, pada tiap 100 orang diperkirakan penderita Hepatitis C kronis berkisar antara 1 sampai 2 orang. Tingginya rasio ini menyebabkan Hepatitis C sering disebut "kokuminbyou" (penyakit rakyat) di abad 21. Hepatitis C kronis disebabkan oleh terkontaminasinya peredaran darah dengan virus,sehingga terjadi inflamasi pada lever selama lebih dari 6 bulan. Akibatnya terjadi kerusakan sel, yang menyebabkan fungsi lever menjadi tidak normal. Dari data statistik, diperkirakan jika tidak dilakukan terapi terhadap penderita hepatitis C, dari 200 orang pasien hanya 1 orang saja yang mungkin bisa sembuh (0.5%). Salah satu metode pengobatan hepatitis C adalah memakai Interferon (IFN). Interferonberfungsi untuk menghambat pertumbuhan virus hepatitis C. Diperkirakan pemakaian interferon dapat meningkatkan angka kesembuhan hingga 30%. Tetapi, di sisi lain,pemakaian interferon ini diikuti oleh efek samping yang memberatkan pasien. Efek samping tsb. antara lain : Flu-like syndrome, menurunnya sel darah putih (leucocyte),rambut rontok (IFN-alpha), albuminuria (IFN-beta), dsb.
Berhasil tidaknya terapi interferon ini baru diketahui 6 bulan kemudian, dengan caramelakukan pemeriksaan HCV-RNA pasien. Bila hasilnya negatif, berarti terapi itu efektif. Tapi bila ternyata kadar HCV-RNA pasien tidak turun, berarti interferon itu tidak efektif.
Mengingat beratnya resiko efek samping yang ditimbulkan, sebaiknya terapi interferon ini tidak dilakukan kepada pasien yang hasil terapinya diperkirakan tidak berhasil. Kepada mereka lebih baik diberikan terapi selain interferon, yang memiliki potensi keberhasilan lebih tinggi. Hal ini menunjukkan perlunya suatu sistem cerdas yang mampumemperkirakan efektif tidaknya interferon, sebelum terapi dijalankan.
Paper ini membahas prediksi efektifitas terapi interferon pada pasien memakai Support Vector Machine (SVM). Tujuan dari sistem ini adalah membantu tugas dokter untuk memilih terapi yang tepat bagi pasien. Jika ternyata hasil prediksi menunjukkan interferon tidakefektif, dokter dapat memberikan terapi lain yang mungkin lebih sesuai bagi pasien.
Informasi yang diolah oleh SVM berasal dari hasil diagnosa darah pasien dan faktor lain,yaitu : Hepatobiopsy, HCV-RNA, HCV gene-type dsb. (lihat Tab.I). Total sebanyak 30 faktor yang diamati. Tentunya tidak semua informasi ini bermanfaat bagi prediksi.Untuk itu pada tahap preprocessing, dilakukan pemilihan feature (Feature Subset Selection disingkat FSS), berdasarkan Fisher Criterion Score. Data yang diolah berasal dari pasien yang berobat ke Nagoya University Hospital, dari tahun 1997-2004. Dari sekitar 300 sampel, akhirnya diperoleh 112 sampel data yang cukup layak untuk dianalisa. Mengingat keterbatasan data yang ada, estimasi performa SVM dilakukan dengan leave-one-out cross validation. Score terbaik yang diperoleh oleh SVM adalah 84%, sedangkan k-Nearest Neighbour Classifier81%, dimana dimensi data direduksi hingga 5. Kalau ke-30 feature dipakai seluruhnya, score SVM 78% sedangkan k-Nearest Neighbour Classifier 71%. Hal ini menunjukkan bahwapemakaian FSS pada k-Nearest Neighbour memberikan recognition rate peningkatan sebesar 10%, sedangkan SVM sebesar 6%. Hal ini menunjukkan bahwa SVM relatif lebih robust terhadapkeberadaan feature yang tidak relevan (noise) dibandingkan k-Nearest Neighbour. Lima buah feature yang terpilih untuk tiap fold (pada eksperimen ini karena memakai leave-one out CV, berarti ada 112 fold) diperiksa, dan diurutkan berdasarkan ranking mereka. Hasil analisa menunjukkan bahwa HCV-RNA, Hepatobiopsy, dan HCV-gene type menempati posisi teratas. Hal ini sesuai dengan pendapat dari praktisi medis, bahwa ketiga faktor ini telah diketahui memiliki kaitan erat dengan Hepatitis C. Pemakaian ribavirin sebenarnya diharapkan terpilih sebagai feature yang penting, tetapi ternyata hanya menempati urutan ke 17. Hal ini dikarenakan pada data eksperimen yang terbatas ini, ribavirin tidak memberikan kontribusi yang signifikanuntuk diskriminasi kedua buah kelas. Dengan memakai database yang lebih besar, diharapkan faktor-faktor penting yang dapat dipakai untuk memprediksi efektifitas terapi inteferon dapat diidentifikasikan lebih baik.
Referensi :
A.S. Nugroho, J. Yang, S. Kuroyanagi, A. Iwata and K. Yamauchi: Prediction of interferon efficacy in chronic Hepatitis C treatment using Support Vector Machine, Trans. of the Japanese Society for Medical and Biological Engineering, Vol.11, Suppl.1, pp.594, 2006 (The 45th Annual Conference of Japanese Society for Medical and Biological Engineering, May 2006)
F-SONIA for Three-Mixture-Fragrance Recognition
Posted by admin on May 1st, 2006Colloquium disajikan oleh Muhammad Rahmat Widyanto, Universitas Indonesia
Resume
A fuzzy-similarity-based self-organized network inspired by immune algorithm (F-SONIA) is proposed inorder to develop an artificialodor discriminationsystem for three-mixture-fragrance recognition. It can deal with an uncertainty in frequency measurements, which is inherent in odor acquisition devices, by employing a fuzzy similarity. Mathematical analysis shows that the use of the fuzzy similarity results on a ahigher dissimilarity between fragrance classes, therefore, the recognition accuracy is improved and the learning time is reduced. Experiments show that F-SONIA improves recognition accuracy of SONIA by 3%-9% and the previously developed artificial odor discrimination system by 14%-25%. In addition, the learning time of F-SONIA is three times faster than that of SONIA.
Referensi
Muhammad Rahmat Widyanto, Benyamin Kusumoputro, Hajime Nobuhara, Kazuhiko Kawamoto, and Kaoru Hirota, "A Fuzzy-Similarity-Based Self-Organized Network Inspired by Immune Algorithm for Three-Mixture-Fragrance Recognition", IEEE Trans. on Industrial Electronics, Vol.53, No.1, February 2006