Rabu, 05 Oktober 2011

Resume Visualisasi Informasi pertemuan 4

Nama : Fretie Dwirory
NIM  : 10410100174

* Tujuan dari visualisasi data adalah bagaimana dapat mengelola data dalam jumlah yang besar ini dan  bagaimana sistem komputer membantu kita dalam tugas mengelola data yang besar.
Contohnya  :
·         Visual Data membantu menangani banjir informasi dengan cara mengintegrasikan manusia dalam proses analisis data.
·         Visual Data memungkinkan pengguna untuk mendapatkan wawasan yang dalam tentang data, kesimpulan dari data gambar dan langsung berinteraksi dengan data.

*Manfaat dari teknik Visualisasi :
-          untuk analisis kuantitatif lebih lanjut.
            -      Memberikan perspektif baru pada data.
-      Memungkinkan viewer untuk cepat memahami "gambaran umum“.
-      untuk mencari nilai yang hilang di antara beberapa titik data yang telah diketahui.
-      Dapat dibuat "user friendly“ .
-      Mudah untuk menemukan kesalahan dalam inkonsistensi data dalam jumlah besar.

*Ada dua bentuk data :
1.       Data Nilai.
2.       Struktur Data.

*ENTITAS :
Sebuah objek yang ingin divisualisasikan / objek yang menarik .

*RELATIONSHIPS :
                Relationships membentuk struktur dari entitas relationship.

*ATTRIBUT :
                Properti dari entitas atau relationship yang tidak dapat berdiri secara independen .

*Kualitas dari Atribut :
-          digunakan untuk menggambarkan metode visualisasi data dengan dan menerangkan kualitas attribut itu sendiri.
-          Sebuah cara yang berguna untuk mempertimbangkan kualitas data adalah taksonomi.

*Ada 4 tingkat pengukuran Kualitas Atribut :
·         Nominal adalah Fungsi pelebelan.
Contoh  : buah dapat diklasifikasikan dalam jambu, jeruk dll
·         Ordinal  kategori meliputi nomor yang digunakan mengorder hal-hal dalam urutan.
Contoh  : barang tertentu datang sebelum atau sesudah barang lain datang.
·         Interval adalah suatu pengukuran untuk mendapatkan kesenjangan nilai antar data.
Contoh  : Waktu keberangkatan dan waktu kedatangan kereta kelinci.
·         Skala Ratio : dengan skala rasio, kita memiliki kekuatan ekspresif penuh terhadap bilangan real.
Contoh  : kita bisa membuat pernyataan seperti “Objek A dua kali lebih besar dari pada objek B”.

*Kualitas Data :
                faktor yang paling penting untuk mempengaruhi kualitas hasil dari analisis apapun. 
-          Data harus dapat diandalkan dan mewakili dari populasi. 
-          Data sering dikumpulkan untuk menjawab pertanyaan spesifik .

*Sumber dari data :
·         Survey
·         Eksperiment
·         Observasi
Sebagai bagian dari operasi harian suatu organisasi, data merupakan kumpulan dari alasan varietas.

*Database Operasional  
                Database ini berisi transaksi bisnis yang sedang berlangsung. Database jenis ini diakses terus menerus dan diperbarui secara teratur.

*Data Warehouse
Sebuah gudang data adalah salinan dari data yang dikumpulkan dari yang lain sumber dalam suatu organisasi yang telah dibersihkan, normalisasi dan dioptimalkan untuk membuat keputusan, database jenis ini diperbarui tetapi tidak sesering database operasional.

*Historical Databases
Database yang sering digunakan untuk survey dan eksperimen.

*Continuous and Discrete Variables
Sebuah kategorisasi awal yang berguna untuk mendefinisikan setiap variabel yang dapat diambil dalam hal ini adalah jenis nilai, berikut ini adalah daftar istilah deskriptif untuk kategori variabel:
·         Konstan : sebuah variabel dimana setiap nilai data adalah sama.
·         Dikotomis : sebuah variabel di mana hanya ada dua nilai.
·         Diskrit : variabel yang hanya dapat mengambil nilai-nilai tertentu (baik teks atau angka).
·         Kontinu :  sebuah variabel yang memiliki nilai numerik yang tak terbatas dalam kisaran tertentu.

*Scales of Measurement
Skala variabel menunjukkan akurasi di mana data telah diukur.  Klasifikasi ini memiliki implikasi untuk jenis analisis yang dapat dilakukan terhadap variabel tersebut.

*Roles in Analysis
Hal ini juga berguna untuk berpikir tentang bagaimana variabel akan digunakan dalam analisis berikutnya. Contoh peran dalam analisis data :
·         Label  variabel yang menjelaskan pengamatan individu dalam data.
·         Deskriptor  : variabel ini hampir selalu dikumpulkan untuk mengambarkan suatu observasi .
·         Respon :  variabel ini yang diprediksi dari model prediktif .

*Distribusi Frekuensi
Distribusi frekuensi didasarkan pada jumlah nilai atau rentang nilai (dalam hal skala interval atau rasio).

*3 Analisis Data Preparation :
1.       Cleaning the Data
Hal ini bermanfaat untuk memahami akurasi data yang dikumpulkan serta mengoreksi   kesalahan apapun.
2.       Removing Variables
Korelasi antara beberapa variabel dapat mengidentifikasi variabel-variabel yang tidak memberikan informasi tambahan untuk analisis dapat dihilangkanya dapat dihilangkan.
3.       Data Transformations
Data transformation penting untuk mempertimbangkan penerapan transformasi matematis tertentu untuk data, karena banyak data analisis akan mengalamai kesulitan untuk memahami data dalam bentuk baku.


*Normalisasi adalah proses dimana kolom numerik ditransformasi menggunakan fungsi matematika
  untuk membuat rentang data baru .
Hal ini penting karena 2 alasan :
1.       analisis data harus memperlakukan semua variabel sama sehingga satu kolom
tidak memiliki pengaruh yang lebih atas yang lain karena rentang yang berbeda.
2.       analisis data memerlukan data yang akan dinormalisasi sebelum analisis, seperti jaringan saraf tiruan.

*Value Mapping : untuk menggunakan variabel yang telah ditugaskan sebagai ordinal dan digambarkan dengan menggunakan nilai-nilai teks dalam metode analisis numerik tertentu, maka diperlukan cara untuk mengubah nilai-nilai variabel menjadi angka.

*Discretization : diinginkan untuk mengkonversi data menjadi lebih luas

*Aggregation : variabel yang mungkin tidak ada dalam pengumpulan data, tapi mungkin diturunkan dari variabel lain yang hadir.

*Segmentation : segmentasi data dapat mempercepat analisis apapun. Salah satu pendekatan adalah untuk mengambil subset acak.

Tidak ada komentar:

Posting Komentar