thinking .... loved it: (Belajar) Literature Review

Belajar melakukan jurnal review, dengan catatan :

- kadang cukup susah mencari metode penelitian yang digunakan dalam jurnal tersebut

- dalam beberapa jurnal ada yang menyebut metode,algoritma, apalagi ya lupa, dari 3 point tersebut seharusnya yang ditulis dalam jurnal review yang mana agar informasinya cukup signifikan jika dibaca orang.

Peneliti

Tahun

Judul

Metode Penelitian

Hasil Penelitian

Edi Surya Negara, Ria Andryani, Prihambodo Hendro Saksono

2016

Analisis Data Twitter : Ekstraksi dan Analisis Data Geospasial.

a. Penarikan data Twitter (Crawling Twitter data).

b. Penyimpanan data Twitter (Storing Twitter

data).

c. Analisis data Twitter (Analiyzing Twitter data).

d. Visualisasi data Twitter (Visualizing Twitter

data).

Dari penelitian yang dilakukan terhadap Twitter Data Analytics, dapat disimpulkan bahwa :

Proses crawling terhadap data twitter engan memanfaatkan Application Programming Interface telah berhasil dilakukan dan menghasilkan data

yang informatif melalui proses Crawling, Storing, Analyzing dan Visualizing.

b .

Berdasarkan data yang telah ditarik tersebut dapat diketahui negara asal pengguna twitter, informasi berdasarkan geospasial, jenis kelamin pengguna twitter, rentang usia pengguna twitter, dan penempatan data berdasarkan tweet yang telah di unggah.

Eka Sabna, Muhardi

2016

Penerapan Data Mining Untuk Memprediksi Prestasi Akademik

Mahasiswa Berdasarkan Dosen, Motivasi, Kedisiplinan, Ekonomi,

dan Hasil Belajar

Algoritma Decision Tree

Memprediksi prestasi akademik berdasarkan sosial ekonomi, motivasi, peran dosen, disiplin dan hasil belajar masa lalu diperoleh hasil :

(1) variabel hasil belajar masa lalu adalah variabel yang menentukan potensi seseorang berhasil atau tidak dalam prestasi akademik. Hal ini dibuktikan bahwa Hasil Belajar menjadi node yang terpilih/awal.

(2) Variabel Peran Dosen menjadi variabel kedua menentukan Prestasi akademik

(3). Variabel Disiplin menjadi variabel ketiga menentukan Prestasi Akademik .

(4) Hasil Akurasi klasifikasi menggunakan metode Area Under Curve (AUC) memperoleh nilai 65%.

Luke Sloan, Curtis Jessop , Tarek Al Baghal , dan Matthew Williams

2019

Linking Survey and Twitter Data: Informed, Consent, Disclosure, Security, and Archiving.

Data Flow Diagram

Diterjemahkan :

Data survei dan Twitter yang ditautkan memberikan peluang yang belum pernah ada sebelumnya untuk analisis ilmiah sosial, tetapi kemampuan kami untuk mengumpulkan dan menyusun data berisiko melampaui pemahaman teknis kami tentang bagaimana data Twitter disusun dan implikasi etis dari penggunaannya. Meskipun akses mudah ke data melalui pengembangan alat yang ramah pengguna telah meningkatkan penggunaan data Twitter di kalangan ilmuwan sosial, hal ini menimbulkan kerugian. Antarmuka grafis sederhana mempercayai kerumitan data dan sering kali memberikan sedikit petunjuk tentang sejauh mana data tersebut

sebenarnya diunduh dengan hanya menampilkan variabel yang terbatas. Masalah ini diperparah oleh kesalahpahaman oleh banyak peneliti yang, sepenuhnya dapat dimaklumi, tidak menyadari apa yang terjadi di balik layar. Sangat nyata

Artinya, sedikit pengetahuan (mengetahui cara mengakses data) adalah hal yang berbahaya. Artikel ini berfokus pada tantangan khusus untuk proyek data terkait dan Tabel 3 memberikan ringkasan tanggapan untuk pertanyaan penelitian (apa implikasi operasional dan praktis untuk melakukan penelitian etis dengan Twitter dan data survei yang ditautkan?), tetapi tentu saja bahkan proyek yang hanya berfokus pada data Twitter mungkin memiliki alasan yang baik untuk mengikuti prinsip anonimitas dan mengamati praktik keamanan data standar (Williams et al., 2017).

Bahkan dengan pengetahuan penuh tentang beragam data yang disediakan dari Twitter, perubahan dalam persyaratan hukum, seperti pengenalan GDPR baru-baru ini, dapat mengubah apa yang dapat dan tidak dapat diterima dan bahkan jika konteks peraturan relatif stabil, platform media sosial dapat ( dan lakukan) mengubah sifat data yang disediakan melalui API, Persyaratan Layanan untuk pengguna, dan ketentuan yang tercantum dalam perjanjian pengembang.

Terlepas dari semua ini, prinsip dasar melakukan penelitian sosial etis tetap sama inovasi teknologi dan perubahan sosial. Memang, prinsip-prinsip yang ditetapkan dalam Laporan Belmont (1979) masih berlaku benar: menghormati orang (menghormati otonomi dengan memastikan persetujuan yang diinformasikan), kebaikan (menghindari kerugian melalui menghindari pengungkapan dan mengamati praktik data yang aman), dan keadilan (mendemokratisasi akses melalui pengarsipan data). Dalam mode tradisional penelitian sosial, prinsip-prinsip ini hanya dapat diamati secara kredibel oleh para peneliti dengan pemahaman tentang sifat data yang dikumpulkan, dan situasinya tidak berbeda untuk data Twitter.

Hwalbin Kim , S. Mo Jang , Sei-Hill Kim , dan Anan Wan

2018

Evaluating Sampling Methods for Content Analysis of Twitter Data.

Method are :

- data source

- coding procedure

- evaluation procedure

Diterjemahkan :

Studi sebelumnya menunjukkan bahwa satu atau dua dibangun minggu diperlukan untuk mewakili 6 bulan koran berita dan konten berita online secara memadai (Hester & Dougall, 2007; Riffe et al., 1993). Temuan kami, di sisi lain, menunjukkan bahwa setidaknya dibutuhkan 7 atau 8 minggu (atau sekitar 33% atau 38%) untuk mewakili konten Twitter selama 21 minggu. Hester dan Dougall (2007) telah mencatat bahwa jika CV lebih tinggi dari 0,5, aukuran sampel yang lebih besar dibutuhkan. Sebagian besar CV untuk variabel kami menunjukkan tingkat yang lebih tinggi dari 0,5, menunjukkan bahwa CV mereka variasinya jauh lebih besar daripada media tradisional data. Ini karena pada dasarnya, konten media sosial menunjukkan fluktuasi yang signifikan. Oleh karena itu perlu dihasilkan suatu file ukuran sampel yang cukup saat menganalisis konten media sosial.

Kesalahan kueri terjadi ketika peneliti menentukan kumpulan kata kunci untuk mengambil konten media tentang topik tertentu atau peristiwa atau untuk membuat set data pelatihan yang kuat atau kamus untuk teknik pembelajaran mesin. Namun, dalam praktiknya, memilih kata kunci sering kali bergantung pada keputusan subjektif oleh para peneliti dengan sedikit panduan metodologis. Untuk Misalnya, tweet yang tidak terkait dapat dimasukkan (seperti Tipe I kesalahan) dan tweet yang relevan mungkin dikecualikan (seperti Tipe II

kesalahan) dalam proses memilih istilah penelusuran yang digunakan dalam antrean (Jang & Park, 2017; Stryker, Wray, Hornik, & Yanovitzky, 2006). Begitu pula dengan Schober, Pasek, Guggenheim, Lampe, dan Conrad (2016) juga menunjukkan bahwa menganalisis liputan topikal dari data media sosial mungkin gagal untuk mencerminkan fitur dari seluruh populasi. Selain itu, analisis komputasi belum mendemonstrasikan kekuatannya dalam menangkap makna yang bernuansa, seperti sarkasme dan humor, hadir dalam teks yang dianalisis.

Temuan saat ini memberikan alat yang berguna untuk mengembangkan algoritme dan kumpulan data pelatihan untuk menganalisis dan mengekstraksi makna kompleks dari sosial skala besar data media. Secara khusus, studi ini menawarkan garis panduan tentatif untuk menentukan elemen kunci dalam proses pengambilan sampel pengkodean manusia, termasuk jumlah konten, pengambilan sampel metode, dan unit analisis.

Muhammd Jawad Hamid Mughal

2018

Data Mining: Web Data Mining Techniques, Tools

and Algorithms: An Overview.

Web Content Mining techniques :

- Unstructured Data Mining

- Structured Data Mining

- Semi – Structure Data Mining

- Multimedia Data Mining

Web Structure Mining techniques :

- Link-based Classification

- Link-based Cluster Analysis

- Link Type

- Link Strength

- Link Cardinality

Web Usage Mining techniques :

- Data Preprocessing

· Data Cleaning

· User & Session Identification

- Pattern Discovery

· Statistical Analysis

· Association Rules

· Clustering

· Classification

· Sequential Patterns

- Pattern Analysis

· Knowledge Query Mechanism

· OLAP (Online Analytical

processing)

Diterjemahkan :

Penambangan data adalah konsep yang membantu menemukan informasi yang dibutuhkan dari gudang data besar dengan menggunakan berbeda teknik. Ini juga digunakan untuk menganalisis data masa lalu dan meningkatkannya strategi masa depan. Penambangan data web dianggap sebagai sub pendekatan data mining yang berfokus pada pengumpulan informasi dari web. Web merupakan domain besar yang memuat data dalam berbagai macam bentuk yaitu: gambar, tabel, teks, video, dll. Seperti ukuran web terus meningkat; itu menjadi tugas yang sangat menantang untuk mengekstrak informasi. Dalam makalah ini kami menjelaskan tiga jenis penting dari penambangan data web yang dapat membantu dalam menemukan data informatif. Penambangan penggunaan web juga merupakan jenis penting yang disimpan pengguna mengakses data dan mendapatkan informasi tentang pengguna tertentu dari log. Semua teknik mungkin memiliki beberapa keuntungan dan kerugian tetapi kekurangannya dapat diperbaiki lebih lanjut studi.

Abdullah Alsaeedi, Mohammad Zubair Khan

2019

A Study on Sentiment Analysis Techniques of Twitter

Data

a. Twitter Sentiment Analysis using Supervised Machine Learning Approaches

b. Twitter Sentiment Analysis using Ensemble Approaches

c. Twitter Sentiment Analysis using Lexicon based Approaches (Unsupervised Methods)

d. Twitter Sentiment Analysis using Hybrid Methods

Diterjemahkan :

Dalam artikel ini, beragam teknik sentimen Twitter metode analisis dibahas, termasuk pembelajaran mesin, pendekatan ensemble dan kamus (leksikon) berbasis pendekatan. Selain itu, Twitter hybrid dan ansambel teknik analisis sentimen dieksplorasi. Penelitian hasil menunjukkan bahwa teknik pembelajaran mesin; untuk Misalnya, SVM dan MNB menghasilkan presisi terbesar, terutama ketika beberapa fitur disertakan. SVM pengklasifikasi dapat dilihat sebagai strategi pembelajaran standar, sementara kamus (leksikon) teknik berbasis sangat layak di kali, membutuhkan sedikit usaha dalam arsip bertanda manusia.

Algoritme pembelajaran mesin, seperti The Naive Bayes, Entropi Maksimum, dan SVM, mencapai akurasi sekitar 80% ketika model n-gram dan bigram dimanfaatkan. Analisis sentimen Twitter berbasis ensemble dan hybrid algoritma cenderung bekerja lebih baik daripada mesin yang diawasi teknik pembelajaran, karena mereka mampu mencapai akurasi klasifikasi sekitar 85%.

Secara umum, yang diharapkan adalah ansambel Twitter metode analisis sentimen akan berkinerja lebih baik daripadaalgoritme pembelajaran mesin yang diawasi, saat digabungkan beberapa pengklasifikasi dan terkadang berbagai model fitur. Namun, metode hybrid juga dilakukan dengan baik dan diperoleh skor akurasi klasifikasi yang wajar, karena mereka mampu untuk memanfaatkan pengklasifikasi pembelajaran mesin dan pendekatan analisis sentimen Twitter berbasis leksikon.

Salah satu kesulitan terbesar yang dihadapi adalah dimenentukan pendekatan terbaik untuk mendeteksi sentimen di Data Twitter karena membandingkan berbagai pendekatan adalah hal yang sangat tugas yang menantang ketika tidak ada tolok ukur yang disepakati.

Kesulitan ini dengan tidak adanya tolok ukur yang ditentukan dengan baik dengan demikian dibahas di [10] dan ditemukan dapat dikurangi oleh mengandalkan kumpulan data yang telah digunakan untuk mengevaluasi berbagai algoritma dalam kompetisi sentimen mikroblog seperti Set data SemEval’13.

Dheeraj.K

2020

Analysing COVID-19 News Impact on Social Media

Aggregation

a. Social Network Probe

b. Sentimental Probe

c. Sentimental Prophecy

d. Reddit Sentimental Probe

Diterjemahkan :

Fokus utama makalah ini adalah untuk mengekstrak sentimen dan penambangan opini tentang artikel terkait COVID-19 di Reddit, Menggunakan berbagai teknik pembelajaran mesin di Jupternotebook untuk menerapkan analisis sentimental sebagai positif, negatif dan netral. Hasilnya diekspos dengan menggunakan Matplotlib Perpustakaan.

Reddit API mengurutkannya dengan sangat tenang mengakumulasi banyak data berita terkait COVID-19 tidak memihak dengan cepat. Tentunya dengan meningkatkan data bermacam-macam proses untuk mendapatkan ribuan baris terkait Berita utama COVID-19, dapat kita gunakan untuk analisis lebih lanjut dan ramalan. Dalam tulisan ini, untuk mencapai nubuatan luas polaritas sentimen dalam reaksi terhadap berita COVID-19 di agregasi media sosial. Tepatnya, untuk prediksi sentimen Saya telah menggunakan kumpulan data artikel berita COVID -19 dan komentar dikumpulkan dari Reddit. Untuk melatih sentimen kami sistem prediksi, saya telah menggunakan ukuran korpus Reddit yang memerlukan anotasi otomatis dari polaritas sentimen dari komentar Reddit. Apalagi saya sudah menggunakan bootstrap pendekatan, dengan prosedur perilaku pengetahuan domain menggunakan korpus Twitter dan untuk mengubah polaritas sentimen pengetahuan dari tweet hingga observasi Reddit. Setelah menghitung beberapa pendekatan pengetahuan domain perilaku, saya telah menyimpulkan bahwa naluri kami bahwa kelompok Pengguna Reddit lebih homogen dalam topik terkait virus mereka memiliki tanggapan sentimental yang lebih dapat diprediksi terhadap COVID-19.

Rohaila Abdul Razak , Mazni Omar , dan Mazida Ahmad

2018

A Student Performance Prediction Model Using Data

Mining Technique

Using Knowledge Discovery in Database (KDD), consist of :

a. Data Selection

b. Data Preprocessing

c. Data transformation reduction

d. Implementation of Data Mining

Diterjemahkan :

Memprediksi kinerja dan mengidentifikasi calon mahasiswa pada tahap awal sangat penting untuk pengelolaan KPTM Alor Setar untuk mengelola mahasiswanya tersebut, agar meningkat dan menopang jumlah siswa dan pada saat yang sama dapat mencegah mereka meninggalkan perguruan tinggi lebih awal dari yang diharapkan. Itu akan membantu manajemen menemukan cara untuk mengurangi jumlah tersebut calon mahasiswa yang dropout dan juga bisa membantu yang kurang mampu siswa berprestasi sedini mungkin.

Hasil penelitian menunjukkan bahwa Regresi Linier memiliki prediksi yang lebih tinggi akurasi dibandingkan dengan Pohon Keputusan J48. Analisisnya juga menunjukkan faktor-faktor yang berkontribusi paling besar terhadap kinerja siswa.

Makalah ini akan membantu manajemen KPTM untuk mengelola kinerja siswa. Memprediksi kinerja dan mengidentifikasi calon siswa pada tahap awal sangat penting untuk dilakukan Pengurus KPTM Alor Setar yang mengelolanya siswa yang sesuai. Memprediksi kinerja siswa penting dilakukan agar manajemen dapat meningkatkan dan mempertahankan jumlah siswa dan pada saat yang sama dapat mencegah mereka meninggalkan perguruan tinggi lebih awal dari yang diharapkan. Hal ini akan membantu pihak manajemen untuk mencari cara untuk mengurangi jumlah siswa yang berpotensi putus sekolah dan juga dapat membantu siswa yang berprestasi rendah sedini mungkin untuk mendapatkan nilai bagus.

Neelamadhab Padhy , Rasmita Panigrahi

2012

Multi Relational Data Mining Approaches: A Data

Mining Technique

a. Inductive Logic Programming (ILP)

b. Multi-relational clustering ·

c. Probabilistic Relational Models

Diterjemahkan :

Makalah ini memberikan gambaran umum tentang pendekatan MRDM ke aplikasi dunia nyata dan metode klasifikasi di seluruh beberapa relasi database termasuk berbasis ILP, Relasional berbasis database, induksi pohon keputusan. Dalam perbandingan ini studi kami menyimpulkan bahwa efisiensi dan efisiensi algoritma penambangan data multi relasional untuk penggunaan relasional database dalam hal waktu eksekusi dan memori yang digunakan.

Pendekatan di atas telah dianalisis dengan perbandingan algoritma penambangan data tradisional dan data multi-relasional algoritma penambangan. Malah efisiensi yang lebih baik karena menghindari biaya yang mahal beberapa operasi penggabungan. Makalah ini menyajikan Multi pendekatan data mining relasional dan metode lintas beberapa relasi database termasuk berbasis ILP, Relasional berbasis database, berbasis Pola Berkembang, berbasis asosiatif pendekatan. Penambangan data multi-relasional berurusan dengan penemuan pengetahuan dari database relasional yang terdiri dari banyak tabel. Dengan perkembangan data mining teknik, data mining multi relasional telah menjadi hal baru area penelitian. Peneliti dapat memfokuskan beberapa fitur arah aplikasi yang disebutkan di atas. MRDM tidakhanya berurusan dengan yang terstruktur dan proposisional tetapi juga menemukan pola melalui sistem ILP.

Vishal A. Kharde

, S.S. Sonawane

2016

Sentiment Analysis of Twitter Data: A Survey of

Techniques

a. Machine Learning Approaches

b. Lexicon-Based Approaches

Diterjemahkan :

Dalam makalah ini, kami memberikan survei dan studi banding teknik yang ada untuk penambangan opini termasuk mesin pembelajaran dan pendekatan berbasis leksikon, bersama dengan lintas domain dan metode lintas bahasa dan beberapa evaluasi metrik. Hasil penelitian menunjukkan bahwa metode pembelajaran mesin, seperti SVM dan naive Bayes memiliki akurasi tertinggi dan dapat dianggap sebagai metode pembelajaran dasar, sedangkan metode berbasis leksikon sangat efektif dalam beberapa kasus, yaitu membutuhkan sedikit usaha dalam dokumen berlabel manusia. Kami juga belajar efek dari berbagai fitur pada pengklasifikasi. Kita dapat menyimpulkan bahwa semakin banyak data yang lebih bersih, hasil yang lebih akurat dapat diperoleh diperoleh. Penggunaan model bigram memberikan akurasi sentimen yang lebih baik dibandingkan dengan model lainnya. Kita bisa fokus pada studi tentang menggabungkan metode pembelajaran mesin menjadi opini metode leksikon untuk meningkatkan akurasi sentimen klasifikasi dan kapasitas adaptif untuk berbagai domain dan bahasa berbeda.

thinking .... loved it

(Belajar) Literature Review

No comments:

Post a Comment

Tugas VClass Softskill Pertemuan 3