Algoritmi i metode mjeranja sličnosti izvornog koda

Sažetak na hrvatskom: U današnje doba, informacijska dostupnost uvelike olakšava plagijarizam. Plagijarizam obuhvaća široko područje, a u ovome radu se analizira isključivo plagijarizam izvorišnih kodova. Klasificiraju se i objašnjavaju uobičajene metode zataškavanja plagijarizma. Navode se postojeć...

Full description

Permalink: http://skupni.nsk.hr/Record/fer.KOHA-OAI-FER:45977/Details
Glavni autor: Šulc, Dorian (-)
Ostali autori: Đerek, Ante (Thesis advisor)
Vrsta građe: Drugo
Impresum: Zagreb, D. Šulc, 2015.
Predmet:
LEADER 02534na a2200241 4500
003 HR-ZaFER
005 20160613125020.0
008 160221s2015 ci ||||| m||| 00| 0 hr d
035 |a (HR-ZaFER)ferid2233 
040 |a HR-ZaFER  |b hrv  |c HR-ZaFER  |e ppiak 
100 1 |a Šulc, Dorian  |9 37054 
245 1 0 |a Algoritmi i metode mjeranja sličnosti izvornog koda :  |b završni rad /  |c Dorian Šulc ; [mentor Ante Đerek]. 
246 1 |a Algorithms and techniques for measuring source code similarity  |i Naslov na engleskom:  
260 |a Zagreb,  |b D. Šulc,  |c 2015. 
300 |a 23 str. ;  |c 30 cm +  |e CD-ROM 
502 |b preddiplomski studij  |c Fakultet elektrotehnike i računarstva u Zagrebu  |g smjer: Računarska znanost, šifra smjera: 41, datum predaje: 2015-06-12, datum završetka: 2015-07-13 
520 3 |a Sažetak na hrvatskom: U današnje doba, informacijska dostupnost uvelike olakšava plagijarizam. Plagijarizam obuhvaća široko područje, a u ovome radu se analizira isključivo plagijarizam izvorišnih kodova. Klasificiraju se i objašnjavaju uobičajene metode zataškavanja plagijarizma. Navode se postojeće metode za mjerenje sličnosti poput mjere editirajuće udaljenosti i analize digitalnih otisaka, te se spominju uobičajeni predprocesi koji se provode nad izvorišnim kodovima. Na temelju opisanih metoda se nudi rješenje za mjerenje sličnosti velikog broja kodova u relativno kratkome vremenu koje je otporno na odabrani skup napada. Na kraju su provedeni eksperimenti kojima se ustvrđuju performanse stvorenog sustava. 
520 3 |a Sažetak na engleskom: Nowadays, informational availability makes it easy for people to partake in plagiarism activities. Plagiarism can be practiced in many ways, but this paper focuses on source code plagiarism exclusively. We classify and explain the usual methods used to cover plagiarism traces. Then we explain current state of the art methods for source code similarity measuring. Those include calculating various edit distances, digital fingerprint analysis and some common preprocessing tasks. Based on those methods, we offer a solution that measures software similarity of a huge set of documents and successfully defends against anti-detection plagiarism attacks. Finally, we carry out an experiment to determine the performance stats of our system. 
653 1 |a plagijarizam, editirajuća udaljenost, digitalni otisak, winnowing 
653 1 |a plagiarism, edit distance, digital fingerprint, winnowing 
700 1 |a Đerek, Ante  |4 ths  |9 35048 
942 |c Z  |2 udc 
999 |c 45977  |d 45977