Raportul de similitudine (II)

sursa igorvitale.org

SUMAR

Prima parte

Introducere

Malpraxis. Academic

Furt? Fraudă?

Victimele și Prejudiciul

Vigilența în mediul academic. Supravegherea (v. examenele, evaluarea lucrărilor etc.)

Plagiat și Copyright

Ce folosim în universitate?

Partea a doua

Ce este un soft „anti-plagiat”?

Cum funcționează un soft „anti-plagiat?

Ce înseamnă a face o match?

Partea a treia

Ce este un Raport de similitudine?

Ce urmează după Raportul de similitudine?

Cât de pregătiți suntem să interpretăm Raportul?

Ce este un soft „anti-plagiat”?

O foarte competentă specialistă în domeniul malpraxisului academic,  în media și computing de la Universitatea de Științe Aplicate din Berlin, Debora Werner-Wulff, afirmă fără echivoc: „Software cannot determine plagiarism; it can only point to some cases of matching text. The systems can be useful for flagging up problems, but not for discriminating between originality and plagiarism. That decision must be taken by a person. The most important method for finding plagiarism is reading a text and studying the references for inconsistencies .” [i]   În funcție de cum e creat și de nivelul de performanță, softul nu face decât să arate, să semnaleze, ce bucăți din textul supus verificării e similar cu bucăți de texte din alte lucrări, care există stocate în baza sa de date. Ce rezultă e un Raport de similitudine care oferă și procentul textelor similare găsită în textul supus verificării. E sarcina specialistului, apoi, a profesorului sau editorului să analizeze ce înseamnă acest rezultat. Dacă și ce e și nu e plagiat. Și aici infrastructura etică și de integritate a unei universități trebuie să fie clară în ce privește definirea plagiatului, a proastei conduite academice, în general. Dacă e bine ca universitățile, în contextul creșterii nivelului malpraxisului academic, să investească în softuri „anti-plagiat” performante, în același timp e necesar să o facă și în formarea specialiștilor din mediul universitar capabili să analizeze rezultatele testului de similitudine și apoi să difuzeze o cultură a anti-plagiatului. Cu alte cuvinte, e obligatoriu ca universitatea să își formeze specialiști în etică și integritate academică, care să poată pune în practică profilaxia în cazul plagiatului. Teoria eticii, ca disciplină filosofică, importantă, desigur, trebuie să recunoască evidența: etica și integritatea academică sunt în suferință nu pentru că nu suntem înarmați cu concepte, ci pentru că nu suntem calificați să recunoaștem, să descoperim proasta conduită în comunitatea academică, în cercetare, să probăm furtul și frauda în domeniul academic, de cercetare. Toate forme, manifestări ale malpraxis-ului academic.

Cum funcționează un soft „anti-plagiat?

Cele mai performante softuri sunt Urkund, TurnItIn, Ithenticate. La prima vedere. Căci nu toate au același tip de performanțe. Ce este prioritar pentru cine vrea să cumpere și să folosească un soft „anti-plagiat” este să știe care este performanța acestuia în raport cu tipurile de texte avute în vedere pentru Identificarea Textului Similar (ITS) și scopurile sale. Iar performanța e dată, după opinia unor specialiști, dar nu numai, de două caracteristici: acoperirea (ce tipuri de texte și date acoperă soft-ul) și folosirea (cât de mult/bine poate fi folosit și de câți users).

Pentru că Educația este un uriaș consumator de software, producătorii de instrumente digitale anti-plagiat au dezvoltat producția acestora nu atât din perspectiva prevenției, cât mai ales din aceea a unui mod de a măsura nivelul preluării de texte din alte surse arhivate digital în baza softului. Și, astfel, indirect, deschizând calea universităților să respire…etic mai ușor. E aici o consecință a unei gândiri mecaniciste pe care o acuză, de pildă, Andrei Sorin [ii], gândire care creditează performanța în mod fals.

Autorii unui studiu foarte solid [iii] privind performanța softurilor anti-plagiat observă, între altele,  că literatura de specialitate consacrată subiectului se bazează, de multe ori, nu pe analiza softurilor, prin folosirea mai multor criterii, tipuri de texte etc., ci pe descrieri ale acestora oferite de…producători. Ei remarcă faptul că, de pildă, performanța celor 16 soft-uri analizate, e mai bună când e vorba de identificarea mai multor fragmente mici decât a unui document mare. În România, am avut cazul unei disertații căreia i-a fost schimbat numai numele autorului. Disertația-sursă nu era arhivată digital, deci orice verificare a disertației-țintă (plagiatul) ar fi dat – dacă plagiatul nu ar fi fost denunțat public – un ok plagiatului. Noroc că lucrarea „furată” era încă disponibilă pe hârtie, în arhiva instituției. S-a putut face ușor compararea celor două. 

Faptul că majoritatea softurilor sunt mai performante în ce privește similitudinea documentelor provenind din mai multe surse decât dintr-una singură se explică prin posibilitatea mai mare ca unele texte să fie arhivate în depozitul digital al softului. Dacă e analizat numai un singur document, posibilitatea ca el să nu fie arhivat digital în baza de date a softului, e mult mai mare. Dar asta nu e totul: Raportul de similitudine dă scor 0 (nu l-a găsit, adică nu îl are în baza sa de date) iar evaluatorul ia de bun acest rezultat. Iar textul în cauză poate exista arhivat digital, în baza de date a altui soft. Și, astfel, apare o mare problemă a acestor softuri: falsele negative, rezultatul negativ – cum se întâmplă, adesea, din păcate, și în domeniul testării medicale – care conduce la o decizie, eronată, de non-plagiat.

Ce înseamnă a face o match?

Acțiunea de analizare și demonstrare a unui plagiat are în vedere identificarea și potrivirea de texte pentru a vedea nivelul de similitudine/identitate  a două texte: cel sursă (de unde s-a copiat) și cel țintă (cel în care e folosit primul). În engleză, această acțiune e numită match  și are două sensuri: primul se referă la o persoană sau un lucru care este egal, asemănător sau corespunzător cu o alta sau alt lucru; al doilea se referă la obiecte inflamabile precum chibritul. Ca verb, este acțiunea prin care e făcută operațiunea. În cazul plagiatului, cele două sensuri se regăsesc în relație unul cu altul, dar în mod diferit: acțiunea care duce la constatarea plagiatului, după expertiza specialistului, este Identificarea Textului Similar (ITS) iar dezvăluirea plagiatului e ca aprinderea unui chibrit căci, adus sau adusă în public, furtul sau frauda este și o simbolică „ardere”  a persoanei vinovate.

A face o match, a obține, în cazul ITS, similitudinea, asemănarea, corespondența unui text cu un altul, al altcuiva, e, în bună măsură, o acțiune specializată de identificare, cunoscută și în tehnicile criminalistice privind: identificarea cuiva după o fotografie, înregistrare video, din șirul de persoane (line-up) între care e și suspectul, un desen, o descriere verbală a persoanei suspectului, o înregistrare audio, un detaliu comportamental sau fizic etc. Niciuna nu este perfectă și trebuie ca mai multe astfel de elemente să își corespundă pentru a fi validate ca probe în justiție. Legea e, însă, diferită, în funcție de țară, sistem politic etc în ce privește admisibilitatea și validarea acestor probe. În cazul martorilor oculari, de pildă, problemele sunt complicate de acuratețea descrierii persoanei suspecte de către martor, una dintre metode, match-to-description [iv]  fiind nu odată criticată sau permițând, în tribunal, ca apărarea să o respingă ca probă.

Ideea de potrivire (match) este o operațiune interdisciplinară, combinată din mai multe domenii și cu implicarea unor specialiști diferiți în cazul identificării rămășițelor umane, de pildă. Rezultatul ei este admis ca probă în tribunal iar validitatea ei poate fi stabilită de judecător, pe baza punctelor de vedere exprimate de specialiști. Identificarea umană pozitivă în criminalistică se bazează pe coroborarea unor matches a amprentelor digitale, caracteristicilor dentare cu datele arhivate, aspect esențial al operațiunii.[v]

Să facem o comparație între Identificarea facială (IF) și Identificarea textului similar (ITS). Ați văzut în filme cum se face IF. Un soft analizează biometric fața, generează un template, apoi îl caută într-o bază de date pentru a găsi potrivirea identică („the match”) pe baza unui scor reprezentând numărul de puncte/caracteristici de similitudine. Desigur, identificarea facială are scopuri diferite – dar nu toate – față de cea de text. Există, însă, și puncte comune [vi] : IF e folosită, între altele, pentru găsirea copiilor dispăruți (fapt care e chiar în originea termenului latin, „plagiarus”- „hoț de copíi”), folosește imagini cu fețe din public (ceea ce e, în plagiat, similar cu ideea identificării plagiatului din texte publicate și/sau stocate digital, deși există și situația textelor nepublicate și/sau nestocate digital), implică un proces non-intruziv, folosește baze de date legale, e integrată în alte sisteme de supraveghere. Pașii în IF sunt cinci, după Woodward (v. nota 6): „captura imaginii”, delimitarea feței din imagine, extragerea caracteristicilor feței (pentru a genera un template), compararea template-ului obținut cu cele dintr-o bază de date (fapt care dă un scor al asemănării: cu cât mai mare e scorul cu atât match-ul permite IF; în ITS scorul e dat de Raportul de similitudine exprimat prin procentaj), declararea potrivirii (a”match”-ului) în proporție de… O diferență majoră apare, în cazul ITS: scorul potrivirii dintre textul sursă și cel țintă nu e suficient pentru a declara plagiatul. Dar și în cazul IF ceva similar apare atunci când e vorba de condițiile în care a fost realizată fotografia feței. Mai adaug că IF e foarte utilă în tehnicile și procedurile de supraveghere a persoanei, fapt care aduce în discuție problema respectării drepturilor acesteia, în condițiile legii care face distincția între suspect  și infractor. Dar cum arată chestiunea „supravegherii” în mediul academic? Subiectul e foarte sensibil. Îl voi aborda puțin mai târziu.

O analogie între Text și Față se impune aici, în chestiunea plagiatului. Ambele pot masca, primul, preluarea ilicită, a doua, sentimentul adevărat. Identificarea e dificilă pentru că, și într-un caz și în celălalt, un soft nu face totul. Unul dintre cei mai buni specialiști în tipologia și analiza expresiilor faciale, Paul Ekman, scrie despre cum fața poate înșela prin simulare, ascundere, mascare  a sentimentului real, fapt care se întâmplă din patru motive: regulile prezentării culturale, regulile prezentării personale, cerințe vocaționale și necesitatea de moment. [vii] La fel, „tehnicile” plagiatului care „simulează” (prin parafrazare), ascund ( prin „patchwork” sau țesere a cuvintelor altora între ale tale) sau maschează (prin reciclare a aceluiași text, preluarea și adaptarea grafică a referințelor care nu îți aparțin pentru a nu fi identificate ca fiind ale altcuiva)

VA URMA


[i] WEBER-WULF, Debra, „Plagiarism detectors are a crutch, and a problem”, Nature, March 28, 2019, vol. 567 (https://www.nature.com/articles/d41586-019-00893-5, accesat 23.02.2020)

[ii] SORIN, Andrei, Software and Mind. The Mechanistic Myth and Its Consequences, Toronto, Andsor Books, 2013 (disponibilă la www.softwareandmind) Una din consecințele folosirii softurilor „anti-plagiat” în lumea noastră academică, dar nu numai la noi: creează un disconfort vizibil. Andrei Sorin formulează efectul general:”Our software culture is so corrupt that it has become, in effect, a form of totalitarianism”.

[iii] FOLTÝNEK, Tomáš et al., Testing of Support Tools for Plagiarism Detection, Version 1.0; 11th of February 2020 (sursa Cornell University https://arxiv.org/abs/2002.04279, accesat 20.03.2020)

[iv] WELLS, Gary L., „Eyewitness Identification Research- Strengths and Weaknesses of Alternative Methods”, Research Methods in Forensic Psychology, ed. Barry Rosenfeld and Steven D. Penrod, Hoboken, NJ: Wiley, 2011, p. 243, http://www.questia.com/read/123476518/research-methods-in-forensic-psychology (accesat 17.03.2020)

[v] RATHBURN, Ted A.; BUIKSTRA, Jane (editori), Human Identification. Studies in Forensic Anthropology, Springfield, IL: Charles C. Thomas Publishers, 1984, p. 343

[vi] WOODWARD, John D. et al., Biometrics: A Look at Facial Recognition, Santa Monica, CA: Rand, 2003, pp. 7 și urm. (http://www.questia.com/read/102694307/biometrics-a-look-at-facial-recognition, accesat 17.03.2020)

[vii] EKMAN, Paul; FRIESEN, Wallace V., Unmasking the Face. A Guide to recognizing emotions from facial expressions, Cambridge, MA: Malor Books, 2003, p. 143

sursa foto www.igorvitale.org

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *