SDS – similarity-detection software

Programy SDS najczęściej wykorzystywane przez wydawnictwa naukowe.

Na łamach magazynu Science Editor [a publication of the council of science editors], ukazał się artykuł poświęcony wykorzystywaniu narzędzi typu similarity-detection software. W artykule, bazującycm na wywiadzie środowiskowym, można się dowiedzieć, że niektóre czasopisma posiadają swoją wewnętrzną politykę odnośnie powtórnego wykorzystania już opublikowanego tekstu czy też dokonanego plagiatu w pracy naukowej, z kolei inne odsyłają do wytycznych znajdujących się w COPE (The Committee on Publication Ethics). W każym przypadku, dla środowiska wydawnictw,  pozostaje kluczowe pytanie odnośnie najbardziej efektywnych sposobów wykorzystania narzędzi do wykrywania podobieństw w pracach naukowych zanim nastąpi naruszenie prawa.

iThenticate, PlagScan, WCopyfind, Turnitin, Grammarly a także inne  oprogramowania (m.in. darmowe) dostępne online są najczęściej wymienianymi programami wykorzystywanymi przez wydawnictwa. Niektóre z tych narzędzi korzystają z ogólnodostępnej informacji online, z kolei inne (np. iTenticate) bazują na zbiorach publikacji “zdeponowanych” w zasobach zbiorów CrossCheck (system stworzony przez osoby, które zbudowały TurnItIn oraz CrossRef). Oczywiście, każde oprogramowanie ma swoje ograniczenia, np. pomija Ryciny, Tabele, czy też tylko sprawdzany jest tekst napisany w języku angielskim.

Prawie 60% respondentów odpowiedziało, że stosuje narzędzia SDS we wszystkich artykułach (ponad w 50% na etapie initial submission), 17% że takie narzędzie jest stosowane pod wpływem zaleceń ze strony edytora a tylko 7% dla losowo wybranych artykułów. Prawie wszyscy respondenci wskazali, że SDS jest używane w przypadku wszystkich prac naukowych, które przeszły przez etap peer review. W niektórych przypadkach artykuły są sprawdzane na prośbę recenzenta lub edytora, jeżeli podejrzewają plagiat lub wtóre wykorzystanie tekstu (ang. recycled text).

Raporty (ang. similarity score; SC%) wygenerowane przez narzędzia SDS są czytane przez edytorów, jeżeli wynoszą powyżej 20%, aczkolwiek ten próg procentowy nie jest normą i każde czasopismo ma swoją odrębną politykę pod tym względem.

Podsumowaniem ankiety może być stwierdzenie, że w posługiwaniu się raportami wygenerowanymi przez narzędzia SDS jest wymagane pewne doświadczenie. Niski SC% może ukrywać fakt, że całe zdanie zostało dosłownie wzięte z innej, niezacytowanej pracy, podczas gdy wysoki SC% może być wynikiem stosowania krótkich fraz lub terminów występujących również w innych artykułach naukowych, co niekoniecznie stanowi o plagiacie lub złamaniu etycznych wytycznych wydawnictwa.