textmatchning

sökning efter likheter mellan olika textdokument. – Syftet är ofta att upptäcka plagiat eller fusk. Textmatchning görs med datorprogram, ofta genom webbaserade tjänster. En given text – ofta en vetenskaplig artikel eller en uppsats – jämförs med ett stort antal texter från webben. Programmen letar inte enbart efter exakt likalydande text, utan kan utgå från ett ”fingeravtryck” av texten, baserat på vilka ord som är vanliga och andra mönster. – Textmatchning är inget säkert sätt att upptäcka plagiat och fusk. I synnerhet i tekniska och naturvetenskapliga artiklar finns det nämligen många stående uttryck och formuleringar som många skribenter använder utan att det därför är plagiat. Misstänkta fall av plagiat och fusk måste därför alltid granskas av en kompetent mänsklig bedömare. – Tjänster för textmatching är bland andra Ithenticate (ithenticate.com) och Ouriginal (ouriginal.com) (tidigare Urkund). – På engelska: text matching. Man talar också om plagiarism detection. – Se artikel från 2022 i tidskriften Curie. – Läs också om robust hashing.

[källkritik] [språkteknik] [upphovsrätt] [ändrad 15 juni 2022]

Kaspersky

Kaspersky Lab – ett ryskt it‑säkerhetsföretag som bland annat tillhandahåller virusskydd. – Kaspersky Lab, som grundades 1997 av Eugene Kaspersky med flera, blev snabbt ett av de internationellt ledande företagen inom it-säkerhet. Men det har funnits misstankar om att Kasperskys produkter utnyttjas av den ryska underrättelsetjänsten för insamling av information och för hemlig access till it‑system i väst. USA:s regering förbjöd 2017 all användning av Kasperskys produkter i federala myndigheter. Efter Rysslands invasion av Ukraina 2022 har misstankarna tilltagit, och i slutet av mars 2022 klassade amerikanska FCC Kasperskys produkter som en ”oacceptabel risk för USA:s nationella säkerhet” (se fcc.gov…). Kaspersky Lab förnekar samröre med Rysslands underrättelsetjänst. – Se kaspersky.com. – IDG:s artiklar om Kaspersky: länk.

[företag] [it-säkerhet] [2 april 2022]

data literacy

datakompetens, dataläskunnighet; dataliteracitet – förmåga att läsa, förstå, utvärdera, skapa och förmedla data. – Observera att den engelska termen data literacy handlar om data (uppgifter) – inte om datorer som sådana. – Jämför med digital literacy.

[data] [ändrad 12 april 2022]

Hawes, Mary K

amerikansk datavetare, känd för att hon 1959 tog initiativ till utvecklingen av Cobol.  – Mary K Hawes, som då arbetade på Burroughs (numera del av Unisys), ansåg att det behövdes ett programspråk som var anpassat för administrativa och ekonomiska tillämpningar, och som var så likt vanlig engelska som möjligt. Hon tog därför kontakt med Grace Hopper, som föreslog att de skulle begära finansiering av amerikanska staten för att utveckla ett sådant språk. Det beviljades, och en kommitté vid namn Codasyl (Short range committee of the conference on data systems languages) tillsattes. Cobol utvecklades sedan baserat på Grace Hoppers programspråk Flowmatic. Codasyl levde vidare och utvecklade andra system och standarder, men tynade bort med tiden. – Vi har inte hittat några biografiska uppgifter om Mary K Hawes.

[personer] [27 mars 2022]

GPT-3

ett system som kan producera text som verkar vara skriven av människor. – GPT‑3 bygger på ett enormt system för maskininlärning, baserat på mängder av autentisk text. Om en användare matar in början på en text ger GPT‑3 förslag om hur texten ska fortsätta. Man kan också ge GPT‑3 förebilder för den text man önskar få skriven. Systemet fungerar utan mänsklig handledning. – Ett problem, som påpekades av forskare kort efter att GPT‑3 presenterades (se denna länk), är att systemet kan producera alla slags text. Det kan alltså framställa falska nyheter, spam och näthat – allt baserat på inslag i de väldiga textmassor, insamlade från internet, som används för maskininlärningen. – GPT‑3 presenterades 2020, och är utvecklat av företaget OpenAI. Samma år köpte Microsoft exklusiv licens till GPT‑3. Andra kan använda GPT‑3 genom ett API, men bara Microsoft har tillgång till det underliggande systemet. GPT står för generative pre‑trained transformer. Det finns två tidigare liknande system. Ibland talar man om GPT-n. – Läs också om ChatGPT. – Se openai.com/blog/openai-api.

[förkortningar på G] [generativ AI] [generativt språk] [ändrad 12 januari 2023]