Gjuha e shkencës ndryshon vazhdimisht. Gjatë dhjetë viteve të fundit, një gamë e gjerë fjalësh dhe frazash kanë dalë nga errësira në përdorim të zakonshëm në shkencë. Këto përfshijnë zika, Ebola, ChatGPT e kështu me radhë, fjalë që pasqyrojnë zbaticën dhe rrjedhën e kërkimit shkencor dhe ngjarjet dhe modat më të gjera brenda shkencës dhe shoqërisë.
Këto ndryshime shfaqen në letrat, rishikimet dhe artikujt që shkencëtarët po prodhojnë vazhdimisht. Në të vërtetë, studiues të ndryshëm janë përpjekur të hartojnë evolucionin e shkencës përmes ndryshimeve në gjuhën që ata prodhojnë.
Dhe kjo ngre një pyetje interesante në lidhje me ndikimin e inteligjencës artificiale në shkencë. Që nga prezantimi publik i ChatGPT në nëntor 2022, shkencëtarët kanë qenë në gjendje të përdorin Modele të Mëdha Gjuhëshe për të rishikuar, modifikuar dhe herë pas here të shkruajnë nga e para të gjitha punimet shkencore që prodhojnë. Por sa e përdorin ata në të vërtetë këtë lloj ndihme të AI nuk dihet.
Ndryshimi Historik
Hyjnë Dmitry Kobak në Institutin Hertie për AI në Shëndetin e Trurit në Tubingen, Gjermani dhe kolegët, të cilët kanë gjetur një mënyrë për të matur ndikimin e sistemeve të AI në literaturën shkencore që nga viti 2022 dhe për të krahasuar ndikimin e episodeve të tjera të mëdha në shkencë. Ata thonë se modelet e mëdha gjuhësore po ndryshojnë diskursin shkencor në një shkallë të paprecedentë në histori.
Kobak dhe bashkë filluan duke shkarkuar abstrakte nga mbi 14 milionë punime shkencore të botuara në bazën e të dhënave biomjekësore PubMed që nga viti 2010. Më pas ata pastrojnë bazën e të dhënave të fjalëve dhe frazave të zakonshme që nuk kanë lidhje me shkrimin e autorëve, si “e drejta e autorit” ose “Si të citosh Ky artikull”. Më pas ata llogaritën se sa shpesh shfaqet çdo fjalë më e gjatë se tre shkronja çdo vit. Më në fund, ata shikuan 800 fjalët më të njohura dhe se si ndryshonte frekuenca e tyre çdo vit.
Rezultatet zbuluan menjëherë disa tendenca të dukshme në shkencë. Për shembull, shpeshtësia e fjalës Ebola arriti kulmin në vitin 2015 dhe zika në 2017. Një nga ndryshimet më të mëdha ndodhi në vitin 2020 me një rritje të madhe në përdorimin e fjalëve si p.sh. bllokim, pandemi, respiratore dhe remdesivir gjatë shpërthimit të Covid, një ngjarje që pranohet gjerësisht se ka pasur një nga ndikimet më të mëdha në botimin shkencor në histori.
Por për habinë e studiuesve, një ndryshim edhe më i madh ndodhi në vitin 2024 me një rritje të fjalëve si gërmon, vendimtare, e rëndësishme dhe potencial. Çuditërisht, këto nuk janë fjalë që lidhen me përmbajtjen shkencore të një punimi, por me stilin e të shkruarit.
Në të vërtetë, studiuesit sugjerojnë se këto janë pikërisht ato lloj fjalësh të favorizuara nga Modelet e Mëdha të Gjuhës. “Rritja e paprecedentë e fjalëve të tepërta të stilit në 2024 na lejon t'i përdorim ato si shënues të përdorimit të ChatGPT,” thonë Kobak dhe bashkë.
Dhe ndryshimi ka qenë i thellë. “Qindra fjalë kanë rritur befas frekuencën e tyre pasi ChatGPT u bë i disponueshëm,” thonë ata.
Ndihmë angleze
Kobak dhe bashkë vendosën një kufi më të ulët në numrin e punimeve që janë ndikuar nga modelet e mëdha gjuhësore. Të dhënat sugjerojnë se të paktën 10 për qind e punimeve në PubMed në vitin 2024 janë ndikuar në këtë mënyrë. “Me rreth 1.5 milionë letra që indeksohen aktualisht në PubMed në vit, kjo do të thotë që LLM-të ndihmojnë në shkrimin e të paktën 150 mijë punimeve në vit”, përfundojnë studiuesit.
Ekipi vuri re se asistenca e AI-së ishte më e zakonshme në letrat nga vendet ku anglishtja nuk ishte gjuha e parë. Kjo mund të sugjerojë që folësit jo-anglisht po përdorin ndihmën e AI për të niveluar fushën e lojës për shkrimin shkencor. Ose mund të nënkuptojë që folësit anglezë përdorin ndihmën e AI-së po aq shumë, por janë më të aftë për të hequr ndikimin e saj nga letrat e tyre përpara publikimit. Sido që të jetë, përdorimi i LLM-ve duket i përhapur.
Kjo është një punë interesante që shkëlqen një dritë e rrallë në mënyrën se si AI po ndryshon jo vetëm mënyrën se si shkruajnë shkencëtarët, por edhe mënyrën se si bëhet shkenca. “Efekti i përdorimit të LLM në shkrimet shkencore është vërtet i paprecedentë dhe tejkalon edhe ndryshimet drastike në fjalor të shkaktuar nga pandemia Covid-19”, thonë Kobak dhe bashkë.
Ajo që nevojitet, natyrisht, është një kuptim dhe njohje më e qartë e këtyre prirjeve, në mënyrë që komuniteti shkencor të mund të vendosë parmakë mbi përdorimin e LLM-ve në interesin më të mirë të shkencëtarëve, botuesve shkencorë dhe shoqërisë më të gjerë që shkenca synon të përfitojë.
Kjo punë duket si një hap i rëndësishëm në këtë drejtim. Megjithatë, shkalla e ndryshimit në përdorimin e LLM sugjeron që shkencëtarët dhe botuesit do të duhet të veprojnë shpejt për të pasur ndonjë shans për të vazhduar. Dhe nëse botimi shkencor është diçka për të vazhduar, fusha të tjera të botimit ka të ngjarë të përballen gjithashtu me sfida të ngjashme.
Ref: Hyrja në përdorimin e ChatGPT në shkrimin akademik përmes fjalorit të tepërt: arxiv.org/abs/2406.07016