- Nemokama akademinė paieškos sistema, kuri naudoja IA teikti pirmenybę įtakai ir kontekstui.
- Citavimo metrika su kokybine detale: įtaka ir skyrius, kuriame cituojama.
- Vieno sakinio santraukos ir objektų išskyrimas greitam aktualumo įvertinimui.

Nuolat augant mokslinių publikacijų kiekiui, pagrindinio straipsnio paieška gali tapti tikru nuotykiu. Būtent čia praverčia „Semantic Scholar“ – nemokama akademinė paieškos sistema, taikoma... dirbtinis intelektas atrasti ir suprasti tyrimus greitesnis ir kelia mažiau dokumentacijos triukšmo nei tradiciniai varikliai.
Be paprasto rezultatų sąrašo, ši paslauga apima kokybiškas įžvalgas, tokias kaip citatų skaičius, tų citatų kontekstas ir itin glaustos vieno sakinio santraukos. Dėl mašininio mokymosi, natūralios kalbos apdorojimo ir kompiuterinės regos metodų ji gali atrasti prasmingus ryšius tarp kūrinių, autorių ir temųtodėl literatūros naršymas tampa daug efektyvesnis.
Kas yra „Semantic Scholar“ ir kam jis naudojamas?
„Semantic Scholar“ yra mokslinės paieškos ir atradimų įrankis, vienas iš pavyzdžių. paieškos sistemų tipai specializuotas, kurį teikia Alleno dirbtinio intelekto institutas (AI2). Jo tikslas – paspartinti žinių tobulinimą, padedant tyrėjams, mokytojams ir studentams rasti ir suprasti atitinkamus darbus. Jis nemokamas; galite juo naudotis užsiregistravę su paskyra. "Google" arba institucinė, o 2020 m. ji viršijo septyni milijonai vartotojų per mėnesį, tai ženklas, kad jis kelia susidomėjimą bendruomenėje.
Platforma veikia kaip tiltas tarp jūsų ir tikrai aktualios informacijos: ji leidžia filtruoti pagal autorystę, prieigą prie PDF, žinių sritį ar leidinio tipą ir siūlo susijusią literatūrą pagal jūsų pomėgius. Visa tai siekiant sumažinti informacijos perteklių ir teikti pirmenybę įtakingiausiems kiekvienos temos darbamsne tik dažniausiai cituojamas grubiai.
Norėdamas tai pasiekti, jis pasitelkia mašininio mokymosi, NLP ir kompiuterinės regos derinį. Naudodamas šiuos metodus, jis generuoja vieno sakinio santraukas, naudodamas abstraktų požiūrį, taip pat straipsniuose identifikuoja subjektus (pvz., junginius, organizmus ar pagrindines sąvokas) ir vaizdinius elementus. Kitaip tariant, jis prideda semantinį sluoksnį, kuris leidžia... suprasti turinio, o ne tik žodžių prasmę.
Kiekvienas įrašas jų duomenų bazėje turi unikalų identifikatorių, vadinamą S2CID („Semantic Scholar Corpus ID“). Šis identifikatorius palengvina nuorodų paiešką, versijų stebėjimą ir susiejimą su kitomis duomenų bazėmis. Taigi, radę konkretų darbą, turite nedviprasmišką žymę, kad jį cituotumėte arba gautumėte, o tai padeda Venkite dviprasmybių tarp straipsnių su panašiais pavadinimais.
Lyginant su „Google Scholar“ ar „PubMed“, požiūrio skirtumas akivaizdus: be citatų skaičiavimo ir terminų bendro pasirodymo analizės, „Semantic Scholar“ išryškina svarbiausius kiekvienos srities aspektus ir, naudodama algoritmus, atsižvelgiančius į kontekstą, nustato ryšius tarp publikacijų. Tokiu būdu ji pateikia rezultatus, kurie Jie teikia pirmenybę aktualumui ir realiai įtakai. mokslinio pokalbio metu.
Kaip tai veikia: signalai, kotiruotės ir kokybės rodikliai
Atlikę paiešką ir atidarę įrašą, pamatysite, kad citavimų skaičius paprastai yra aiškiai rodomas. Naudinga funkcija yra ta, kad užvedus pelės žymeklį ant šio skaičiaus, grafike rodoma metinė citavimų tendencija. Šis greitas veiksmas rodo straipsnio istoriją laikui bėgant, todėl galite... aptikti dominančius pikus arba stabilumo periodus.
Užvedus žymeklį ant grafiko juostų, bus rodomos kiekvienų metų vertės. Tai padeda atsakyti į tokius klausimus: ar kūrinys vis dar cituojamas? Ar iš pradžių turėjo didelį poveikį, o vėliau sumažėjo, ar išlaiko nuolatinį susidomėjimą? Tai, kad kūrinys ir toliau cituojamas, yra geras jo aktualumo rodiklis ir vertinimo pasakojime gali būti argumentuojama kaip... įrodymas, kad jų indėlis ir toliau yra naudingas.
Paspaudus straipsnio pavadinimą, galima pasiekti išsamesnę informaciją: santrauką, galimas nuorodas (pavyzdžiui, į PDF versijas arba leidėją), cituojamus straipsnius ir susijusius straipsnius. Šis skydelis yra pagrindas tolesniam skaitymui ir vos keliais paspaudimais sukuria tvirtą nuorodų grandinę – visa tai patogiai naudojamoje sąsajoje. sumažinti iki minimumo El Tiempo ieškoti ir maksimaliai padidinti aktualumą.
Viršutiniame dešiniajame kampe paprastai rodomas blokas su išsamiais citavimo duomenimis. Tarp jų išsiskiria labai įtakingos citatos, t. y. cituojančios darbus, kuriuose straipsnis turėjo didelę įtaką. Be to, jame rodoma, kur straipsnis cituojamas cituojančiuose dokumentuose (pavyzdžiui, tokiuose skyriuose kaip „Fonas“ arba „Metodai“), o tai labai naudinga užuomina norint suprasti, ar straipsnis naudojamas kaip šaltinis. teorinis pagrindas, metodologija arba kritinis rezultatas.
Šie kokybiniai signalai papildo bendrą citatų skaičių su kontekstu. Žinojimas, kad tyrimas yra pakartotinai cituojamas metodų skyriuje, nereiškia, kad jis yra cituojamas tik konteksto skyriuje. Todėl apibūdinant indėlio kokybę, patartina paminėti tiek šių citatų kiekį, tiek kontekstą, integruojant šiuos duomenis į... aiškus poveikio ir aktualumo aprašymas.
Rezultatų prioritetizavimas remiasi modeliais, kurie supranta turinį semantiniu lygmeniu. Jie ne tik skaičiuoja žodžius, bet ir vertina sąvokų ryšius, aptinka subjektus ir atpažįsta figūras. Tokiu būdu atsiranda ryšiai tarp tyrimų krypčių, autorių ir žurnalų, leidžiantys atrasti alternatyvius skaitymo kelius ir... sujungti straipsnius tarp poskyrių.
Korpuso aprėptis ir projekto raida
„Semantic Scholar“ buvo įkurta 2015 m. Alleno dirbtinio intelekto institute, iš pradžių daugiausia dėmesio skiriant kompiuterių mokslui. Nuo tada jos aprėptis nuolat augo ir įvairėjo, tapdama pagrindiniu šaltiniu tiems, kurie ieško greitų ir įžvalgių svarbios literatūros vietų, ir nuolat stengiamasi... išplėsti laukus ir pagerinti naudotojo patirtį.
2017 m. komanda paskelbė apie didelę plėtrą biomedicinos srityje, prie 12 milijonų jau aprėptų kitų sričių biomedicinos darbų pridėdama maždaug 26 milijonus. Ši patobulinta versija pasižymėjo modernesne sąsaja, teminiu suskirstymu į kategorijas ir susijusių ar populiarėjančių temų aptikimu. Tuometinė projekto vadovė Marie Hagman pabrėžė, kad tikslas buvo palengvinti naršymą pagal temas ir... atrasti naujus tyrimų frontus.
Iki 2018 m. sausio mėn. korpuse buvo daugiau nei 40 milijonų straipsnių, apimančių kompiuterių mokslą ir biomediciną. Netrukus po to, tų pačių metų kovą, prie projekto prisijungė vadovauti Doug Raymond, atsakingas už mašininio mokymosi iniciatyvas „Alexa“ platformoje. Šis organizacinis postūmis sustiprino dėmesį dirbtinio intelekto naudojimui siekiant pagerinti sistemos aktualumą ir mastelio keitimą.
Augimas paspartėjo 2019 m., pridėjus įrašus iš „Microsoft Academic“. Tų metų rugpjūtį straipsnių skaičius viršijo 173 milijonus – tai kiekybinis šuolis, įtvirtinęs „Semantic Scholar“ poziciją kaip vieno iš pirmaujančių internetinių išteklių šioje srityje. didesnės duomenų bazės su geresniu semantiniu signalu prieinamas mokslo bendruomenei.
Lygiagrečiai platformai teko įveikti sprogstamojo literatūros augimo iššūkį: kasmet dešimtyse tūkstančių žurnalų publikuojama daugiau nei trys milijonai straipsnių. Dėl tokio straipsnių kiekio sunku neatsilikti, todėl svarbiausių kūrinių prioritetizavimas ir susiejimas yra toks vertingas, nes taupo laiką ir sumažina triukšmą literatūros apžvalgoje.
Naudingi paieškos įrankiai ir filtrai
Norint patikslinti rezultatus, būtini filtrai. Galite apriboti paiešką pagal bendraautorystę, PDF prieinamumą, discipliną, publikacijos tipą ar datą ir kitus kriterijus. Naudojant juos kartu, galite kurti tikslias užklausas, pavyzdžiui: atviros prieigos straipsniai, esantys tam tikru metų intervalu ir parašyti konkrečios komandos. Šis filtrų derinys, tinkamai pritaikytas, yra... Galingas svertas, padedantis rasti tai, ko jums tikrai reikia.
Platforma taip pat siūlo susijusius autorius ir straipsnius pagal jūsų paieškos istoriją. Šios rekomendacijos nėra bendriniai sąrašai: jos pagrįstos semantiniais modeliais ir citavimo tinklais, todėl jose dažniausiai randama gijų, apie kurias galbūt net nesvarstėte. Praktiškai šie pasiūlymai leidžia jums eiti labai vaisingu skaitymo keliu ir išplėsti sisteminės apžvalgos apimtį.
Vienas iš „Semantic Scholar“ privalumų yra tai, kaip ji vizualizuoja citavimo tinklą ir dokumentus, jungiančius skirtingus darbus. Galite nustatyti itin įtakingus mazgus, pastebėti mąstymo mokyklas ir, šiek tiek pasipraktikavus, tiksliai nustatyti dalis, kurios veikia kaip jungtys tarp skirtingų korpusų. Tai palengvina reikiamos informacijos paiešką. Svarbiausi straipsniai ir skersiniai tyrimų keliai.
Ar jus domina straipsnis, kurio platformoje nėra prieinamo PDF formatu? Nesijaudinkite: galite jo ieškoti leidėjo svetainėje, institucinėse saugyklose arba, jei bendradarbiaujate su universiteto biblioteka, paprašyti informacinių darbuotojų pagalbos, kaip gauti visą tekstą. „Semantic Scholar“ integravimas su šiais kanalais yra praktiškas būdas... uždarykite ciklą ir pasiekite turinį.
Naudingas patarimas: tyrinėdami naują temą, derinkite pradinę atranką su plačiais filtrais, o tada patikslinkite, nustatydami griežtesnes sąlygas (pvz., tik metodologinius straipsnius ar apžvalgas). Šis iteracinis metodas kartu su įtakos signalais ir citavimo stebėjimu padeda sukurti kokybišką bibliografiją ir... Subalansuokite gylį su aprėptimi.
„Google Scholar“ ir „PubMed“ skirtumai
„Google Scholar“ ir „PubMed“ yra ekosistemos ramsčiai, tačiau jų logika istoriškai rėmėsi citatų skaičiavimu, pažodiniu tekstu ir žodžių bendru vartojimu. „Semantic Scholar“ pristato dar vieną lygmenį: dirbtinio intelekto valdomą kontekstinį skaitymą, kuris bando suprasti dokumento reikšmę ir ryšius. Šis pakeitimas leidžia pertvarkyti rezultatus pagal įtakingiausius kiekviename pokalbyjene tik dažniausiai minimomis temomis.
Dar vienas privalumas yra kokybinis signalas apie straipsnio naudojimą darbuose, kuriuose jis cituojamas. Žinant, ar darbas įtrauktas kaip fonas, ar kaip metodas, atsiranda niuansų, kuriuos retai aptinka tradicinės paieškos sistemos. Kartu su vieno sakinio santraukomis ir objektų bei paveikslų išskyrimu tai suteikia greitą apžvalgą, kuri... pagreitina pradinį aktualumo vertinimą.
Tačiau praktiškiausias būdas yra juos naudoti papildomai: „Google Scholar“ dėl plačios bendros aprėpties, „PubMed“ – biomedicininėms paieškoms su terminologijos kontrole, o „Semantic Scholar“ – faktinei įtakai ir semantiniams ryšiams nustatyti. Juos derindami padidinate tikimybę nepraleisti nieko svarbaus ir... pirmiausia pasiekite daiktus, kurie turi įtakos.
Dažni naudojimo atvejai
Jei pradedate naują tyrimų sritį, galite naudoti vieno sakinio santraukas, kad greitai apžvelgtumėte. Tada, naudodami citavimo metriką ir įtakos žymas, patikslinate savo pasirinkimą, kol lieka pagrindinių straipsnių rinkinys. Šis darbo eiga suteikia greitą kelią pereinant nuo nulio prie mentalinio lauko žemėlapio per kelias valandas.
Kad neatsiliktumėte nuo aktualijos, citavimų pagal metus grafikas padeda nustatyti straipsnius, kurie ir toliau yra dažnai cituojami. Jei straipsnio kreivė išlieka stabili (ar net kylanti), tai reiškia, kad jis išlieka aktualus ir nusipelno vietos jūsų prioritetinės skaitymo literatūros sąraše. Šis skaitymas pagal laiką yra naudingas, kai atskirti trumpalaikes madą nuo ilgalaikių indėlių.
Rašant projektą ar ataskaitą, žymos „kur cituota“ yra neįkainojamos: jos patvirtina, kad metodas yra gerai žinomas, jei straipsnis dažnai cituojamas metodologijos skyriuose, arba kad teorija yra pagrįsta, jei ji dominuoja kontekstinėje informacijoje. Citavimas šiame kontekste suteikia įdomesnį pasakojimą apie [data/straipsnis/pateikta nuoroda]. įrodymų stiprumas ir valia.
Mokymo metu šios funkcijos padeda kurti vedamą skaitymą: galite išskirti straipsnius, cituojamus kaip teorinius pagrindus, ir kitus, naudojamus jų metodams. Be to, parodant ryšius tarp darbų, lengva kurti mokymosi kelius, paaiškinančius, kaip idėja vystosi skirtingose srityse. Tai daro „Semantic Scholar“... mokymo priemonė, tokia pat naudinga kaip ir pats vadovas.
„Semantic Scholar“ derina kiekybinius ir kokybinius signalus, išskiria reikšmes pasitelkdama dirbtinį intelektą ir struktūrizuoja literatūros naršymą pagal įtaką ir kontekstą. Kai reikia nustatyti laiko prioritetus, nustatyti tikrąjį poveikį ir sukurti gerai apgalvotą bibliografiją, ši platforma tampa neįkainojama sąjungininke. Tai sumažina triukšmą ir padeda sutelkti dėmesį į tai, kas svarbu..
Aistringas rašytojas apie baitų pasaulį ir technologijas apskritai. Man patinka dalytis savo žiniomis rašydamas, būtent tai ir darysiu šiame tinklaraštyje, parodysiu jums įdomiausius dalykus apie programėles, programinę įrangą, techninę įrangą, technologijų tendencijas ir kt. Mano tikslas – padėti jums paprastai ir smagiai naršyti skaitmeniniame pasaulyje.

