- Libreng akademikong search engine na gumagamit IA upang unahin ang impluwensya at konteksto.
- Mga sukatan ng pagsipi na may detalye ng husay: impluwensya at seksyon kung saan ito binanggit.
- Mga buod ng isang pangungusap at pagkuha ng entity para sa mabilis na pagtatasa ng kaugnayan.

Kapag ang dami ng siyentipikong publikasyon ay patuloy na lumalaki, ang paghahanap ng pangunahing artikulo ay maaaring maging isang odyssey. Dito pumapasok ang Semantic Scholar, isang libreng akademikong search engine na naaangkop artipisyal na katalinuhan upang matuklasan at maunawaan ang pananaliksik mas mabilis at may kaunting ingay sa dokumentasyon kaysa sa mga tradisyonal na makina.
Higit pa sa simpleng listahan ng mga resulta, isinasama ng serbisyong ito ang mga de-kalidad na insight gaya ng bilang ng mga quote, konteksto ng mga quote na iyon, at napaka-condensed na buod ng isang pangungusap. Salamat sa machine learning, natural na pagpoproseso ng wika, at mga diskarte sa computer vision, nagagawa nito upang kunin ang makabuluhang koneksyon sa pagitan ng mga gawa, may-akda, at mga paksaginagawang mas mahusay ang pagba-browse sa panitikan.
Ano ang Semantic Scholar at para saan ito ginagamit?
Ang Semantic Scholar ay isang pang-agham na tool sa paghahanap at pagtuklas, isang halimbawa sa mga mga uri ng mga search engine dalubhasa, pinalakas ng Allen Institute for AI (AI2). Ang layunin nito ay pabilisin ang pagsulong ng kaalaman sa pamamagitan ng pagtulong sa mga mananaliksik, guro, at mag-aaral na mahanap at maunawaan ang nauugnay na gawain. Ito ay libre; magagamit mo ito sa pamamagitan ng pagrehistro gamit ang isang account. Google o institusyonal, at noong 2020 ay lumampas ito pitong milyong buwanang gumagamit, tanda ng interes na pinupukaw nito sa komunidad.
Ang platform ay nagsisilbing tulay sa pagitan mo at ng tunay na may-katuturang impormasyon: nagbibigay-daan ito sa iyong mag-filter ayon sa pagkaka-akda, pag-access sa PDF, lugar ng kaalaman o uri ng publikasyon, at nagmumungkahi ng mga kaugnay na pagbabasa batay sa iyong mga interes. Ang lahat ng ito ay may layuning bawasan ang labis na impormasyon at unahin ang pinaka-maimpluwensyang mga gawa sa bawat paksahindi lamang ang pinakamadalas na binanggit sa isang krudong paraan.
Para makamit ito, ginagamit nito ang kumbinasyon ng machine learning, NLP, at computer vision. Gamit ang mga diskarteng ito, bumubuo ito ng mga buod ng isang pangungusap gamit ang abstractive na diskarte, at tinutukoy din ang mga entity (hal., mga compound, organismo, o pangunahing konsepto) at mga visual na elemento sa loob ng mga artikulo. Sa madaling salita, nagdaragdag ito ng semantic layer na nagbibigay-daan dito unawain ang kahulugan ng nilalaman at hindi lamang ang mga salita.
Ang bawat tala sa kanilang database ay may natatanging identifier na tinatawag na S2CID (Semantic Scholar Corpus ID). Pinapadali ng identifier na ito ang pagre-refer, pagsubaybay sa bersyon, at pag-link sa iba pang mga database. Kaya, kapag nakahanap ka ng isang partikular na gawa, mayroon kang isang hindi malabo na tag upang banggitin o kunin ito, na tumutulong upang Iwasan ang kalabuan sa pagitan ng mga artikulong may magkatulad na pamagat.
Kung ikukumpara sa Google Scholar o PubMed, malinaw ang pagkakaiba sa diskarte: bilang karagdagan sa pagbibilang ng mga pagsipi at pagsusuri sa mga magkakasamang pangyayari, itinatampok ng Semantic Scholar ang pinakamahalagang aspeto ng bawat lugar at gumuhit ng mga ugnayan sa pagitan ng mga publikasyon gamit ang mga algorithm na isinasaalang-alang ang konteksto. Sa ganitong paraan, nag-aalok ito ng mga resulta na Inuna nila ang kaugnayan at tunay na impluwensya. sa loob ng isang siyentipikong pag-uusap.
Paano ito gumagana: mga signal, quote, at mga indicator ng kalidad
Kapag nagsagawa ka ng paghahanap at nagbukas ng tala, makikita mo na ang bilang ng mga pagsipi ay karaniwang malinaw na ipinapakita. Ang isang kapaki-pakinabang na tampok ay ang pag-hover ng iyong mouse sa numerong ito ay nagpapakita ng taunang trend ng pagsipi sa isang graph. Ang mabilis na pagkilos na ito ay nagpapakita ng kasaysayan ng artikulo sa paglipas ng panahon, na nagbibigay-daan sa iyong... tuklasin ang mga taluktok ng interes o mga panahon ng katatagan.
Kung i-hover mo ang iyong cursor sa mga bar sa graph, lilitaw ang mga halaga para sa bawat taon. Nakakatulong ito sa pagsagot sa mga tanong tulad ng: Binabanggit pa rin ba ito? Nagkaroon ba ito ng malaking epekto sa simula at pagkatapos ay bumaba, o nagpapanatili ba ito ng matagal na interes? Ang katotohanan na ang isang akda ay patuloy na binabanggit ngayon ay isang mahusay na tagapagpahiwatig ng kaugnayan nito at maaaring ipangatuwiran sa salaysay ng pagsusuri bilang patunay na ang kanilang mga kontribusyon ay patuloy na kapaki-pakinabang.
Ang pag-click sa pamagat ng artikulo ay nagbibigay sa iyo ng access sa mas detalyadong impormasyon: isang buod, magagamit na mga link (halimbawa, sa mga bersyon ng PDF o ang publisher), nabanggit na mga artikulo, at mga nauugnay na artikulo. Ang panel na ito ay nagsisilbing pundasyon para sa karagdagang pagbabasa at, sa ilang mga pag-click lamang, pagbuo ng isang solidong hanay ng mga sanggunian, lahat sa loob ng isang interface na idinisenyo para sa kadalian ng paggamit. mabawasan oras maghanap at i-maximize ang kaugnayan.
Sa kanang sulok sa itaas, karaniwang lumalabas ang isang bloke na may maraming data ng pagsipi. Kabilang sa mga ito, namumukod-tangi ang mga mataas na maimpluwensyang pagsipi—iyon ay, pagbanggit ng mga gawa kung saan nagkaroon ng malaking epekto ang artikulo. Higit pa rito, ipinapakita nito kung saan binanggit ang artikulo sa loob ng mga dokumentong binabanggit (halimbawa, mga seksyon tulad ng Background o Mga Paraan), isang napaka-kapaki-pakinabang na pahiwatig para maunawaan kung ang isang artikulo ay ginagamit bilang pinagmulan. teoretikal na balangkas, pamamaraan o kritikal na resulta.
Kinukumpleto ng mga qualitative signal na ito ang kabuuang bilang ng mga pagsipi na may konteksto. Ang pag-alam na ang isang pag-aaral ay paulit-ulit na binabanggit sa seksyon ng mga pamamaraan ay hindi katulad ng pagbanggit lamang sa seksyon ng background. Samakatuwid, kapag inilalarawan ang kalidad ng isang kontribusyon, ipinapayong banggitin pareho ang dami at ang konteksto ng mga pagsipi na ito, na isinasama ang data na ito sa isang malinaw na salaysay ng epekto at kaugnayan.
Ang pag-prioritize ng mga resulta ay umaasa sa mga modelong nauunawaan ang nilalaman sa antas ng semantiko. Hindi lang sila nagbibilang ng mga salita, ngunit sinusuri din ang mga ugnayan sa pagitan ng mga konsepto, nakakakita ng mga entity, at nakikilala ang mga numero. Sa ganitong paraan, lumilitaw ang mga koneksyon sa pagitan ng mga linya ng pananaliksik, mga may-akda, at mga journal, na nagbibigay-daan para sa pagtuklas ng mga alternatibong landas sa pagbabasa at tulay ang mga artikulo sa pagitan ng mga subfield.
Corpus coverage at ebolusyon ng proyekto
Inilunsad ang Semantic Scholar noong 2015 mula sa Allen Institute para sa AI, na may paunang pagtuon sa computer science. Simula noon, ang saklaw nito ay patuloy na lumalaki at nag-iba-iba, na nagiging isang mapagkukunan para sa mga naghahanap ng mabilis at insightful na mga lokasyon ng mga pangunahing literatura, na may patuloy na pagsisikap na palawakin ang mga field at pagbutihin ang karanasan ng user.
Noong 2017, inanunsyo ng koponan ang isang malaking pagpapalawak sa biomedicine, na nagdaragdag ng humigit-kumulang 26 milyong biomedical na gawa sa 12 milyon na sakop na nito mula sa ibang mga lugar. Ang pinahusay na bersyong ito ay may kasamang mas pinakintab na interface, pampakay na pagkakategorya, at pagtuklas ng mga nauugnay o nagte-trend na paksa. Ang pinuno ng proyekto noong panahong iyon, si Marie Hagman, ay nagbigay-diin na ang layunin ay upang mapadali ang pag-navigate ayon sa paksa at pagtuklas ng mga umuusbong na hangganan sa pananaliksik.
Noong Enero 2018, ang corpus ay lumampas sa 40 milyong mga artikulo sa buong computer science at biomedicine. Di-nagtagal pagkatapos, noong Marso ng parehong taon, si Doug Raymond—responsable para sa mga pagkukusa sa machine learning sa Alexa platform—ay sumali upang pamunuan ang proyekto. Ang pagpapalakas ng organisasyong ito ay nagpatibay sa pagtuon sa paggamit ng AI upang pagbutihin ang kaugnayan at scalability ng system.
Ang paglago ay pinabilis noong 2019 sa pagdaragdag ng mga talaan mula sa Microsoft Academic. Noong Agosto ng taong iyon, ang bilang ng mga artikulo ay lumampas sa 173 milyon, isang quantitative leap na nagpatibay sa posisyon ng Semantic Scholar bilang isa sa mga nangungunang online na mapagkukunan para sa larangan. mas malalaking database na may mas magandang semantic signal magagamit sa siyentipikong komunidad.
Kasabay nito, kinailangan ng platform na i-navigate ang hamon ng sumasabog na paglaki ng panitikan: higit sa tatlong milyong artikulo ang nai-publish taun-taon sa libu-libong mga journal. Ginagawang kumplikado ng volume na ito ang pagsubaybay, kaya naman napakahalaga ng misyon ng pagbibigay-priyoridad at pagkonekta ng mga pangunahing piraso, dahil nakakatipid ng oras at nakakabawas ng ingay sa literature review.
Mga kapaki-pakinabang na tool at filter sa paghahanap
Upang pinuhin ang mga resulta, ang mga filter ay mahalaga. Maaari mong limitahan ayon sa co-authorship, pagkakaroon ng PDF, disiplina, uri ng publikasyon, o petsa, bukod sa iba pang pamantayan. Ang paggamit ng mga ito sa kumbinasyon ay nagbibigay-daan sa iyong bumuo ng mga tumpak na query, halimbawa: bukas na access na mga artikulo, sa loob ng isang partikular na hanay ng taon, at isinulat ng isang partikular na koponan. Ang kumbinasyong ito ng mga filter, kapag inilapat nang tama, ay a Napakahusay na pingga upang mahanap ang talagang kailangan mo.
Ang platform ay nagmumungkahi din ng mga nauugnay na may-akda at artikulo batay sa iyong kasaysayan ng paghahanap. Ang mga rekomendasyong ito ay hindi mga generic na listahan: nakabatay ang mga ito sa mga pattern ng semantiko at mga network ng pagsipi, kaya may posibilidad silang mag-alis ng mga thread na maaaring hindi mo napag-isipan. Sa pagsasagawa, ang mga mungkahing ito ay nagbibigay-daan sa iyo na sundin ang isang napaka-mabungang landas sa pagbabasa at palawakin ang saklaw ng isang sistematikong pagsusuri.
Isa sa mga lakas ng Semantic Scholar ay kung paano nito nakikita ang citation network at ang mga dokumentong nag-uugnay sa iba't ibang mga gawa. Maaari mong tukuyin ang mataas na maimpluwensyang mga node, tuklasin ang mga paaralan ng pag-iisip, at, sa ilang pagsasanay, matukoy ang mga piraso na nagsisilbing bisagra sa pagitan ng iba't ibang corpora. Ginagawa nitong mas madaling mahanap ang nauugnay na impormasyon. seminal paper at transversal na mga ruta ng pananaliksik.
Interesado ka ba sa isang artikulo na walang naa-access na PDF sa platform? Huwag mag-alala: maaari mong hanapin ito sa website ng publisher, sa mga institutional na repository, o, kung nagtatrabaho ka sa isang library ng unibersidad, humingi ng gabay sa reference staff sa pagkuha ng buong text. Ang pagsasama ng Semantic Scholar sa mga channel na ito ay isang praktikal na paraan upang isara ang loop at i-access ang nilalaman.
Isang kapaki-pakinabang na tip: Kapag nag-e-explore ng bagong paksa, pagsamahin ang isang paunang screening na may malalawak na mga filter at pagkatapos ay pinuhin gamit ang mas mahigpit na mga kundisyon (hal., mga artikulo o review lang sa pamamaraan). Ang umuulit na diskarte na ito, kasama ang mga signal ng impluwensya at pagsubaybay sa pagsipi, ay tumutulong sa iyo na bumuo ng isang de-kalidad na bibliograpiya at Balansehin ang lalim na may saklaw.
Mga pagkakaiba sa Google Scholar at PubMed
Ang Google Scholar at PubMed ay mga haligi ng ecosystem, ngunit ang kanilang lohika ay dating umasa sa pagbibilang ng mga pagsipi, literal na teksto, at paggamit ng salita. Ang Semantic Scholar ay nagpapakilala ng isa pang layer: isang AI-powered contextual reading na sumusubok na maunawaan ang kahulugan at koneksyon ng dokumento. Ang pagbabagong ito ay nagpapahintulot muling ayusin ang mga resulta patungo sa pinaka-maimpluwensyang sa bawat pag-uusaphindi lamang tungo sa pinakamadalas na binanggit na mga paksa.
Ang isa pang bentahe ay ang qualitative signal hinggil sa paggamit ng isang artikulo sa mga akdang binabanggit ito. Ang pag-alam kung ang isang gawa ay isinama bilang background o bilang isang pamamaraan ay nagbibigay ng mga nuances na bihirang makuha ng mga tradisyunal na search engine. Kasama ng mga buod ng isang pangungusap at ang pagkuha ng mga entity at figure, nagbibigay ito ng mabilis na pangkalahatang-ideya na pinapabilis ang paunang pagtatasa ng kaugnayan.
Gayunpaman, ang pinakapraktikal na diskarte ay ang paggamit sa mga ito sa isang komplementaryong paraan: Google Scholar para sa napakalaking pangkalahatang saklaw nito, PubMed para sa biomedical na mga paghahanap na may kontrol sa terminolohiya, at Semantic Scholar upang unahin ang aktwal na impluwensya at semantic na koneksyon. Sa pamamagitan ng pagsasama-sama ng mga ito, pinapataas mo ang posibilidad na hindi nawawala ang anumang bagay na kritikal at ng pumunta sa mga item na gumawa ng pagkakaiba muna.
Mga karaniwang kaso ng paggamit
Kung nagsisimula ka ng isang bagong linya ng pananaliksik, maaari mong gamitin ang isang-pangungusap na mga buod para sa isang mabilis na panimulang panlasa. Pagkatapos, gamit ang mga sukatan ng pagsipi at mga tag ng impluwensya, pinipino mo ang iyong pinili hanggang sa maiwan ka ng isang hanay ng mga pangunahing artikulo. Nag-aalok ang workflow na ito ng mabilis na track sa mula sa zero hanggang sa isang mental na mapa ng larangan sa ilang oras.
Upang manatiling napapanahon, ang mga pagsipi-sa-taon na graph ay tumutulong na matukoy ang mga papel na patuloy na binabanggit nang madalas. Kung ang isang papel ay nagpapanatili ng isang matatag (o kahit na pataas) na kurba, ito ay isang senyales na ito ay nananatiling may kaugnayan at karapat-dapat sa isang lugar sa iyong priority reading list. Ang pagbabasa na ito batay sa oras ay kapaki-pakinabang para sa pag-iiba ng mga lumilipas na uso mula sa pangmatagalang kontribusyon.
Sa pagsulat ng proyekto o ulat, ang mga tag na 'kung saan binanggit' ay napakahalaga: binibigyang-katwiran nila na ang isang pamamaraan ay mahusay na itinatag kung ang artikulo ay madalas na binabanggit sa mga seksyon ng pamamaraan, o na ang isang teorya ay may matatag na batayan kung ito ay nangingibabaw sa background na impormasyon. Ang pagbanggit sa loob ng kontekstong ito ay nag-aalok ng mas nakakahimok na salaysay tungkol sa ang lakas at halaga ng ebidensya.
Sa pagtuturo, nakakatulong ang mga feature na ito na bumuo ng mga guided reading: maaari mong i-highlight ang mga artikulong binanggit bilang theoretical foundation at iba pang ginagamit para sa kanilang mga diskarte. Higit pa rito, sa pamamagitan ng pagpapakita ng mga koneksyon sa pagitan ng mga gawa, madaling magdisenyo ng mga landas sa pag-aaral upang ipaliwanag kung paano umuusbong ang isang ideya sa mga subfield. Ginagawa nitong ang Semantic Scholar a isang kasangkapan sa pagtuturo na kasing pakinabang ng manwal mismo.
Pinagsasama ng Semantic Scholar ang mga quantitative at qualitative na signal, kinukuha ang kahulugan gamit ang AI, at binubuo ang pag-navigate sa literatura sa paligid ng impluwensya at konteksto. Kapag kailangan mong unahin ang oras, alamin ang tunay na epekto, at bumuo ng isang pinag-isipang mabuti na bibliograpiya, ang platform na ito ay nagiging isang napakahalagang kaalyado. Binabawasan nito ang ingay at nakatutok sa kung ano ang mahalaga..
Masigasig na manunulat tungkol sa mundo ng mga byte at teknolohiya sa pangkalahatan. Gustung-gusto kong ibahagi ang aking kaalaman sa pamamagitan ng pagsusulat, at iyon ang gagawin ko sa blog na ito, ipakita sa iyo ang lahat ng mga pinaka-kagiliw-giliw na bagay tungkol sa mga gadget, software, hardware, teknolohikal na uso, at higit pa. Ang layunin ko ay tulungan kang mag-navigate sa digital na mundo sa simple at nakakaaliw na paraan.

