- Pretraživanje datoteka rješava segmentiranje, ugrađivanje i indeksiranje RAG-ova bez vlastite infrastrukture.
- Jasno određivanje cijena: plaćate samo indeksiranu naknadu (0,15 USD/1 milijun tokena), skladištenje i konzultacije bez dodatnih troškova.
- Uzemljenje s Google Pretraživanje pruža ažurne informacije i provjerljive web citate.

Dolazak pretraživanja datoteka u ekosustav Blizanci API To je promijenilo pravila igre za one koji žele stvarati RAG aplikacije bez sukoba infrastrukture. S ovom upravljanom uslugom, Google automatizira pohranu datoteka, segmentiranje, ugrađivanje i dinamičko ubrizgavanje konteksta u vremenu generiranja, tako da se možete usredotočiti na izgradnju proizvoda, a ne na postavljanje cjevovoda.
Osim unosa dokumenata, pretraživanje datoteka pruža napredno semantičko pretraživanjeKompatibilnost s raznim formatima, automatski citati i jednostavna struktura cijenaA ako vam trebaju ažurne informacije s weba, API i to nudi. google_search za uzemljenje pomoću Google pretrage, s vrlo korisni metapodaci za provjeru za sučelja s sljedivim terminima.
Što je točno pretraživanje datoteka u Gemini API-ju?
Pretraživanje datoteka je potpuno upravljano RAG rješenje Integrirano u Gemini API. U praksi, vi prenosite svoje datoteke (ili ih uvozite iz servisa za datoteke), a sustav se brine za ostalo. razbiti ih na fragmente, generirati ugradnje, indeksirati ih u Spremištu za pretraživanje datoteka i koristiti ih kao osnovu za odgovaranje na korisničke upite putem vektorsko pretraživanje.
Cilj je da se ne morate baviti Vektorske baze, redovi indeksiranja ili strategije grupiranja sami. Alat se temelji na Googleovom modelu ugrađivanja (na primjer, gemini-embedding-001) i izvorno se integrira s generateContentgdje izjavljujete Alat za pretraživanje datoteka i trgovina za provjeru.
Kako funkcionira: od dokumenta do kontekstualnog odgovora
Konceptualni tok je jednostavan, iako iza njega stoji mnogo sadržaja. Prvo, vaši dokumenti postaju numerički prikazi (ugrađivanja) koji hvataju značenje. Ti vektori pohranjeni su u specijaliziranoj pohrani. Zatim, kada pošaljete upit, API pretvara prompt u drugo ugrađivanje i izvršava semantičko pretraživanje kako bi se oporavili najrelevantniji dijelovi.
Konačno, u pozivu na generateContent s alatom od FileSearch, dodaš jedan Resurs za pretraživanje datoteka što ukazuje na određenu trgovinu. S time model zna da mora oporaviti kontekst iz vaše trgovine i koristite ga za potporu svom odgovoru. Sve se to događa bez potrebe za ručnim zakazivanjem oporavka ili korištenjem vanjskih usluga.
Prijenos i uvoz dokumenata: dva kompatibilna puta
Za unos podataka u vašu trgovinu imate dvije mogućnosti. Ako želite odmah doći do stvari, koristite API. uploadToFileSearchStore za izravno prenesite datoteku i indeksirajte je u jednoj operaciji. Ako želite odvojiti korake, možete prenijeti datoteku pomoću API-ja za datoteke, a zatim uvesti ga s importFile u trgovinu za pretraživanje datoteka.
Kada odaberete istovremeni prijenos i uvoz, File privremeno kao referenca na sirovi dokument; to Predmet se uklanja nakon 48 sati.Međutim, indeksirani podaci ostaju u spremištu dok ih ne odlučite izbrisati. Ako Koristite Files API A zatim uvozite; cjevovod prolazi kroz pohranu datoteka prije faze ugrađivanja.
Kontrola komadanja: preciznost i preklapanje
Prema zadanim postavkama, API odlučuje o strategiji inteligentno rezanjeAli ako trebate fino podešavanje, možete odrediti chunking_config s parametrima kao što su maksimalan broj tokena po fragmentu y preklapajućih tokenaS manje tokena po bloku dobit ćete granularnost u pretraživanju; s više, zadržat ćete više konteksta po fragmentu.
Ova fina kontrola je korisna u slučajevima kao što su Izvorni kod, opsežni radovi ili tehnički priručnicigdje je preporučljivo prilagoditi ravnotežu između točnosti pretraživanja i kontekstualnog kontinuiteta.
Spremišta za pretraživanje datoteka: Trajnost, opseg i upravljanje
Spremište za pretraživanje datoteka je trajni spremnik u kojem se nalaze spremišta za pretraživanje datoteka. obrađeni ugradbeZa razliku od sirovih datoteka API-ja Files (koje nestaju nakon 48 sati), sadržaj uvezen u trgovinu Zadržava se dok se izričito ne izbrišeMožete stvoriti više trgovina za organiziranje svojih domena znanja, a njihova imena su globalno jedinstven.
API za FileSearchStore to vam omogućuje stvaranje, popisivanje, dohvaćanje i brisanje trgovinaOsim toga, postoji API za dokumente za upravljanje sadržajem unutar svake trgovine, a možete priložiti prilagođeni metapodaci (parovi ključ-vrijednost) u vaše datoteke za filtriranje pretraga po podskupovima. Za filtar se koristi sintaksa popisi filtera opisano u google.aip.dev/160.
Detaljan tijek korištenja API-ja
U operativnom smislu, tipičan proces slijedi tri koraka. Prvo, Izrađujete pohranu za pretraživanje datoteka, Nakon, prijenos i uvoz datoteka (Ili prenesete, a zatim uvozite). Konačno, ispitivanje prema modelu s generateContent označavajući alat FileSearch i odredišnu trgovinu putem FileSearchRetrievalResource.
U JavaScript/TypeScript okruženjima, uobičajena praksa je korištenje istodobne operacije (na primjer, Promise.all) za istovremeno učitavanje više datoteka i praćenje operation.done Prije nego što nastavite. Također je uobičajeno tražiti trgovinu po njenom prikazno ime (čitljivo ljudima) ako se ne sjećate identifikatora fileSearchStores/....
Upravljanje dokumentima: pronalaženje, ažuriranje i brisanje
Unutar trgovine ponekad je korisno pronaći određeni dokument po njegovom prikazno ime upravljati time. Jedan važan detalj: dokumenti su nepromjenjivi nakon indeksiranja. Ako ih trebate ažurirati, preporučeni uzorak je izbriši i ponovno prenesi nova verzija.
Kao operativna praksa, mnogi tijekovi rada automatiziraju ovaj ciklus: pretraži → izbriši → prenesiA kada završite s resursima (na primjer, u razvoju), zapamtite da postoji ograničenje 10 trgovina po projektuStoga ih je dobro očistiti ako vam više nisu potrebni.
Citati i provjera: utemeljenje u vašim dokumentima
Ključna prednost pretraživanja datoteka je ta što odgovori modela mogu uključivati automatski citati koji označavaju fragmente vaših dokumenata korištene za potporu izlazu. Ova sljedivost pojavljuje se u atributu grounding_metadata odgovora i ključan je za revizija, provjera i povjerenje u poslovnim okruženjima.
Na ovaj način, kada asistent odgovori, moći ćete prikaži precizne reference na relevantne dijelove vaših datoteka, što olakšava pregled zahtjeva i izgradnju sučelja s citatima na liniji.
Podržani formati datoteka
Pretraživanje datoteka podržava širok izbor formataMeđu najčešćima su application/pdf, application/vnd.openxmlformats-officedocument.wordprocessingml.document (DOCX), application/vnd.openxmlformats-officedocument.spreadsheetml.sheet (XLSX), application/vnd.openxmlformats-officedocument.presentationml.presentation (PPTX), application/json, application/xml, application/zip, uz mnoge jezike programiranje y vrste teksta kao text/plain, text/html, text/css, text/csv, text/markdown, text/javascript, text/yaml, Itd
Također pokriva brojne specifične vrste (npr. kod i skripte kao application/x-php, application/x-powershell, application/x-sh, application/x-tex, application/x-zsh; i tekstualni kao text/x-python, text/x-java, text/x-ruby-script, text/x-rust, text/x-go, text/x-kotlin, text/x-sql, text/x-c, text/x-csharp, text/x-swift, text/x-tex, text/x-scss, text/x-tcl, text/x-asm(između mnogih drugih). Ako vaš slučaj zahtijeva neuobičajenu vrstu, najvjerojatnije je da je promišljao u službenoj dokumentaciji.
Ograničenja usluga i arhitektonske preporuke
Kako bi se održala stabilnost usluge, API postavlja jasna ograničenja: Maksimalna veličina datoteke je 100 MBUkupna dodana veličina u trgovinama ovisi o razini korisnika: 1 GB besplatno, Razina 1 10 GB, Razina 2 100 GB y Razina 3 1 TB.
Kao smjernica za izvedbu preporučuje se neka svaka trgovina bude manja od 20 GB Kako bi se osigurala optimalna latencija. Imajte na umu da se veličina trgovine izračunava u pozadini kao ulazna veličina. plus ugradnjekoje obično množe približno s tri izvorni volumen podataka.
Cijene: jednostavne i predvidljive
Model plaćanja je direktan: Plaćate samo za izradu ugradbi u indeksiranju.po cijeni od 0,15 USD za milijun tokena (ovisno o primjenjivom trošku modela ugradnje). skladištenje i generiranje ugradbi u upitu Nemaju dodatnih troškova, a oporavljeni tokeni Naplaćuju se kao normalni kontekstualni tokeni nakon generiranja.
Ova shema olakšava proračun: glavni trošak koncentriran je u početni unos (i u naknadnim ažuriranjima dokumenata, ako ih bude), minimizirajući iznenađenje u potrošnji po broju upita.
Kompatibilni modeli za pretraživanje datoteka
Alat radi s trenutnim modelima iz Gemini obitelji. Referentni materijali ističu njegovu dostupnost u Gemini 2.5 Pro y Gemini 2.5 Flash za pretraživanje datoteka, s podrškom za uzemljenje, filteri metapodataka i citati kako bi se izgradila provjerljiva iskustva.
Što se tiče uzemljenja pomoću Google pretraživanja (o čemu će biti riječi u nastavku), postoji širi raspon podržanih modela, a navedeno je da Eksperimentalni i pregledni modeli Nisu uključeni.
Uzemljenje uz Google pretraživanje: trenutne informacije i web citati
Ako vam je uz dokumente potrebna web sadržaj u stvarnom vremenuAlat možete aktivirati google_searchModel upravlja cijeli tokodlučiti je li prikladno pretraživati, generirati i izvršavati upite, obrađivati rezultate, sintetizirati i vratiti odgovor s uzemljenim metapodacima (konzultacije, rezultati i citati).
Kada je uzemljenje ispravno izvedeno, odziv uključuje groundingMetadata s poljima poput webSearchQueries (korištene konzultacije), searchEntryPoint (HTML i CSS potrebni su za prijedloge pretraživanja, a uvjeti korištenja detaljno su opisani u Uvjetima pružanja usluge), uzemljenje komada (web izvori s uri y title) Y uzemljenjePodrška (fragmenti koji povezuju tekstualne segmente modela s indeksima groundingChunks graditi online citati).
Cijene i modeli uzemljenja pomoću Google pretraživanja
El uso google_search dostavnica za svaki zahtjev koji aktivira taj alat, čak i ako model pokrene nekoliko internih upita za isti zahtjev; sve se to računa kao jednokratna naplativa upotrebaModeli kompatibilni s ovim alatom navedeni su u nastavku. Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash-Lite, Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash.
Za modele starije od verzije 1.5 postoji stari alat. google_search_retrieval s načinom rada dinamičangdje konfigurirate dinamički_prag (0.0–1.0) i model odlučuje hoće li izvršiti pretraživanje na temelju svojih povjerenje gdje su vam potrebne ažurne informacije.
Primjeri upotrebe: od internih asistenata do korisničke podrške
Pretraživanje datoteka usmjereno je na poslovna okruženja gdje su privatnost, točnost i sljedivost važni. Korisno je za znanstvene radnike koji ispituju vlasničku dokumentaciju, na primjer automatizirati podršku s odgovorima navedenim iz priručnika i politika ili za ubrzanje pretraživanje i pregled u sektorima koji intenzivno koriste informacije (pravni, zdravstveni, financijski).
Također ubrzava protok razvoj i ispravljanje pogrešaka omogućujući interakciju s kodnim bazama ili tehničkim specifikacijama. Njegova kombinacija s drugim Gemini mogućnostima (kao što je izvršavanje koda ili funkcije) omogućuje bogate integracije u procesima usklađenosti, revizije ili analitike.
Operacije i status: rad s API-jem
REST površina otkriva metode kao što su fileSearchStores.create (stvara praznu trgovinu), fileSearchStores.delete (uklanja trgovinu), fileSearchStores.get (dobiva informacije iz trgovine), fileSearchStores.list (navodi korisničke trgovine) i importFile (važno je File (od servisa datoteka do pohrane). Krajnje točke operacije omogućuju vam da provjerite status dugoročne operacije, s obrascima za prijavu koji u nekoliko slučajeva idu prazan prema specifikaciji.
Na direktnoj uzbrdici (uploadToFileSearchStoreSkup operacije Posebno dizajniran za mjerenje napretka. Ovaj obrazac je tipičan: koplja operacija, provjeravate periodično ako je završeno i kada dovršiti, nastavljate s tokom (na primjer, pokretanje RAG upita).
Najbolje prakse: filtri, označavanje i latencija
Ako očekujete mnogo upita, označite svoje dokumente s metapodataka i zaposliti metadataFilter ograničiti pretraživanje na relevantne podskupove. Držite pohrane unutar preporuka veličine Pomaže s latencijom i stabilnošću. A ako ćete puniti pune mapeIskorištava istodobni porast kako bi se smanjilo vrijeme gutanja.
U tehničkim scenarijima definirajte strategije grupiranja primjereno sadržaju: na primjer, kraći dijelovi s umjerenim preklapanjem za šifra (bolja preciznost u funkcijama/klasama) i nešto duži dijelovi u narativna dokumentacija kako bi se sačuvao semantički kontekst.
Kompatibilnost s drugim Gemini alatima
Uzemljenje s Google pretraživanjem može se kombinirati s Kontekst URL-a (za navođenje određenih URL-ova) i s izvođenje koda ili dodatne funkcije alata ovisno o slučaju upotrebe. To vam omogućuje kombiniranje. insajdersko znanje Pretraživanje datoteka s ažurirane informacije s weba, uvijek uz održavanje citata i tragova izvora.
Prilikom dizajniranja UX-a, iskoristite prednosti uzemljenjePodrška y uzemljenje komada ponuditi citati na koje se može kliknuti uz tekst modela. Ovo je najjasniji način za korisnike da provjere izvor svake izjave.
Pretraživanje datoteka u Gemini API-ju nudi vrlo izravan način opremanja vaših aplikacija s dobro obrazloženi odgovori u vašim vlastitim podacima, minimizirajući operativno trenje. Njegova kombinacija Predvidljivi troškovi indeksiranja, podrška za različite formate, filteri metapodataka, automatsko citiranje i uzemljenje pomoću Google pretraživanja Formira stog spreman za produkciju koji smanjuje pritisak na implementaciju RAG-a u timovima svih veličina.
Strastveni pisac o svijetu bajtova i tehnologije općenito. Volim dijeliti svoje znanje pisanjem, a to je ono što ću učiniti na ovom blogu, pokazati vam sve najzanimljivije stvari o gadgetima, softveru, hardveru, tehnološkim trendovima i još mnogo toga. Moj cilj je pomoći vam da se snađete u digitalnom svijetu na jednostavan i zabavan način.