- Pretraga datoteka rješava segmentiranje, ugrađivanje i indeksiranje RAG-ova bez vlastite infrastrukture.
- Jasno određivanje cijena: plaćate samo indeksiranu naknadu (0,15 USD/1 milion tokena), skladištenje i konsultacije bez dodatnih troškova.
- Uzemljenje sa Google Pretraga pruža ažurne informacije i provjerljive web citate.
Dolazak pretrage datoteka u ekosistem Blizanci API To je promijenilo pravila igre za one koji žele kreirati RAG aplikacije bez infrastrukturnih konflikata. S ovom upravljanom uslugom, Google automatizira pohranu datoteka, segmentiranje, ugrađivanje i dinamičko ubrizgavanje konteksta u vremenu generiranja, tako da se možete usredotočiti na izgradnju proizvoda, a ne na postavljanje cjevovoda.
Pored unosa dokumenata, Pretraga datoteka pruža napredna semantička pretragaKompatibilnost s različitim formatima, automatsko citiranje i jednostavna struktura cijenaA ako vam trebaju ažurne informacije s weba, API i to nudi. google_search za uzemljenje pomoću Google pretrage, sa vrlo korisni metapodaci za verifikaciju za interfejse sa sljedivim terminima.
Šta je tačno pretraga datoteka u Gemini API-ju?
Pretraga datoteka je potpuno upravljano RAG rješenje Integrisano u Gemini API. U praksi, vi otpremate svoje datoteke (ili ih uvozite iz servisa za datoteke), a sistem se brine o ostalom. razbiti ih na fragmente, generirati ugradnje, indeksirati ih u skladištu za pretraživanje datoteka i koristiti ih kao osnovu za odgovaranje na korisničke upite putem vektorsko pretraživanje.
Cilj je da se ne morate baviti Vektorske baze, redovi indeksiranja ili strategije grupiranja sami. Alat se zasniva na Googleovom modelu ugrađivanja (na primjer, gemini-embedding-001) i izvorno se integrira sa generateContentgdje izjavljujete Alat za pretragu datoteka i prodavnicu da provjerim.
Kako funkcioniše: od dokumenta do kontekstualnog odgovora
Konceptualni tok je jednostavan, iako iza njega stoji mnogo suštine. Prvo, vaši dokumenti postaju numeričke reprezentacije (ugrađivanja) koji obuhvataju značenje. Ovi vektori se čuvaju u specijalizovanom skladištu. Zatim, kada pošaljete upit, API pretvara prompt u drugo ugrađivanje i izvršava semantička pretraga da se oporave najrelevantniji dijelovi.
Konačno, u pozivu na generateContent s alatom od FileSearch, dodaš jedan Resurs za pretraživanje datoteka što ukazuje na određenu trgovinu. S tim, model zna da mora oporaviti kontekst iz vaše trgovine i koristite ga za podršku vašem odgovoru. Sve se ovo događa bez potrebe da zakazujete ručni oporavak ili koristite vanjske usluge.
Otpremanje i uvoz dokumenata: dva kompatibilna puta
Da biste podatke unijeli u svoju trgovinu, imate dvije opcije. Ako želite odmah preći na stvar, koristite API. uploadToFileSearchStore para direktno prenesite datoteku i indeksirajte je u jednoj operaciji. Ako želite odvojiti korake, možete prenijeti datoteku pomoću API-ja za datoteke, a zatim uvesti ga con importFile u trgovinu za pretraživanje datoteka.
Kada odaberete istovremeno otpremanje i uvoz, File privremeno kao referenca na sirovi dokument; to Predmet se uklanja nakon 48 sati.Međutim, indeksirani podaci ostaju u skladištu sve dok ih ne odlučite izbrisati. Ako Koristite Files API A onda uvozite; cjevovod prolazi kroz pohranu datoteka prije faze ugrađivanja.
Kontrola komadanja: preciznost i preklapanje
Podrazumevano, API odlučuje o strategiji inteligentno rezanjeAli ako trebate fino podešavanje, možete odrediti chunking_config sa parametrima kao što su maksimalan broj tokena po shardu y preklapajućih tokenaSa manje tokena po bloku dobit ćete granularnost u pretrazi; sa više, zadržat ćete više konteksta po fragmentu.
Ova fina kontrola je korisna u slučajevima kao što su Izvorni kod, opsežni radovi ili tehnički priručnicigdje je preporučljivo prilagoditi ravnotežu između tačnosti pretraživanja i kontekstualnog kontinuiteta.
Spremišta za pretraživanje datoteka: Perzistentnost, opseg i upravljanje
Skladište za pretraživanje datoteka je trajni kontejner u kojem se nalaze skladišta za pretraživanje datoteka. obrađena ugrađivanjaZa razliku od sirovih Files API datoteka (koje nestaju nakon 48 sati), sadržaj uvezen u trgovinu Zadržava se dok se eksplicitno ne izbrišeMožete kreirati više skladišta za organizaciju svojih domena znanja, a njihova imena su globalno jedinstven.
API za FileSearchStore to vam dozvoljava kreiranje, listanje, preuzimanje i brisanje trgovinaOsim toga, postoji API za dokumente za upravljanje sadržajem unutar svake trgovine, a možete ih i priložiti prilagođeni metapodaci (parovi ključ-vrijednost) u vaše datoteke za filtriranje pretraga po podskupovima. Za filter se koristi sintaksa liste filtera opisano u google.aip.dev/160.
Detaljan tok korištenja API-ja
U operativnom smislu, tipičan proces slijedi tri koraka. Prvo, Kreirate skladište za pretraživanje datoteka. Nakon, otpremanje i uvoz datoteka (Ili otpremite, a zatim uvezite). Konačno, ispitivanje do modela sa generateContent označavajući alat FileSearch i odredišnu trgovinu putem FileSearchRetrievalResource.
U JavaScript/TypeScript okruženjima, uobičajena praksa je korištenje istovremene operacije (npr. Promise.all) za istovremeno učitavanje više datoteka i praćenje operation.done Prije nego što nastavimo. Također je uobičajeno tražiti trgovinu po njenom displayName (čitljivo ljudima) ako se ne sjećate identifikatora fileSearchStores/....
Upravljanje dokumentima: pronađite, ažurirajte i izbrišite
Unutar trgovine, ponekad je korisno pronaći određeni dokument po njegovom displayName da to upravlja. Jedan važan detalj: dokumenti su nepromjenjivi nakon indeksiranja. Ako ih trebate ažurirati, preporučeni obrazac je obriši i ponovo otpremi nova verzija.
Kao operativna praksa, mnogi tokovi rada automatiziraju ovaj ciklus: pretraga → brisanje → otpremanjeA kada završite s resursima (na primjer, u razvoju), zapamtite da postoji ograničenje 10 prodavnica po projektuStoga je dobra ideja da ih očistite ako vam više nisu potrebni.
Citati i verifikacija: utemeljenje u vašim dokumentima
Ključna prednost pretrage datoteka je to što odgovori modela mogu uključivati automatski citati koji označavaju fragmente vaših dokumenata korištene za podršku izlazu. Ova sljedivost se pojavljuje u atributu grounding_metadata odgovora i ključan je za revizija, verifikacija i povjerenje u poslovnim okruženjima.
Na ovaj način, kada asistent odgovori, moći ćete prikaži precizne reference do relevantnih dijelova vaših datoteka, što olakšava pregled zahtjeva i izgradnju interfejsi s citatima online.
Podržani formati datoteka
Pretraga datoteka podržava širok izbor formataMeđu najčešćim su application/pdf, application/vnd.openxmlformats-officedocument.wordprocessingml.document (DOCX), application/vnd.openxmlformats-officedocument.spreadsheetml.sheet (XLSX), application/vnd.openxmlformats-officedocument.presentationml.presentation (PPTX), application/json, application/xml, application/zip, pored mnogih jezika programiranje y vrste teksta como text/plain, text/html, text/css, text/csv, text/markdown, text/javascript, text/yaml, Itd
Također pokriva brojne specifične vrste (na primjer, kod i skripte como application/x-php, application/x-powershell, application/x-sh, application/x-tex, application/x-zsh; y tekstualni como text/x-python, text/x-java, text/x-ruby-script, text/x-rust, text/x-go, text/x-kotlin, text/x-sql, text/x-c, text/x-csharp, text/x-swift, text/x-tex, text/x-scss, text/x-tcl, text/x-asm(između mnogih drugih). Ako vaš slučaj zahtijeva neobičan tip, najvjerovatnije je da je to razmatran u službenoj dokumentaciji.
Ograničenja usluga i arhitektonske preporuke
Da bi se održala stabilnost usluge, API postavlja jasna ograničenja: Maksimalna veličina datoteke je 100 MBUkupna veličina dodana u trgovinama ovisi o nivou korisnika: 1 GB besplatno, Nivo 1 10 GB, Nivo 2 100 GB y Nivo 3 1 TB.
Kao smjernica za performanse, preporučuje se neka svaka trgovina bude manja od 20 GB Da bi se osigurala optimalna latencija. Imajte na umu da se veličina trgovine izračunava u pozadini kao ulazna veličina. plus ugradnjekoje obično množe približno sa tres originalni volumen podataka.
Cijene: jednostavne i predvidljive
Model plaćanja je direktan: Plaćate samo za kreiranje ugradbi u indeksiranju.po cijeni od 0,15 dolara po milionu tokena (u zavisnosti od primjenjivog troška modela ugradnje). skladištenje I to generiranje ugradnji u upitu Nemaju dodatnih troškova, a oporavljeni tokeni Naplaćuju se kao normalni kontekstualni tokeni nakon generiranja.
Ova shema olakšava budžetiranje: glavni troškovi su koncentrisani u početni unos (i u narednim ažuriranjima dokumenata, ako ih bude), minimizirajući iznenađenje u potrošnji po broju upita.
Kompatibilni modeli za pretragu datoteka
Alat radi sa trenutnim modelima iz Gemini porodice. Referentni materijali ističu njegovu dostupnost u Gemini 2.5 Pro y Gemini 2.5 Flash za pretragu datoteka, s podrškom za uzemljenje, filteri metapodataka i citati kako bi se izgradila provjerljiva iskustva.
Što se tiče uzemljenja pomoću Google pretrage (o čemu će biti riječi u nastavku), postoji širi raspon podržanih modela, a navedeno je da Eksperimentalni i probni modeli Nisu uključeni.
Uzemljenje uz Google pretragu: trenutne informacije i web citati
Ako vam je pored dokumenata potreban web sadržaj u stvarnom vremenuAlat možete aktivirati google_searchModel upravlja cijeli tokodlučiti da li je prikladno pretraživati, generirati i izvršavati upite, obrađivati rezultate, sintetizirati i vratiti odgovor s temeljnim metapodacima (konsultacije, rezultati i citati).
Kada se uzemljenje pravilno izvede, odziv uključuje groundingMetadata sa poljima kao što su webSearchQueries (korištene konsultacije), searchEntryPoint (HTML i CSS su potrebni za prijedloge pretrage, a zahtjevi za korištenje detaljno su opisani u Uslovima korištenja), uzemljenje komada (web izvori sa uri y title) y uzemljenjePodrška (fragmenti koji povezuju tekstualne segmente modela s indeksima groundingChunks graditi online citati).
Cijene i modeli uzemljenja pomoću Google pretrage
Korišćenje google_search faktura za svaki zahtjev koji aktivira taj alat, čak i ako model pokrene nekoliko internih upita za isti zahtjev; sve se ovo računa kao jednokratna naplativa upotrebaModeli kompatibilni s ovim alatom navedeni su u nastavku. Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash-Lite, Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash.
Za modele starije od verzije 1.5, postoji stari alat. google_search_retrieval s načinom rada Dinamičangdje konfigurirate dinamički_prag (0.0–1.0) i model odlučuje hoće li izvršiti pretragu na osnovu svog samopouzdanje gdje su vam potrebne ažurne informacije.
Primjeri upotrebe: od internih asistenata do korisničke podrške
Pretraga datoteka je usmjerena na poslovno okruženje gdje su privatnost, tačnost i sljedivost važni. Korisno je za radnike sa znanjem koji ispituju vlasničku dokumentaciju, na primjer automatizirati podršku s odgovorima navedenim iz priručnika i politika ili radi ubrzanja pretraži i pregledaj u sektorima koji intenzivno koriste informacije (pravni, zdravstveni, finansijski).
Takođe ubrzava protok razvoj i otklanjanje grešaka omogućavajući interakciju s kodnim bazama ili tehničkim specifikacijama. Njegova kombinacija s drugim Gemini mogućnostima (kao što je izvršavanje koda ili funkcija) omogućava bogate integracije u procesima usklađenosti, revizije ili analitike.
Operacije i status: rad s API-jem
REST površina otkriva metode kao što su fileSearchStores.create (kreira praznu prodavnicu), fileSearchStores.delete (uklanja trgovinu), fileSearchStores.get (dobiva informacije iz prodavnice), fileSearchStores.list (prikazuje korisničke trgovine) i importFile (bitno je File (od servisa za datoteke do skladišta). Krajnje tačke Operacije omogućavaju vam da provjerite status dugoročne operacije, s prijavnim obrascima koji u nekoliko slučajeva idu prazno prema specifikaciji.
Na direktnoj uzbrdici (uploadToFileSearchStoreSkup Operacije Posebno dizajnirano za mjerenje napretka. Ovaj obrazac je tipičan: koplja operacija, provjeravate periodično ako je završeno i kada završava, nastavljate s tokom (na primjer, pokretanje RAG upita).
Najbolje prakse: filteri, označavanje i latencija
Ako očekujete mnogo upita, označite svoje dokumente sa Metapodaci i zaposliti metadataFilter ograničiti pretraživanje na relevantne podskupove. Držite pohrane unutar preporuka za veličinu Pomaže kod latencije i stabilnosti. A ako ćete puniti puni folderiKoristi istovremeno podizanje kako bi se smanjilo vrijeme gutanja.
U tehničkim scenarijima, definirajte strategije grupiranja primjereno sadržaju: na primjer, kraći dijelovi s umjerenim preklapanjem za kod (bolja preciznost u funkcijama/klasama) i nešto duži dijelovi u narativna dokumentacija kako bi se sačuvao semantički kontekst.
Kompatibilnost s drugim Gemini alatima
Uzemljenje pomoću Google pretrage može se kombinovati sa Kontekst URL-a (da biste naveli određene URL-ove) i sa izvršavanje koda ili dodatne funkcije alata ovisno o slučaju upotrebe. To vam omogućava kombiniranje. insajdersko znanje Pretraga datoteka sa ažurirane informacije s weba, uvijek održavajući citate i tragove izvora.
Prilikom dizajniranja UX-a, iskoristite prednosti uzemljenjePodrška y uzemljenje komada ponuditi citati na koje se može kliknuti uz tekst modela. Ovo je najjasniji način da korisnici provjere izvor svake izjave.
Pretraga datoteka u Gemini API-ju nudi vrlo direktan način opremanja vaših aplikacija sa dobro obrazloženi odgovori u vašim vlastitim podacima, minimizirajući operativno trenje. Njegova kombinacija Predvidljivi troškovi indeksiranja, podrška za različite formate, filteri metapodataka, automatsko citiranje i uzemljenje pomoću Google pretrage Formira stek spreman za produkciju koji smanjuje pritisak na implementaciju RAG-a u timovima svih veličina.
Strastveni pisac o svijetu bajtova i tehnologije općenito. Volim dijeliti svoje znanje kroz pisanje, a to je ono što ću raditi na ovom blogu, pokazivati vam sve najzanimljivije stvari o gadžetima, softveru, hardveru, tehnološkim trendovima i još mnogo toga. Moj cilj je pomoći vam da se krećete u digitalnom svijetu na jednostavan i zabavan način.