Ar jaučiate, kad jūsų prisiminimai pasimetę tarp tūkstančių nuotraukų telefone ir jums neįmanoma rasti tos vienos unikalios nuotraukos? Atėjus „Gemini“ dirbtiniam intelektui „Google“ nuotraukose, prisiminimų paieškos ir tvarkymo būdas išties pasikeitė. Pamirškite raktinių žodžių paieškas ar nesibaigiantį galerijos naršymą: dabar galite... raskite bet kokį vaizdą, kalbantį natūraliai dėka „Gemini“ integracijos ir jos funkcijos „Klausti nuotraukų“ (Klauskite nuotraukų).
Šiame straipsnyje jūs sužinosite Kaip „Gemini“ iš naujo apibrėžia paieškos patirtį „Google“ nuotraukose, kaip išnaudoti visas jos įrankių galimybes, praktinius jų naudojimo pavyzdžius ir visus privatumo, konfigūravimo bei būsimų funkcijų niuansus. Taip pat aptariame naujausius pasiekimus, patarimus ir techninius aspektus, kad galėtumėte įvaldyti šią naujovę savo kasdieniame darbe.
„Google“ nuotraukos ir „Gemini“: vaizdų paieškos evoliucija naudojant pokalbių dirbtinį intelektą
Rasti konkrečias akimirkas tarp tūkstančių nuotraukų dabar yra paprasta ir tiksli užduotis.Iki „Gemini“ pasirodymo „Google Photos“ jau siūlė išplėstinę raktinių žodžių paiešką, veido atpažinimą, datos atpažinimą ir vietos atpažinimą. Tačiau šiuos metodus ribojo jų priklausomybė nuo metaduomenų ir vaizdų žymėjimo tikslumas. Dabar, Dvyniai pakelia šią patirtį į kitą lygį dėl savo multimodalinio supratimo ir natūralios kalbos apdorojimo galimybių.
Klauskite nuotraukų (Klauskite nuotraukų) yra inovacijos pagrindas: jos dirbtinis intelektas supranta pokalbių užklausas, atpažįsta anksčiau nepastebėtas detales jūsų nuotraukose ir netgi sujungia vaizdinę ir tekstinę informaciją iš saugomų nuotraukų ir vaizdo įrašų. Tai tiesiogine prasme panašu į pokalbį su jūsų prisiminimų galerija.
- Raiškioji pokalbių paieška: Galite paklausti: „Kur paskutinį kartą buvo Lauros gimtadienis?“ arba „Pasakykite, kur šią vasarą lankiausi su draugais“, o „Gemini“ analizuos kontekstą, veidus, datas ir vietas, kad pateiktų jums tikslų ir suasmenintą atsakymą.
- Išsami multimodalinė analizė: Dirbtinis intelektas neapsiriboja tekstu; jis atpažįsta vaizdinius elementus, objektus, gyvūnus, ženklus, numerio ženklus, dekoracijas ir netgi skaito tekstą vaizduose, naudodamas pažangią OCR technologiją.
- Nuolatinis mokymasis ir suasmeninimas: Jei pataisote Dvynius, pridedate naujus vardus arba naujus santykius, sistema mokosi ir pagerina būsimų paieškų tikslumą, prisimindama jūsų pageidavimus ir svarbiausius asmeninius duomenis.
- Sudėtingų užduočių automatizavimas: Be nuotraukų paieškos, programa gali kurti teminius albumus, pasiūlyti geriausias kelionės nuotraukas, nustatyti pasikartojančius įvykius ir padėti lengvai dalytis prisiminimais.
Kas tiksliai yra „Gemini“ „Klausti nuotraukų“ funkcija „Google“ nuotraukose?
Klauskite nuotraukų Tai eksperimentinė funkcija, sukurta „Google Labs“, kuri „Google“ nuotraukų paieškos sistemą maitina „Gemini“ – pažangiausias „Google“ dirbtinio intelekto modelis.Jos tikslas – suteikti jums Pokalbio patirtis, leidžianti paklausti bet ko apie savo prisiminimus, pasiekiant daug naudingesnių ir aktualesnių rezultatų, net kai jūsų galerijoje yra daugiau nei keli tūkstančiai failų.
Šis įrankis ne tik suranda vaizdus, bet ir žengia dar vieną žingsnį į priekį automatizuoti atminties valdymo užduotisTaigi, galite paprašyti, kad jis atrinktų geriausias renginio nuotraukas, apibendrintų aplankytas vietas, išvardytų teminius gimtadienius, kuriuos šventėte, arba automatiškai rinktų prisiminimus su konkrečiu asmeniu ar augintiniu.
- Išsami vizualinio turinio analizė: Jis aptinka viską – nuo veidų ir augintinių iki objektų, spausdinto teksto, ženklų, automobilių numerių ir kvietimų. Jo vizualinis atpažinimas neapsiriboja rankiniu žymėjimu ar metaduomenimis.
- Visiškas konteksto supratimas: Klausimą interpretuokite taip, kaip tai darytų žmogus, suprasdami tokias frazes kaip „Mano dukters pirmosios Kalėdos“ arba „Mano ir mano šuns nuotraukos paplūdimyje“.
- Išmanūs pasiūlymai ir automatinis valdymas: Galite kurti albumus, siūlyti vardus ir ryšius, įsiminti pataisymus ir tobulinti patirtį kiekvienos sąveikos metu.
- Pagalba atliekant kitas užduotis: Jis ne tik ieško; jis padeda pasirinkti geriausius kadrus, sukurti kelionių pavadinimus ar santraukas ir lengvai bendrinti aktualų turinį, pavyzdžiui, atrenkant geriausias nuotraukas socialinei žiniasklaidai.
Kaip pradėti naudotis „Ask Photos with Gemini“: sąranka ir prieiga
„Ask Photos“ šiuo metu yra eksperimentinėje fazėje ir iš pradžių prieinama pasirinktiems vartotojams konkrečiose šalyse., daugiausia per išankstinę prieigą Jungtinėse Valstijose ir palaipsniui „Android“ sistemoje. „Google“ jau paskelbė, kad plėsis į kitas teritorijas ir įrenginius, pvz., „iOS“.
- Atidarykite „Google“ nuotraukų programėlę „Android“ įrenginyje (netrukus bus pasiekiama ir „iOS“ bei kitose sistemose).
- Raskite skirtuką Klauskite (paklausti) ir pasiekite integruotą pokalbių langą.
- Sutikite su „Google Labs“ privatumo naudojimo sąlygomis ir nuostatomis. Šios funkcijos galite bet kada atsisakyti.
- Sukurkite savo veidų grupę: pasirinkite savo atvaizdą, kad galėtumėte save atpažinti, ir ieškokite „mano vaikystės nuotraukos“ ar panašiai.
- Redaguokite arba pridėkite šeimos narių, draugų ir augintinių vardus, ryšius ir giminystės ryšius savo nuotraukose, kad Dvyniai galėtų tiksliai atpažinti jūsų prisiminimų objektus.
Po pradinio nustatymo šią informaciją galite redaguoti ir tinkinti bet kada. Atminkite, kad šiuo metu prieiga gali būti apribota pasirinktoms grupėms ir nebūtinai reikalinga prenumerata, nors ateityje tai gali pasikeisti.
O iš „Gemini“ programėlės? Jei turite įdiegtą „Gemini“ programėlę, taip pat galite tiesiogiai paklausti apie savo nuotraukas („Parodykite man paplūdimio kepsnių nuotraukas“), o dirbtinis intelektas atidarys „Google“ nuotraukas ir parodys filtruotus rezultatus, taip integruodamas abi platformas. Daugiau informacijos rasite mūsų vadove. Viskas, ką galite padaryti su „Gemini“ sistemoje „Android“.
Praktiniai ir pažangūs „Gemini“ paieškos „Google“ nuotraukose pavyzdžiai
Tikroji Dvynių stiprybė slypi jų gebėjime suprasti ir vykdyti sudėtingas, dviprasmiškas ar labai pritaikytas užklausasDabar galite sąveikauti su savo prisiminimais taip, kaip anksčiau buvo neįsivaizduojama.
- Teminės ir kontekstinės paieškos: „Kiek superherojų tematikos gimtadienių atšventė Mario?“ Dirbtinis intelektas analizuos paveikslėliuose esančias dekoracijas, torto detales ir aksesuarus.
- Geolokacijos užklausos: „Parodyk man mūsų kelionės į kalnus nuotraukas“, „Kuriuos miestus aplankiau praėjusiais metais?“ Dvyniai analizuos kiekvieno vaizdo datas ir GPS koordinates.
- Teksto ir objektų atpažinimas: „Mano automobilio valstybinis numeris“, „Nuotraukos, kuriose yra žodis „Baigimas“,“ – pažangios OCR ir vizualinio šablonų atpažinimo derinimas.
- Automatizuota atranka ir organizavimas: „Geriausios savaitgalio nuotraukos“ arba „Rodyti tik naujausias asmenukes“ – „Gemini“ parenka aukštos kokybės vaizdus ir gali automatiškai sukurti galerijas ar albumus, paruoštus bendrinti.
- Konsultacijos pagal santykius ir veidus: Apibrėžę, kas esate ir kokie jūsų ryšiai, galite ieškoti „Aš su tėčiu paplūdimyje“ arba „Nuotraukos, kuriose kartu yra mano šuo Maksas ir Mateo“.
- Veiklos santraukos: Galite paklausti: „Ką veikiau savo kelionės į Japoniją metu?“, o „Gemini“ pateiks jums vietų, veiklų ir nuotraukų sąrašą – puikiai tinka prisiminimams tvarkyti ar maršrutams planuoti remiantis ankstesne patirtimi.
„Gemini“ taip pat gali patikslinti rezultatus, paklausdama, ar norite toliau filtruoti, ar mokytis iš jūsų pataisymų, kad ateityje būtų tiksliau. Ji gali analizuoti ne tik nuotraukas, bet ir „Google“ nuotraukose saugomus vaizdo įrašus, dar labiau išplėsdama galimybes.
Kaip „Gemini“ interpretuoja ir atsako į jūsų klausimus? Išmaniosios paieškos patirties tobulinimas
Už kiekvieno užklausimo Dvyniai vykdo pažangus daugiapakopis procesas:
- Išplėstinis klausimo supratimas: Išanalizuokite visą sakinį, kad suprastumėte ketinimą, kontekstą, temą ir svarbias detales, net jei jūsų klausime yra neoficialių ar dviprasmiškų posakių.
- Multimodalinė paieška ir analizė: Jis interpretuoja ir tekstą, ir vaizdus, atpažįsta veidus, objektus ir skaito tekstą vaizduose, klasifikuodamas rezultatus pagal aktualumą ir panašumą į užklausą.
- Atsakymo parengimas: Jis atrenka geriausias nuotraukas ir vaizdo įrašus, atmeta nesvarbius ir, jei reikia, rodo rezultatus su kontekstiniais paaiškinimais. Jis netgi gali išvardyti veiklas, įvykius ar vietas, aptiktas remiantis jūsų prisiminimais.
- Pokalbio tobulinimas: Jei atsakymas nėra tikslus, Dvyniai gali užduoti papildomų klausimų, kad susiaurintų paiešką (pavyzdžiui, „Ar turite omenyje Silvijos vestuves ar Anos gimtadienį?“).
- Atsiliepimai ir mokymasis: Visada galite nurodyti, ar atsakymas buvo patenkinamas, ar ne, ir pateikti pasiūlymų, padėdami Dvyniams mokytis ir pritaikyti būsimus atsakymus pagal jūsų individualius pageidavimus.
Paprastai atsakymas pasirodo per kelias sekundes, įskaitant aiškinamuosius pranešimus pokalbyje arba automatiškai sukuriamus teminius albumus. Galite paliesti „Žiūrėti daugiau“, kad pasiektumėte visą filtruotą galeriją ir, jei ieškote sudėtingesnių paieškų, žingsnis po žingsnio patikslinkite rezultatus.
Privatumas, saugumas ir duomenų valdymas naudojant „Gemini“ „Google“ nuotraukose
Leidimas dirbtiniam intelektui pasiekti jūsų galeriją gali sukelti privatumo problemų. „Google“ teigia, kad Jūsų informacijos apsauga yra svarbiausias prioritetas:
- Išskirtinis nuotraukų ir vaizdo įrašų naudojimas: Jūsų bibliotekos medžiaga naudojama tik „Ask Photos“ veikimui. Ji nenaudojama reklamos tikslais ar dirbtinio intelekto modelių mokymui už „Google Photos“ ar net kitų „Gemini“ produktų ribų.
- Nėra įprastų žmonių atliekamų peržiūrų: Pokalbiai su dirbtiniu intelektu lieka privatūs. Tik išskirtinėmis aplinkybėmis (pvz., piktnaudžiavimo ar rimtų techninių problemų atveju) „Google“ darbuotojai galėtų įsikišti.
- Išsamus privatumo valdymas: Žmonių atliekamą peržiūrą galite bet kada išjungti „Klauskite nuotraukų“ nustatymuose.
- Pramonėje pirmaujančios saugos priemonės: Visi duomenys yra šifruojami ir apsaugoti naudojant pažangiausias „Google“ sukurtas saugumo sistemas.
- Iš viso kontrolė: Jei nebenorite naudoti „Klausk nuotraukų“, galite grįžti prie klasikinės paieškos „Google“ nuotraukose arba išjungti šią funkciją nustatymuose, išlaikydami savo patirties ir duomenų kontrolę.
- Sąlygos ir skaidrumas: Funkcijos naudojimą reglamentuoja „Google“ paslaugų teikimo sąlygos ir „Generative AI“ draudžiamo naudojimo politika, daugiausia dėmesio skiriant privatumui ir etiškam duomenų valdymui.
Kita vertus, kadangi tai eksperimentinė funkcija, „Google“ skatina vartotojus ją išbandyti, teikti atsiliepimus ir pranešti apie galimus neteisingus atsakymus, o tai padeda tobulinti dirbtinį intelektą visiems. Daugiau informacijos apie saugumą ir funkcijas taip pat galite rasti apsilankę Viskas, ką galite daryti su „Gemini“ išplėstiniu režimu.
„Gemini“ integracija su „Google“ nuotraukomis yra tik pradžia. „Google“ teigimu, diegimas yra pradinėje stadijoje ir tikimasi dar daugiau pažangių funkcijų:
- Pasaulinė ir daugiaplatformė plėtra: Prieiga bus išplėsta į daugiau šalių, kalbų ir operacinių sistemų, planuojant integraciją su darbalaukio žiniatinklio versija, taip pat „Android“ ir „iOS“.
- Didesnė automatizacija: „Gemini“ žada padėti vartotojams automatiškai pasirinkti „geriausias nuotraukas“ po kelionės ar įvykio, generuoti suasmenintus antraštes bendrinimui socialinėje žiniasklaidoje ir aktyviai kurti veiklos santraukas.
- Pokalbių robotas ir praturtinta pokalbių patirtis: Pokalbyje „Klausk nuotraukos“ bus pridėta daugiau filtrų, galimybė suprasti sudėtingas užklausas ir pritaikymas pagal jūsų paieškos įpročius ir pageidavimus.
- Integracija su kitomis „Google“ programėlėmis: Dabar galite naudoti „Gemini“ informacijai tvarkyti Diske, Žemėlapiuose, „YouTube“ ir Kalendoriuje, todėl dar lengviau tvarkyti ir pasiekti savo prisiminimus.
- Naujos eksperimentinės funkcijos: Ateityje „Gemini“ galėtų padėti atpažinti jūsų nuotraukų modelius (pavyzdžiui, kada pirmą kartą apsilankėte pramogų parke), rasti naudingus dokumentus ir vaizdus (pvz., sąskaitas ar korteles) ir teikti rekomendacijas pagal jūsų pomėgius.
- Prieigos ir prenumeratos modeliai: Nors šiuo metu ji yra nemokama eksperimentinėje fazėje, neatmetama galimybė, kad „Gemini AI Premium“ abonentams po pasaulinio diegimo bus pridėtos aukščiausios kokybės funkcijos.
Be to, „Google“ laikosi aktyvaus klausymosi politikos: jūsų komentarai ir indėlis padės tobulinti dirbtinio intelekto našumą, kad patirtis būtų dar artimesnė tam, ko iš tikrųjų reikia vartotojui, būtų išvengta klaidų ir būtų suteikta reali nauda kasdieniam naudojimui.