Kas yra „Google AI Edge Eloquent“ ir kaip jį naudoti?

  • „Google AI Edge Eloquent“ yra dirbtinio intelekto valdoma diktavimo programa, kuri naudoja lokalius „Gemma“ modelius, kad realiuoju laiku transformuotų kalbą į profesionalų tekstą.
  • Programėlė teikia pirmenybę privatumui, naudodama apdorojimą neprisijungus, pasirinktinį žodyną ir visiškai neprisijungus veikiantį režimą, kai garsas niekada nepalieka įrenginio.
  • Jis siūlo lanksčius išvesties formatus, automatinį užpildo žodžių pašalinimą ir eksportavimą į kitus įrankius, be to, yra nemokamas ir neribotas „iOS“ sistemoje.
  • Kol kas ji pasiekiama tik anglų kalba „iPhone“ telefonams pasirinktuose regionuose, o „Google“ dirba ties kalbų, šalių ir galimų versijų plėtimu kitoms platformoms.

Kas yra „Google AI Edge Eloquent“ ir kaip jį naudoti?

Nauja programa „Google“ dirbtinio intelekto „Edge“ iškalbingasis Ji pasirodė tyliai, bet tapo viena įdomiausių dirbtinio intelekto valdomų diktavimo priemonių. Ši „iPhone“ programėlė skirta tiems, kurie mieliau kalba, o ne rašo, ir siekia panaikinti seną atotrūkį tarp to, kaip mes iš tikrųjų kalbame, ir to, kaip turėtų atrodyti profesionalus tekstas.

„Eloquent“ toli gražu nėra paprastas balso diktavimas, jis sujungia Dirbtinio intelekto modeliai, veikiantys tiesiai mobiliajame įrenginyje Naudodama pažangias automatinio redagavimo funkcijas, pritaikomus išvesties formatus ir didelį dėmesį privatumui, programa leidžia jums rašyti savo idėjas tiksliai tokias, kokias jos jums kyla, įskaitant abejones, pasikartojimus ir užpildo žodžius, ir programa akimirksniu pateikia švarų, struktūrizuotą tekstą, paruoštą siųsti arba kopijuoti į kitą programą.

Kas tiksliai yra „Google AI Edge Eloquent“?

„Google“ dirbtinio intelekto „Edge“ iškalbingasis Tai „Google“ sukurta dirbtinio intelekto valdoma diktavimo programėlė, šiuo metu prieinama tik „iOS App Store“. Ji sukurta siekiant užtikrinti aukštos kokybės, realaus laiko balso į tekstą transkripciją, atliekant didžiąją dalį apdorojimo pačiame įrenginyje, nuolat nepasikliaujant debesimi.

Programėlė naudoja kalbos modelius Gemmos šeima„Google“ generatyvinių dirbtinio intelekto modelių su atvirais svoriais linija, kurią galima atsisiųsti ir paleisti vietoje. Šie modeliai yra atsakingi už jūsų balso konvertavimą į tekstą, kuris ne tik atspindi tai, ką pasakėte, bet ir akimirksniu perrašo, pataiso bei nupoliruoja rezultatą.

Eloquento požiūris yra žinomas kaip Edge AIUžuot siuntus visus garso įrašus į nuotolinius serverius, jie apdorojami jūsų telefone. Tai sumažina delsą, pagerina privatumą ir leidžia tęsti diktavimą net ir tada, kai nėra signalo arba įjungtas lėktuvo režimas.

„Google“ pristato šį įrankį kaip našią diktavimo sistemą, skirtą profesionalūs vartotojai kuriems reikalingas greitis ir konfidencialumas: žurnalistams, teisininkams, gydytojams, vadovams ar tiesiog žmonėms, norintiems chaotiškas balso pastabas paversti rimtais tekstais negaišdami laiko peržiūrai.

Kaip tai veikia techniniu lygmeniu: „Gemma“, „Edge AI“ ir debesijos režimas

Pirmą kartą įdiegus „Eloquent“, programa paprašys atsisiųsti Maždaug 400 MB talpos „Gemma“ kalbos modelisTas failas iš esmės yra programos „smegenys“: jame yra modelio, kuris bus atsakingas už jūsų sakomo teksto supratimą, teksto valymą ir formavimą, svoriai.

Šie „Gemma“ modeliai buvo pagaminti naudojant tą pačią pagrindinę technologiją kaip ir DvyniaiTačiau jie yra optimizuoti veikti vietiniuose įrenginiuose, tokiuose kaip mobilieji telefonai, nešiojamieji kompiuteriai ar kiti ribotų išteklių kompiuteriai. „iPhone“ atveju „Eloquent“ remiasi Neuroninis variklis iš paties telefono, kad dirbtinis intelektas veiktų pakankamai greitai, jog galėtų atlikti korekcijas realiuoju laiku, kol kalbate.

Programa siūlo du skirtingus veikimo režimus: vieną režimą vietinis arba neprisijunguskuris yra numatytasis, ir režimas debesis Pasirinktinai. Vietiniu režimu visas apdorojimas atliekamas jūsų telefone, užtikrinant, kad jūsų garsas ir tekstas niekada nebūtų siunčiami į „Google“ serverius. Debesijos režimu transkripcijos siunčiamos į „Gemini“ modelius debesyje, kad būtų toliau valomos ir perrašomos, o tai ypač naudinga sudėtingiems sakiniams ar tekstams, kuriems reikia šlifuoto užbaigtumo.

Šis dvilypumas leidžia jums pasirinkti tarp Maksimalus privatumas ir pažangus poliravimasJei nenorite, kad įrenginys paliktų absoliučiai nieko, palikite įjungtą neprisijungus režimą; jei bet kuriuo metu teikiate pirmenybę sudėtingesniam stiliui ar sudėtingesnėms redagavimo užduotims, galite įjungti debesies režimą žinodami, kad tai sąmoningas ir grįžtamas pasirinkimas.

Be to, „Eloquent“ galima integruoti su „Google“ ekosistema ir sinchronizuoti su Dvyniai pagerinti tekstų kokybę, kai vartotojas to pasirenka. Ši integracija taip pat naudoja jūsų dokumentų ir el. laiškų kontekstą, kad patikslintų žodyną ir pasiūlymus.

Pagrindinės funkcijos: daug daugiau nei vien kalbos konvertavimas į tekstą

„Google AI Edge Eloquent“ nuo tradicinio diktavimo skiria tai, kad ji ne tik perrašo viską, ką sakote. Programėlė taiko keletą veiksmų. automatiniai valymo ir redagavimo procesai kol jūs kalbate, sukurta taip, kad gautas tekstas atrodytų ramiai parašytas, o ne neapdorotas garso įrašas.

Pirma, sistema yra pajėgi pašalinti užpildinius žodžius ir kalbos triukšmus Tipiniai spontaniško pokalbio bruožai, tokie kaip „aha“, „mmm“, „uhm“ arba tuščios pauzės, dingsta iš teksto. Jis taip pat aptinka pasikartojimus ir automatines sakinio vidurio pataisas, neleisdamas atsirasti netvarkingiems fragmentams, kurie būdingi diktuojant be filtro.

Antra, programa automatiškai taiso skyryba, sutapimas ir pagrindinė gramatikaNors jis nėra skirtas pakeisti profesionalų korektorių visais atvejais, jis sugeba improvizuotą kalbą paversti skaitomomis pastraipomis su išsamiais ir rišliais sakiniais.

Kitas svarbus aspektas yra gebėjimas pritaikyti teksto formą„Eloquent“ leidžia gauti rezultatą įvairiais formatais: santrauka su pagrindiniais punktais, oficialiu tekstu, trumpa versija arba išplėstiniu tekstu. Tokiu būdu tą patį įrašą galima naudoti ilgam juodraščiui sukurti arba tik pagrindinėms idėjoms išsaugoti.

Programėlėje taip pat yra papildomų funkcijų, tokių kaip žodžių skaičiusTaip pat įrašomas jūsų diktavimo greitis žodžiais per minutę ir pateikiama ankstesnių seansų istorija, padedanti stebėti savo darbo tempą ir lengvai rasti senus užrašus negaištant laiko paieškai.

Privatumas ir neprisijungus pasiekiamas funkcionalumas: pagrindinis „Eloquent“ pardavimo argumentas

Vienas pagrindinių šios programėlės argumentų yra aiškus įsipareigojimas privatumas ir vietinis vykdymasPaleidus „Gemma“ modelius tiesiai „iPhone“ telefone, nereikia siųsti garso failų į debesį apdorojimui, o tai sumažina su slaptos informacijos tvarkymu susijusią riziką.

Programėlė siūlo jungiklį, skirtą įjungti visiškas neprisijungus režimasĮjungę šią parinktį, galite įjungti telefoną į lėktuvo režimą ir toliau diktuoti kaip įprasta: vietinis modelis toliau veikia be interneto ryšio. Tai ypač patrauklu specialistams, dirbantiems su konfidencialiais duomenimis, pavyzdžiui, teisininkams, gydytojams ar vadovams, tvarkantiems komercines paslaptis.

„Google“ nurodo, kad vietiniu režimu net pati įmonė neturi prieigos Nei jūsų įrašai, nei sugeneruotas tekstas nėra perduodami, nes šie duomenys niekada nepalieka įrenginio. Tai suteikia „Eloquent“ labai konkurencingą poziciją, palyginti su kitomis diktavimo priemonėmis, kurios beveik visiškai priklauso nuo nuotolinių serverių.

Jei pasirinksite įjungti integraciją su „Google“ įmonės aplinka, programa galės pasiekti (jei suteiksite jai aiškų leidimą) duomenis iš „Google Workspace“, kaip ir „Gmail“, siekiant sukurti tobulesnį asmeninį žodyną. Ši informacija naudojama siekiant pagerinti tikrinių vardų, projekto terminų ar dažnai vartojamų techninių terminų atpažinimą, tačiau visada tai kontroliuoja vartotojas.

Debesijos režimu, kai dalis teksto siunčiama į Dvyniai debesyjeŠis režimas užtikrina intensyvesnį išvesties apdorojimą, leidžiantį dar labiau patikslinti rašymą. Tačiau šis režimas yra pasirenkamas ir nebūtinas norint naudoti pagrindines išmaniojo diktavimo funkcijas.

Asmeninis žodynas ir mokymasis naudotojo stiliumi

Kas yra „Google AI Edge Eloquent“ ir kaip jį naudoti?

Be bendrųjų pataisymų, „Eloquent“ turi ir sistemą pasirinktinis žodynas Tai leidžia pritaikyti dirbtinio intelekto elgesį prie jūsų kasdienės realybės. Galite rankiniu būdu pridėti tikrinius daiktavardžius, techninį žargoną, akronimus ar konkrečios pramonės šakos terminus, kad modelis galėtų juos lengvai atpažinti.

Programėlė gali Importuoti žodyną iš „Gmail“ ir kitas „Google“ ekosistemos paslaugas (kai suteikiate leidimą), leidžiančias jai išmokti jūsų rašymo stilių, dažniausiai vartojamus terminus ir pasikartojančius vardus jūsų el. laiškuose ar dokumentuose. Tai žymiai sumažina diktavimo sistemoms būdingas klaidas, kai naudojami neįprasti ar sunkiai ištariami žodžiai.

Toliau naudojant, DI pritaiko savo elgesį prie jūsų tarimo ir gramatikos modeliaiNors tai nėra mokymas pagal nuo nulio sukurtą modelį, galite pastebėti laipsnišką tikslumo pagerėjimą, ypač kalbant apie akcentą, pauzes ar dažnai kartojamus žodžius.

Visa ši pritaikymo sistema papildo teksto formatavimo parinktis, tai reiškia, kad galite gauti savotišką „balso rašymo asistentą“. labai atitinka tavo saviraiškos būdątačiau pateikia rezultatus, kurie atrodo kaip oficialus dokumentas arba gerai parašytas el. laiškas.

Tiems, kurie dirba su konkrečiais projektais, vidiniais pavadinimais ar techniniais terminais, šis derinys nuosavas žodynas + darbo srities kontekstas Dėl to „Eloquent“ yra daug patikimesnis įrankis nei bendriniai diktavimo įrankiai, kurie supranta tik standartinę leksiką.

Formatavimo parinktys ir kasdienis naudojimas

Išvesties formatų lankstumas yra viena praktiškiausių „Eloquent“ savybių. Iš vieno įrašo galite sugeneruoti kelis išvesties formatus. įvairių tipų tekstai priklausomai nuo to, ko jums tuo metu reikia: trumpos santraukos, kurią galėsite peržiūrėti vėliau, pagrindinių punktų sąrašo, ilgo teksto ataskaitos projekto stiliumi ar oficialaus pranešimo, beveik paruošto išsiųsti.

Pavyzdžiui, galite naudoti programėlę, kad rašyti ilgus el. laiškus Eidami gatve, nesustodami rašyti ekrane. Arba diktuokite susitikimo protokolą, leisdami šablonui pašalinti pertraukimus, pasikartojimus ir nebaigtus sakinius, kad gautumėte nuoseklų ir lengvai skaitomą dokumentą.

Daugelis žmonių jį taip pat naudoja kaip savotišką pažangi balso užrašų knygelėĮrašote atsitiktines idėjas, greitas mintis ar projekto eskizus ir leidžiate „Eloquent“ juos sutvarkyti ir struktūrizuoti. Tai ypač naudinga, jei jums sunku pereiti nuo idėjos prie rašytinio teksto negaištant laiko.

Galimybė perjungti formalesnį arba glaustesnį stilių yra labai patogi tiems, kurie dirba su tekstais, kurie vėliau pakartotinai naudojami įmonės dokumentuose, ataskaitose ar pristatymuose. Jūs diktuojate natūraliai, o tada pasirenkate geriausiai kontekstą atitinkantį apipavidalinimo įrankį.

Kalbant apie rezultatų valdymą, programėlė leidžia eksportuoti transkriptus įvairiais formatais (TXT, PDF, tiesioginė integracija su „Google Docs“) ir bendrinti juos su kitomis programomis. Tokiu būdu „Eloquent“ gerai integruojasi į darbo eigas, kuriose reikia tęsti teksto redagavimą kitoje priemonėje arba perkelti jį į projektų valdymo sistemą.

Palyginimas su „Apple“ diktavimu, „Otter.ai“ ir kitomis alternatyvomis

Dirbtiniu intelektu pagrįstų diktavimo ir transkribavimo įrankių rinka yra gana konkurencinga, nes siūlomos tokios parinktys kaip „Apple“ įdiegta diktavimo funkcija ir debesijos sprendimai. Otter.aiarba specializuotas programas, tokias kaip „Wispr Flow“ ir „SuperWhisper“. „Eloquent“ į šią sritį žengia su labai aiškiu tikslu: maksimalus privatumas ir vietinis apdorojimassu debesija kaip papildymu, o ne kaip prievole.

Palyginti su „Apple“ įgimtu diktavimu, „Eloquent“ išsiskiria savo intelektuali perrašymo galimybėNors „Apple“ sistema linkusi beveik pažodžiui perrašyti tai, ką sakote, įskaitant daugelį jūsų dvejonių ir sutrumpintus sakinius, „Eloquent“ bando rekonstruoti kalbą taip, kad ji skambėtų kaip iš anksto redaguotas tekstas. Be to, ji intensyviai naudoja „iPhone“ neuroninį variklį – kai kurie analitikai tai laiko „Google“ pasigyrimu, kad iš „Apple“ aparatinės įrangos gauna daugiau nei pati „Apple“.

Palyginti su tokiomis paslaugomis kaip „Otter.ai“ ar grynai debesijos pagrindu veikiančiais įrankiais, „Eloquent“ stiprybė slypi gebėjime dirbti su minimalus delsos laikas ir neprisijungusJums nereikia priklausyti nuo tinklo kokybės ar išorinių serverių, kad gautumėte tinkamą transkriptą, kuris yra labai svarbus sudėtingose ​​arba saugumo apribojimų turinčiose darbo aplinkose.

Pažangių dirbtiniu intelektu paremtų diktavimo programėlių, skirtų reikliems vartotojams, tokių kaip „Wispr Flow“ ar „SuperWhisper“, segmente „Google“ strategija yra derinti vietinis apdorojimas, pritaikymas ir nulinės išlaidos„Eloquent“ yra visiškai nemokama, be jokių prenumeratų ar dienos naudojimo apribojimų, todėl ji ypač patraukli tiems, kurie moko daug valandų per mėnesį.

Visa tai „Google“ papildo kita programėle, vadinama AI Edge galerijaTaip pat pasiekiama „iOS“ sistemoje, ji tarnauja kaip testavimo aplinka, skirta paleisti visą „Gemma“ modelių šeimą (įskaitant „Gemma 3n“ ir „Gemma 4“) tiesiai įrenginyje. Nors tai nėra diktavimo įrankis, ji demonstruoja šios modelių linijos potencialą ir leidžia vartotojams išbandyti pokalbių režimus, nuoseklų samprotavimą, raginimų laboratoriją ir lyginamąją analizę savo aparatinėje įrangoje.

Įrenginio reikalavimai, prieinamumas ir suderinamumas

Kadangi tai yra programa, kuri labai priklauso nuo apdorojimas įrenginyje„Eloquent“ reikalingas „iPhone“ su gana galingu neuroniniu varikliu. „Google“ nurodo, kad programa yra optimizuota „iPhone 17“ ir naujesnės versijos su „iOS 26.0“ ar naujesne versija, ypač rekomenduojant tokius įrenginius kaip „iPhone 16 Pro“ ir „iPhone 17“, kad būtų užtikrinta geriausia patirtis su „Gemma“ modeliais.

Kol kas programėlė pasiekiama tik anglų kalba ir tik „iOS“. Pradinėje „App Store“ versijoje aiškiai buvo paminėtas „Android“ palaikymas, tačiau ši nuoroda vėliau dingo, o tai rodo, kad „Google“ operacinei sistemai skirta versija yra kuriama ir gali pasirodyti vėliau.

Kalbant apie geografinį pasiskirstymą, „Eloquent“ galima atsisiųsti adresu Jungtinės Valstijos, Indija ir kai kurie kiti regionaiTačiau jo patekimą į Europą riboja reguliavimo problemos. „Google“ nurodė, kad jo prieinamumas JK, Europos ekonominėje erdvėje ir Šveicarijoje yra ribotas, kol bus gauti reikiami patvirtinimai, ir kad jie aktyviai dirba siekdami plėstis šiose srityse.

Verta paminėti, kad „Google“ pasirinko programėlę paleisti pirmoji... iOS vietoj AndroidDaugelis šį žingsnį interpretuoja kaip būdą išbandyti savo „Edge AI SDK“ uždaroje ir labai homogeniškoje aparatinės įrangos aplinkoje, pasinaudojant „iPhone“ vartotojų baze, kuri linkusi greitai pritaikyti tokio tipo produktyvumo įrankius.

Kai programėlė taps plačiau paplitusi visame pasaulyje ir palaikys daugiau kalbų, ji greičiausiai taps mėgstama visų, norinčių diktuoti ilgus tekstus nesijaudindami dėl privatumo ar interneto ryšio, jei tik turi suderinamą įrenginį.

Naudojimo modelis, kainodara ir pagrindiniai DUK

Pristatymo metu „Eloquent“ buvo pristatytas kaip visiškai nemokama programaNorint naudotis pagrindinėmis neprisijungus veikiančiomis diktavimo ir teksto valymo funkcijomis, nereikia „Google Workspace“ prenumeratos, be to, nėra jokių dienos naudojimo apribojimų, todėl galite diktuoti tiek, kiek norite, nesijaudindami dėl kvotų.

Integracija su pažangiais modeliais Dvyniai Nors tam tikros „Workspace“ funkcijos gali skirtis priklausomai nuo regiono, pagrindinė programėlė (diktavimas neprisijungus naudojant „Gemma“ modelius) yra nemokama. Dėl šios politikos ji yra labai patrauklioje pozicijoje, palyginti su sprendimais, kuriems norint atrakinti visas funkcijas, reikia mokamų planų.

Kalbant apie neprisijungus pasiekiamą funkcionalumą, „Eloquent“ yra sukurta taip, kad būtų 100 % tinkamas naudoti neprisijungus prie interneto Atsisiuntus pradinį kalbos modelį, galite įjungti lėktuvo režimą ir tęsti diktavimą nenaudodami duomenų; transkripcijos ir valymas atliekami tik įrenginyje nuo pradžios iki pabaigos.

Kalbant apie duomenų apsaugą, programėlė veikia pagal šią prielaidą: Balsas ir tekstas nepalieka jūsų mobiliojo telefono tol, kol neaktyvuosite funkcijų, kurios aiškiai priklauso nuo debesies. Dėl to tai labai įdomu teisiniam, medicininiam ar korporaciniam darbui, kur konfidencialumas yra svarbiausias ir tipinio pranešimo „jūsų duomenimis elgiamės saugiai“ nepakanka.

Galiausiai, rezultatų eksportavimas yra gana lankstus: galite siųsti tekstą į „Google“ dokumentusGalite jį bendrinti kaip TXT failą, konvertuoti į PDF arba integruoti su kitomis dokumentų ir projektų valdymo sistemomis. Yra net rekomendacijų, kaip jį naudoti su dirbtinio intelekto įrankiais, tokiais kaip „iWeaver“, kurie gali šiuos transkriptus paversti struktūrizuotomis ataskaitomis, posėdžių protokolais ar sudėtingesniais dokumentais, jums nereikės visko rašyti ranka.

Apskritai „Google AI Edge Eloquent“ save pozicionuoja kaip dirbtinio intelekto valdomą diktavimo įrankį, kuris sujungia tikras privatumas, vietinė galia ir pažangus suasmeninimasir ji turi erdvės augti, nes pasiekia daugiau kalbų, regionų ir platformų, ypač kai pasirodys „Android“ versija ir bus atrakinta jos prieinamumas Europoje.

Dvyniai jau kalba ispaniškai
Susijęs straipsnis:
„Gemini Live“ ispanų kalba: išsamus „Google“ dirbtinio intelekto, naudojimo, funkcijų ir naujų funkcijų vadovas.