
Google förbättrar snabbt Gemini genom att lägga till mer meningsfulla funktioner, varav en är Gemini Live med Video, en projekt Astra-driven kapacitet. Den här funktionen, som nu rullar ut för att välja användare, gör det möjligt för Gemini att analysera enhetens skärm i realtid och ge naturliga språksvar.
Project Astra, som tillkännagavs förra året, är Googles initiativ för att utveckla AI-chatbots som kan realtidsinteraktion med en smartphones skärm eller kamera. Google bekräftade planer på att lansera Gemini live med video förra månaden, och nu rapporterar tidiga användare att funktionen är live på sina enheter.
Läs också: Top Gemini -funktioner du behöver behärska
Tvillingarna “Screen Share with Live” -funktion
En Reddit-användare med en Xiaomi-enhet delade nyligen att de nu har tillgång till “skärmandel med Gemini”, vilket gör att Gemini Live kan se vad som finns på din skärm i realtid-snarare än att analysera en statisk bild eller inspelat klipp. Användare kan ställa Gemini live frågor om vad som visas och till och med delta i diskussioner baserat på innehållet.
Funktionen är enligt uppgift funktionell i de flesta appar, inklusive galleriet och webbläsaren. Men när användaren bad Gemini lever att öppna YouTube, svarade AI att den är begränsad till att chatta och samarbete. Det här verktyget kan nås via den nya “Skärmandelen med Gemini” -knappen, som ligger ovanför knappen “Ask om skärm” i Gemini Floating Sheet.
Låt Gemini Live komma åt ditt kameraflöde
En annan funktion som rullar ut tillsammans med skärmandel med Gemini är Gemini Live med video, vilket gör det möjligt för användare att mata live -kameravyer till Gemini. Till skillnad från skärmdelning tillåter denna funktion Gemini att analysera live -kameran, vare sig det är bakifrån eller främre kameran.
Google demonstrerade att denna kapacitet kan hjälpa användare att diskutera och interagera med sin omgivning i realtid. När den är tillgänglig kan funktionen nås via Gemini-appen genom att lansera Gemini Live och trycka på den nya videoknappen, som också stöder en pausfunktion som liknar röst-endast Gemini Live.
Till skillnad från Google Lens eller “Ask om skärm” -verktyget, Gemini Live med video möjliggör en mer naturlig, talbaserad konversation, snarare än att förlita sig på en webbaserad söklayout. Detta gör interaktioner mer flytande och intuitiva.
Spännande eller om?
En viktig övervägande med Gemini Lives kapacitet är hur Google kan använda data och media som delas genom funktionen. Liksom med andra Gemini-multimodala verktyg kan ingångar som röst, bilder eller andra interaktioner utnyttjas för att ytterligare träna och förfina Googles AI-modeller.
På den spännande sidan betyder detta att Gemini kan bli betydligt mer lyhörd, intelligent och personlig över tid. Genom att lära sig av verklig användning kan systemet anpassa sig till användarnas preferenser och behov och i slutändan erbjuda mer intuitivt hjälp och innovativa funktioner. Denna typ av kontinuerlig förbättring är kärnan i den senaste AI.
Men på den angående sidan väcker detta också viktiga frågor om datasekretess och kontroll. Även om Google lovar att upprätthålla samma integritets- och säkerhetsstandarder som tillämpas över sina tjänster, kan användare undra hur exakt deras data används, vem som kan komma åt dem och hur länge det lagras. Transparens kommer att vara nyckeln. Användare bör förvänta sig – och efterfrågan – rena, tillgängliga förklaringar av datahanteringspraxis.
Vi räknar med att Google kommer att ge mer detaljerade upplysningar när Gemini Live rullar ut, särskilt kring användarkontroller, opt-in-mekanismer och integritetsskydd. Fram till dess kan användare befinna sig balansera spänningen hos smartare AI med en hälsosam dos av försiktighet.
För tillfället verkar Gemini Live -funktioner rulla ut till ett mycket begränsat antal användare. Jag kollade på min Samsung Galaxy -enhet och fann att funktionen ännu inte har aktiverats. Dessutom kräver åtkomst till dessa verktyg ett Google One AI -premiumabonnemang.
Har du testat något av Geminis AI -verktyg? Vilka funktioner tycker du är mest användbara? Dela dina tankar i kommentarerna!
Via: 9to5google
Källa:
Reddit