गूगल के कार्यकारी सदस्य समीर समात और डेव बर्क ने एंड्रॉयड पर एआई की योजनाओं का विवरण दिया, और विकल्प, हाइब्रिड दृष्टिकोण और जब आपका फोन एआई प्राप्त करता है के बारे में प्रश्नों का उत्तर दिया।
Google की वार्षिक डेवलपर कॉन्फ्रेंस की मुख्य उद्घाटना में किसी भी कुछ कमी की उम्मीद करना, जो Google द्वारा कृत्रिम बुद्धिमत्ता (AI) की घोषणाओं के एक हमले से पहले होती, यह गलत होता। तकनीकी उद्यम विरोधी भीड़ कितनी कठोर है को ध्यान में रखते हुए, इस टेक जादूगर को मस्ती दिखाने की जरूरत थी। एक अपडेटेड जेमिनी 1.5 प्रो मॉडल जो तार्किक तर्क वाला है, एक नया जेमिनी लाइव जो इस वर्ष के बाद में अधिक क्षमताओं को प्राप्त करेगा, एक नया और हल्का जेमिनी 1.5 फ्लैश, जेमिनी नैनो के लिए अपडेट और सर्च में अधिक AI शामिल हैं। हालांकि, एंड्रॉयड के लिए एक नए युग की घोषणा, जो कृत्रिम बुद्धिमत्ता के एक चादर में बांधी गई है, जिसमें 30 अरब से अधिक सक्रिय एंड्रॉयड उपयोगकर्ताओं के एक बड़े सबसेट तक तुरंत पहुंचेगा।
समीर समात, जो गूगल में एंड्रॉयड के लिए उत्पाद प्रबंधन के उपाध्यक्ष हैं, ने एचटी को बताया कि यह “एंड्रॉयड के उपभोक्ता अनुभव को पुनरावलोकन करना है और आपके फोन के साथ AI के केंद्र में आपके इंटरैक्शन का तरीका, और वह बहुवर्षीय यात्रा अब शुरू होती है।”
एंड्रॉयड के एआई अध्याय के साथ, गूगल संभावित रूप से प्रभाव में माइक्रोसॉफ्ट के कोपिलॉट एआई सहायक को Windows 11 में इंटीग्रेशन करने के संबंध में छाया चाँद बना देता है। कोपिलॉट संभावित रूप से एक छोटे समय में 500 मिलियन पीसी तक पहुंच गया। यह कितनी तेजी से इन अपडेट्स को उपयोगकर्ता उपकरणों तक पहुंचाई जाती है, इस पर बहुत कुछ निर्भर करेगा। एंड्रॉयड के एआई रोलआउट के लिए, टैबलेट यात्रा का अत्यंत महत्वपूर्ण हिस्सा है।
Android x AI, it’s time.
एंड्रॉयड के लिए एआई की तीन सुविधाएँ हैं, जो खोज के लिए सर्कल, गेमिनी जो गूगल असिस्टेंट की जगह डिफ़ॉल्ट एआई सहायक बन रहा है, और अनेक ऑन-डिवाइस कार्यों के लिए अपडेटेड गेमिनी नैनो मॉडल का विस्तार। अब तक, एंड्रॉयड में कुछ एआई की क्षमताएँ थीं, लेकिन वे अक्सर कुछ उपकरणों पर सीमित रहती थीं (जैसे कि गूगल के अपने पिक्सेल फोन) या विस्तार में थीं। एक सिर के अंत में गूगल का रिकॉर्डर ऐप था, जो रिकॉर्डिंग को ट्रांसक्राइब करने के लिए एआई का उपयोग करता है। दूसरी ओर, मैसेजेज ऐप में एआई एकीकरण का उदाहरण अधिकतम विस्तार के साथ बिना वार्ता एकीकरण रखता था – इसका मतलब था कि एआई क्षमताएँ उपयोगकर्ता द्वारा ड्राफ्ट संदेश बनाने या आयोजित कार्यों की जनरेट करने के लिए पाठ प्रोम्प्ट्स तक सीमित रहती थी।
एचटी ने समात से पूछा कि एंड्रॉयड हार्डवेयर की विविधता, विशेष रूप से मध्यम और बजट फोनों के साथ, आने वाले दो सालों में हल करने का एक समस्या साबित हो सकता है।
“एंड्रॉयड इकोसिस्टम की एक मजबूती यह है कि विभिन्न कीमत सीमाओं पर उपभोक्ताओं के लिए विभिन्न उपकरणों की विविधता है,” उन्होंने कहा, और फिर जोड़ा कि हालांकि यह सशक्त करने के लिए अधिक उपयोगकर्ताओं को शक्तिशाली कंप्यूटिंग उपकरण खरीदना बहुत अच्छा रहा है, कुछ प्रीमियम एंड्रॉयड डिवाइस हैं जिनमें अधिक शक्तिशाली हार्डवेयर होता है जिसमें एक न्यूरल प्रोसेसिंग यूनिट (एनपीयू; ऑन-डिवाइस एआई प्रोसेसिंग के लिए महत्वपूर्ण) और तेजी से एआई क्षमताएँ शामिल होती हैं।
“हमारी रणनीति सामान्यत: निष्क्रिय करने के लिए हाइब्रिड मॉडल होने का सुनिश्चित करना है। कुछ कारणों से गोपनीयता और लैटेंसी के लिए केवल उपकरण पर किया जाएगा। अधिकांश कार्यों को उपकरण पर करना संभव हो सकता है, लेकिन जब नहीं, तो क्लाउड पर जाएं। हम मानते हैं कि यह दृष्टिकोण इकोसिस्टम को अच्छी तरह सेवा करता है,” समात ने कहा।
HT ने समत से पूछा कि अगले कुछ सालों में एंड्रॉयड हार्डवेयर की विविधता, विशेष रूप से मिड-रेंज और बजट फोनों के साथ, सामने आने वाली समस्या साबित हो सकती है।
“एंड्रॉयड इकोसिस्टम की एक मजबूती यह है कि उपभोक्ताओं के लिए विभिन्न मूल्य सीमाओं पर और विभिन्न क्षमताओं के साथ उपलब्ध डिवाइस की विविधता है,” उन्होंने कहा, पहले यह जोड़ते हुए कि जबकि शक्तिशाली कंप्यूटिंग उपकरण खरीदने के लिए अधिक उपयोगकर्ता मिलना बढ़ा है, तो प्रीमियम एंड्रॉयड उपकरण हैं जिनमें अधिक शक्तिशाली हार्डवेयर, न्यूरल प्रोसेसिंग यूनिट (एनपीयू; डिवाइस पर एआई प्रोसेसिंग के लिए महत्वपूर्ण) और त्वरित एआई क्षमताएं हैं।
“हमारी रणनीति सामान्य रूप से यह है कि हम संविदा के लिए एक हाइब्रिड मॉडल सुनिश्चित करें। कुछ कारणों से डिवाइस पर केवल कुछ कार्रवाई की जाएगी जिसमें गोपनीयता और लेटेंसी के कारण। अधिकांश कार्रवाई को डिवाइस पर निष्पादित किया जा सकता है, लेकिन जब नहीं, तो बाद में क्लाउड में जाएं। हमें लगता है कि यह दृश्यमिक को अच्छी तरह सेवा करेगा,” समत ने कहा।
“मुझे लगता है कि समय के साथ, आप अनूढ़ मॉडल या मॉडल को और विशिष्ट उपयोग मामलों में विभाजित होते हुए देखेंगे। वर्तमान में, जेमिनी नैनो मल्टीमोडल मॉडल वास्तव में स्थिति की कला है जो संभव है की किनारे को धकेल रहा है,” यह तीर लगाया डेव बर्क, जो गूगल में इंजीनियरिंग के उप-प्रधानमंत्री है।
“जब, कैसे, और फोन निर्माताओं को”
उपयोगकर्ताओं को नए एआई सुविधाओं का उपयोग करने के लिए उनके एंड्रॉयड उपकरणों तक पहुंचने में कितना समय लगेगा? जवाब, गूगल हमें बताता है, यह एक दो-प्रोंग दृष्टिकोण में है।
“एंड्रॉयड हमेशा बेहतर हो रहा है और इसलिए हमारे कई अनुभव Google Play सेवाओं और प्ले सिस्टम अपडेट्स का हिस्सा हैं। हम अपने साथियों के साथ मिलकर इन अनुभवों को उनके डिवाइस पर लाने के लिए काम करते हैं,” समत ने कहा। इसका मतलब है कि ये दो प्रकार के अपडेट्स अंड्रॉयड फोनों और टैबलेट्स पर कुछ नई एआई कार्यक्षमता को सक्षम करने चाहिए, जो तकनीकी विशेषताओं पर निर्भर करता है।
उनके साथ, वे SoC साथियों (अर्थात, Qualcomm और MediaTek जैसे चिप निर्माताओं) के साथ कड़ी मेहनत कर रहे हैं ताकि जेमिनी नैनो फ्लैगशिप डिवाइस पर प्रभावी रूप से चल सके।
और फिर एक तीसरा तत्व होगा, जहां फोन निर्माताओं को अधिक अनुकूलित करने के लिए Android के आधारभूत परिवर्तनों के साथ काम करना होगा ताकि वे अपनी कस्टमाइजेशन के साथ काम कर सकें (सैमसंग का वन यूआई, शाओमी का हाइपरओएस, वनप्लस का ऑक्सीजनओएस, आदि)।
इसके साथ, सैमसंग के गैलेक्सी एस24 फ्लैगशिप फोनों के लिए सर्किल टू सर्च के लिए एक अवसान भी है। समत ने कहा कि इस सर्च विधि की अधिक व्यापक एकीकरण विद्यार्थियों की प्रतिक्रिया के बाद, गोली के लिए भी ऑप्टिमाइज़ किया गया है। उन्होंने एक भौतिकी समस्या के उदाहरण का संदर्भ दिया, जिसमें एक छात्र स्क्रीन पर गोली लगा सकता है ताकि उसमें सर्च को लागू कर सके, जिसके बाद इसे हल करने के लिए चरण-दर-चरण निर्देशों को विस्तार से बताया जाता है। “यह केवल इसलिए संभव है क्योंकि सर्च और हमारे ऑपरेटिंग सिस्टम के साथ हमने क्या किया है के बीच गहरा एकीकरण है,” उन्होंने कहा।
एंड्रॉयड बड़े जेमिनी प्रो मॉडल का उपयोग करेगा, साथ ही एक छोटे जेमिनी नैनो मॉडल का भी, जिसमें अंतिम में उपकरण प्रोसेसिंग एक विकल्प होगा।
कुछ समय तक, गूगल ने उपयोगकर्ताओं को एक विकल्प दिया, जिसमें उन्हें गूगल असिस्टेंट को जेमिनी एआई में स्विच करने की सुविधा दी गई। अब जब संक्रमण पूरा हो चुका है। जेमिनी की संदर्भज्ञता क्षमताओं, जैसा कि बर्क ने उजागर किया, उपयोगकर्ता क्या करने की कोशिश कर रहा है और यह सहायकता के सुझावों के संदर्भ और महत्व को बढ़ावा देगा।
उदाहरण के लिए, मैसेजेस ऐप में, जेमिनी को एक उपयोगकर्ता द्वारा एक फ्लोटिंग सहायक विंडो के रूप में खोला जा सकता है, जिसे खोज और छवि उत्पन्न करने के लिए उपयोग किया जा सकता है। बर्क ने मैसेजेस में एक वीडियो लिंक प्राप्त करने के उदाहरण के साथ इसे बताया, जो यूट्यूब पर खुलता है, और मैसेजेस में जेमिनी वीडियो के बारे में जागरूक है और अधिक जानकारी के लिए सुझाव देता है। या यह कैसे संदर्भ दे सकता है और किसी भी महाशय द्वारा साझा किए गए विशालकाय पीडीएफ दस्तावेज से प्रश्नों का उत्तर दे सकता है।
डिवाइस पर एआई, जिसका अर्थ है कि कार्यों को स्थानीय रूप से एक फोन या टैबलेट पर प्रोसेस किया जाएगा और इसे बाद में क्लाउड में नहीं भेजा जाएगा, गूगल के एंड्रॉयड के लिए एआई के दृश्य में मुख्य भूमिका निभाता है। इसका मूल है 3.8 अरब पैरामीटर जेमिनी नैनो मॉडल। “इसका मतलब है कि अब आपका फोन अब दुनिया को उसी तरह समझने लगा है जिसे आप समझते हैं, बस पाठ इनपुट ही नहीं, बल्कि वास्तविक दृश्य और ध्वनि और बोली भाषा,” कहा समत।
अब तक, गूगल पिक्सेल फोनों पर रिकॉर्डर ऐप की प्रतिलिपि क्षमताएँ एक उदाहरण हैं।
एंड्रॉयड के एआई दृश्य के द्वारा लाखों उपयोगकर्ताओं तक पहुंचने की चुनौती के क्षेत्र में, क्या उपयोगकर्ताओं के लिए डेटा साझा करने के लिए एक विकल्प या तरीका होगा जिसमें एआई की प्रशिक्षण और सुधार के लिए? “आप चुन सकते हैं कि आप किस तरह और कहाँ एआई-पावर्ड सुविधाओं का उपयोग करना चाहते हैं। उदाहरण के लिए, एंड्रॉयड पर जेमिनी ऐप वैकल्पिक है, और आपके फोन की सेटिंग्स में सर्किल टू सर्च को बंद किया जा सकता है,” समंत ने पुष्टि की। गूगल ने कहा कि ये विकास उनके एआई सिद्धांतों से जुड़ा हुआ है, और इसलिए उपयोगकर्ताओं को विकल्प दिया जाएगा।