हर गर्मियों में, टेक दिग्गज अपने सॉफ़्टवेयर उत्पादों, ऐप्स के लिए एक नई दिशा का अनावरण करते हैं, और ऐप डेवलपर्स के लिए टूल पर अपग्रेड किए जाते हैं। समय ऐसा है कि यह वर्ष के उत्तरार्ध में अंतिम रिलीज की ओर ले जाता है। उदाहरण के लिए, Apple अगले iPhone लाइन-अप (आमतौर पर सितंबर के मध्य) के बिक्री के समय के आसपास iOS रिलीज़ को मेल खाता है। इस सीजन में, दृष्टिकोण में बहुत ध्यान देने योग्य बदलाव आया है। Google, Microsoft और अब Apple, उपभोक्ताओं को फिर से सुर्खियों में ला रहे हैं; ऐसा कुछ नहीं है जो कई वर्षों में डेवलपर-केंद्रित आयोजनों में हुआ हो।
यह परिवर्तन दोतरफा है। सबसे पहले और सबसे महत्वपूर्ण, सभी तीन डेवलपर कॉन्फ्रेंस कीनोट्स के लिए सामान्य, कृत्रिम बुद्धिमत्ता (एआई) पर व्यापक ध्यान है, विशेष रूप से उपभोक्ता-सामना करने वाले उत्पादों के लिए। Google और Microsoft इसके बारे में अधिक मुखर हैं, जिसमें Apple थोड़ा अलग है। दूसरा नए उत्पादों का लॉन्च है, जिसमें कंप्यूटिंग डिवाइस, टैबलेट, फोल्डेबल स्मार्टफोन शामिल हैं, और वास्तव में, संवर्धित वास्तविकता (एआर) हेडसेट पर ऐप्पल का ताज़ा लेना।
Google ने Pixel लाइन-अप का विस्तार किया, कंपनी के पहले फोल्डेबल स्मार्टफोन के साथ जिसे Pixel Fold कहा जाता है, 11 इंच के टैबलेट के साथ Pixel Tablet कहा जाता है। बहुमुखी प्रतिभा पहलू एक आकर्षण बना हुआ है, विशेष रूप से टैबलेट के स्मार्ट होम डिस्प्ले में बदलने के साथ, जब डॉक किया जाता है।
जबकि Microsoft ने नए हार्डवेयर की घोषणा नहीं की, जिसमें सरफेस पीसी लाइन-अप (विंडोज और एआई पर ध्यान केंद्रित करना) शामिल है, ऐप्पल ने लॉन्च के मोर्चे पर बड़े पैमाने पर पालन किया। नया मैक स्टूडियो और मैक प्रो डेस्कटॉप मैक के लिए इंटेल के अध्याय के अंत का संकेत देता है, कम से कम अभी के लिए। 15-इंच मैकबुक एयर से अल्ट्रापोर्टेबल लेकिन बड़े स्क्रीन वाले लैपटॉप की एक नई श्रेणी शुरू होने की उम्मीद है।
फिर भी, यह Apple विजन प्रो AR हेडसेट है, जिसे Apple “पहले स्थानिक कंप्यूटर” के रूप में वर्णित करता है, जो निस्संदेह गर्मियों का मुख्य आकर्षण है।
एप्पल के मुख्य कार्यकारी अधिकारी (सीईओ) टिम कुक ने कहा, “आज कंप्यूटिंग के लिए एक नए युग की शुरुआत हुई है।” “जिस तरह मैक ने हमें व्यक्तिगत कंप्यूटिंग से परिचित कराया, और iPhone ने हमें मोबाइल कंप्यूटिंग से परिचित कराया, उसी तरह Apple Vision Pro ने हमें स्थानिक कंप्यूटिंग से परिचित कराया,” उन्होंने कहा।
इस $3,499 (जो लगभग है) से पहले जाने के लिए अभी भी कुछ रास्ता है ₹2,88,700) हेडसेट बिक्री पर जाता है, लेकिन कई मायनों में, अनुभव और उपयोगिता बेंचमार्क सेट किया गया है। यह हेडसेट से स्क्रीन के तत्व को हटा देता है, भौतिक परिवेश को कैनवास में बदल देता है। नियंत्रण के लिए आंखों, उंगलियों और हाथ के इशारों का उपयोग किया जा सकता है, और यह वर्चुअल कंप्यूटिंग डिवाइस, होम थिएटर या स्पोर्ट्स स्ट्रीमिंग हब भी बन सकता है। डेवलपर्स पहले से ही विज़नओएस पर ध्यान दे रहे हैं, जो एआर हेडसेट को शक्ति प्रदान करता है।
जनरेटिव एआई, मौसम का स्वाद
Google I/O 2023 में बार्ड चैटबॉट को सभी के लिए उपलब्ध कराया गया था। यह OpenAI के ChatGPT और Microsoft के बिंग चैटबॉट से जुड़ता है, जो GPT-4 फाउंडेशन का भी उपयोग करता है। व्यापक रूप से उपलब्ध कराने से पहले Google ने बार्ड को एक छोटे परीक्षण लूप में रखा, क्योंकि तकनीकी दिग्गज अधिक उपयोगकर्ताओं को बुद्धिमान उपकरण सौंपते समय सावधानी से चलने का प्रयास करते हैं।
मुख्य वक्ता के रूप में गूगल और अल्फाबेट के सीईओ सुंदर पिचाई ने कहा, “एआई को हर किसी के लिए मददगार बनाने की हमारी क्षमता हमारे फाउंडेशन मॉडल को लगातार आगे बढ़ाने पर निर्भर करती है।” बार्ड Google के नवीनतम लार्ज लैंग्वेज मॉडल (LLM), पाम 2 का उपयोग करता है।
Google एआई-जनित छवियों की पहचान करने के लिए एक नए सर्च टूल पर भी काम कर रहा है, वर्कस्पेस ऐप्स के लिए सर्च और डुएट एआई टूल्स के लिए प्रायोगिक जनरेटिव एआई। एंड्रॉइड में ज्यादा स्पॉटलाइट नहीं थी, लेकिन संदेश ऐप को उपयोगकर्ता के स्वर को दोहराने का प्रयास करते समय संदेशों के संदर्भ के आधार पर उत्तर उत्पन्न करने के लिए मैजिक कंपोज़ नामक कुछ मिलेगा।
बिल्ड 2023 में, Microsoft ने खोज स्थान में एक महत्वपूर्ण कदम उठाया, जिसमें Bing ChatGPT के लिए डिफ़ॉल्ट खोज इंजन बन गया। यह तब आता है जब OpenAI अपने चैटबॉट को इंटरनेट से जोड़ता है। चैटजीपीटी के स्मार्टफोन ऐप में भी विकसित होने के साथ, आईफोन से शुरू होकर, एक बहुत बड़ा उपयोगकर्ता जनसांख्यिकीय संभावित रूप से बिंग का इंतजार कर रहा है।
“अब, चैटजीपीटी उत्तरों को खोज और वेब डेटा द्वारा आधार बनाया जा सकता है और इसमें उद्धरण शामिल हैं ताकि आप और अधिक सीख सकें—सब कुछ सीधे चैट के भीतर से,” माइक्रोसॉफ्ट में मॉडर्न लाइफ एंड डिवाइसेज ग्रुप के कॉर्पोरेट उपाध्यक्ष यूसुफ मेहदी कहते हैं।
दुनिया में कहीं कैमरे द्वारा कैप्चर की गई तस्वीरों से एआई-जेनरेट की गई छवियों का पता लगाने में उपयोगकर्ताओं की मदद करने के लिए Google के टूल की तरह, माइक्रोसॉफ्ट अपने मूल के बारे में मेटाडेटा के साथ एआई-जेनरेट की गई सामग्री को चिह्नित करने और हस्ताक्षर करने के लिए क्रिप्टोग्राफ़िक विधियों को रोल आउट करने की योजना बना रहा है।
Microsoft के उपभोक्ता-सामना करने वाले उत्पादों में भी अधिक AI खेल था। Copilot नामक एक AI सहायक आने वाले महीनों में विंडोज पीसी पर आ जाएगा, जिसमें सिस्टम-व्यापी एकीकरण शामिल है, जिसमें ऐप्स, वेब पेज, दस्तावेज़ और ईमेल अटैचमेंट से सामग्री का सारांश शामिल है। कोरटाना, भाग दो?
वास्तविकता पर एप्पल की अलग राय
जबकि Microsoft और Google समान स्थानों में जूझ रहे हैं, Apple के AI उपकरण iPhone, iPad और Mac पर उपलब्ध ऐप्स और सेवाओं की नींव के रूप में अधिक प्रमुख हैं। वर्ल्डवाइड डेवलपर कॉन्फ्रेंस (WWDC) में, iOS 17 की पहली झलक के बीच, यह स्पष्ट हो गया कि Apple इसे अभी तक एक और AI चैटबॉट के साथ स्लग करने का इरादा नहीं रखता है। या टेक्स्ट-टू-इमेज ऐप।
इसके बजाय, iMessage को ऑडियो संदेशों को स्थानांतरित करने की क्षमता मिलेगी, जबकि ध्वनि मेल संदेशों को प्रसारित किया जाएगा जिससे उपयोगकर्ता एक महत्वपूर्ण कॉल का उत्तर दे सकेंगे। जब कोई उपयोगकर्ता पाठ टाइप कर रहा होता है, तो व्याकरण पर ध्यान केंद्रित करने के लिए नए वाक्य स्वत: सुधार और बेहतर आवाज टाइपिंग सटीकता के लिए एक नया वाक् पहचान मॉडल के साथ ट्रांसफ़ॉर्मर भाषा मॉडल के उपयोग से ऑटो-करेक्ट में सुधार होने की संभावना है।
“iOS 17 के साथ, हमने उन विशेषताओं पर गहराई से विचार करके iPhone को अधिक व्यक्तिगत और सहज बना दिया है, जिन पर हम सभी हर दिन भरोसा करते हैं,” सॉफ्टवेयर इंजीनियरिंग के Apple के वरिष्ठ उपाध्यक्ष क्रेग फेडरघी कहते हैं।
यहां तक कि नई स्टैंडबाय सूचना स्क्रीन, जब एक आईफोन मैगसेफ़ वायरलेस चार्जर से जुड़ा होता है, समय और संदर्भ-आधारित सुझावों के लिए मशीन लर्निंग का उपयोग करेगा। यह प्रत्येक चार्जर के लिए विशिष्ट स्क्रीन वरीयताएँ भी याद रखेगा।
क्या विकास को आगे बढ़ा रहा है?
बहुत सारे जनरेटिव एआई इकोसिस्टम डेवलपमेंट टेक दिग्गजों को विकसित होने के लिए प्रेरित कर रहे हैं। Adobe Firefly, जो अब फोटोशॉप का भी हिस्सा है। मध्य यात्रा। डल-ई। स्थिर प्रसार। फ़्रीवे। फोटो कला। नाइट कैफे ए.आई. क्रेयॉन। स्टाररी एआई। जैस्पर। फोटोसोनिक। एआई इमेजिंग स्पेस में बस कुछ नाम।
एंड्रॉइड 14 के लिए दो विज़ुअल फ़ीचर, जिन्हें सिनेमैटिक वॉलपेपर और जनरेटिव एआई वॉलपेपर कहा जाता है, एक छवि उत्पन्न करने के लिए Google के टेक्स्ट-टू-इमेज डिफ्यूजन मॉडल का उपयोग करेंगे। इसे वेब पर उपलब्ध मिडजर्नी या स्टेबल डिफ्यूजन एआई टूल्स के मेल के रूप में सोचें, लेकिन Android उपकरणों के लिए बहुत विशिष्ट कार्यक्षमता।
Google फ़ोटो, एक ऐसा ऐप जो हमेशा संपादन क्षमताओं के साथ आगे बढ़ता है, इस वर्ष के अंत में एआई-संचालित जटिल संपादन विकल्प जोड़ेगा। मैजिक एडिटर, जैसा कि सूट कहा जाता है, एआई कम्प्यूटेशनल फोटोग्राफी का उपयोग करता है ताकि एक फ्रेम के भीतर विषय को फिर से स्थापित करने और एक तस्वीर में तत्वों को जोड़ने या हटाने सहित उपकरणों को सक्षम किया जा सके।
Microsoft का बिंग इमेज क्रिएटर, जो OpenAI के Dall-E टेक्स्ट-टू-इमेज सिस्टम का उपयोग करता है, अब Bing AI चैट में भी एकीकृत हो गया है। माइक्रोसॉफ्ट के मेहदी ने कहा, “हम अनुसंधान से जानते हैं कि मानव मस्तिष्क पाठ की तुलना में लगभग 60,000 गुना तेजी से दृश्य जानकारी संसाधित करता है, दृश्य उपकरण लोगों को खोजने, बनाने और समझने का एक महत्वपूर्ण तरीका बनाता है।”
डेवलपर्स: अंतरिक्ष साझा करना
इस साल के सम्मेलनों के लिए दृष्टिकोण में बदलाव के बीच, डेवलपर्स तकनीकी दिग्गजों के लिए एक महत्वपूर्ण भूमिका निभा रहे हैं। एक बार जब कैमरा चमकना बंद हो जाता है, तो ध्यान वापस डेवलपर्स के पास चला जाता है। ऐप्पल ने पिछले साल की संख्या के साथ, ऐप डेवलपर्स पर ध्यान केंद्रित करने के महत्व को स्पष्ट किया है। वे कहते हैं कि ऐप स्टोर इकोसिस्टम ने 2022 में डेवलपर बिलिंग और बिक्री में $1.1 ट्रिलियन की सुविधा दी। यह साल-दर-साल 29% की वृद्धि है।
बड़ी तकनीक में किसी का महत्व कम नहीं हुआ है।
Google ऐप डेवलपर्स की सहायता के लिए एक कोडिंग बॉट कोडी विकसित कर रहा है। उन्हें Android उपकरणों के लिए Play Store पर ऐप्स के लिए लिस्टिंग जेनरेट करने के लिए AI टूल भी मिलेगा। एंड्रॉइड स्टूडियो एक संवादी तत्व, हेजहोग जोड़ रहा है, जो डेवलपर्स को कोड लिखने और बग को जल्द से जल्द ठीक करने में मदद करेगा, अन्यथा उन्हें पता चल जाएगा। यह फिलहाल शुरुआती परीक्षण चरण में है।
Microsoft डेवलपर्स के लिए अधिक AI टूल उपलब्ध करा रहा है और उम्मीद है कि प्लगइन मानकों के मानकीकरण से डेवलपर्स के लिए ChatGPT के लिए एक्सटेंशन बनाना आसान हो जाएगा, उन्हें कोपिलॉट में भी पोर्ट करना आसान हो जाएगा। डेवलपर अब प्लगइन्स बनाने के लिए एक मंच का उपयोग कर सकते हैं जो चैटजीपीटी, बिंग, डायनेमिक्स 365 कोपिलॉट और माइक्रोसॉफ्ट 365 कोपिलॉट सहित उपभोक्ता और व्यावसायिक उत्पादों दोनों पर काम करता है।
माइक्रोसॉफ्ट के कार्यकारी अध्यक्ष और सीईओ सत्या नडेला ने कहा, “यह आपके डेवलपर्स के लिए सबसे शक्तिशाली चीजों में से एक है, प्रत्येक डेवलपर के लिए प्लगइन लिखने में सक्षम होना और इन सभी सतह क्षेत्रों में अरबों उपयोगकर्ताओं तक पहुंचना।”
WWDC में, Apple की उन सभी तकनीकों के लिए अपडेट हैं, जिनमें डेवलपर्स प्लग इन करते हैं, जिनमें SwiftUI, नई मशीन लर्निंग API (या एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस) शामिल है, जिसमें AR के लिए VisionKit और बातचीत के लिए नेचुरल लैंग्वेज फ्रेमवर्क, मैक पर गेम पोर्ट करने के लिए मेटल और पासकी शामिल हैं। अब विश्वसनीय संपर्कों के साथ साझा करने योग्य हैं।