Move to Jagran APP

आवाज की हू-ब-हू नकल करने वाले स्पीच AI Model को तैयार कर रहा Microsoft, लॉन्च को लेकर है डर

माइक्रोसॉफ्ट ने VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

By Shivani Kotnala Edited By: Shivani Kotnala Updated: Tue, 16 Jul 2024 11:33 AM (IST)
Hero Image
Microsoft तैयार कर रहा एक नया एआई मॉडल, लेकिन लॉन्च को लेकर सता रहा डर
टेक्नोलॉजी डेस्क, नई दिल्ली। माइक्रोसॉफ्ट ने एक रिसर्च प्रोजेक्ट को दिखाया है, जिसमें VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी गई है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है, जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

VALL-E 2 न्यूरल कोडेक लैंग्वेज मॉडल में लेटेस्ट एडवांस्मेंट है। यह जीरो शॉट टेक्स्ट-टू स्पीच सिंथेसिस में एक मील का पत्थर है, जो पहली बार मानव समानता प्राप्त करता है।

माइक्रोसॉफ्ट

VALL-E 2 को लेकर जानकारी देते हुए कंपनी का कहना है कि नया मॉडल पुराने मॉडल VALL-E पर आधारित है। इस नए मॉडल में रिपीटिशन अवेयर सैम्पलिंग और ग्रुप्ड कोड मॉडलिंग की सुविधा है।

  • रिपीटिशन अवेयर सैम्पलिंग
  • ग्रुप्ड कोड मॉडलिंग

रिपीटिशन अवेयर सैम्पलिंग

रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।

ग्रुप्ड कोड मॉडलिंग

ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।

ये भी पढ़ेंः इस कंपनी ने लगाया एंड्रॉइड स्मार्टफोन पर बैन, कर्मचारियों को फ्री में देगी iPhone

पब्लिकली लॉन्च नहीं होगा VALL-E 2

VALL-E 2 वॉइस टैलेंट जैसी आवाज में बोल सकता है। वॉइस का सिमिलर होना और नेचुरल होना स्पीच प्रॉम्प्ट की क्वालिटी और लेंथ पर निर्भर करता है। यह बैकग्राउंड में हो रहे शोर और दूसरे फैक्टर पर भी निर्भर करता है। हालांकि, इस मॉडल का गलत इस्तेमाल हो सकता है।

माइक्रोसॉफ्ट

माइक्रोसॉफ्ट के रिसर्चर्स का साफ कहना है कि VALL-E 2 मात्र एक रिसर्च प्रोजेक्ट है। इस मॉडल का इस्तेमाल एजुकेशनल लर्निंग, एंटरटेनमेंट, जर्नलिस्टिक, सेल्फ-ऑथर्ड कंटेंट, एक्सेसिबिलिटी फीचर्स, इंटरेक्विव वॉइस रिस्पॉन्स सिस्टम, ट्रांसलेशन चैटबॉट के लिए किया जा सकता है। हालांकि, क्योंकि इस मॉडल के गलत इस्तेमाल होने को लेकर भी संभावनाएं बनती हैं, इसलिए कंपनी इसे पब्लिकली लॉन्च नहीं करेगी।