आवाज की हू-ब-हू नकल करने वाले स्पीच AI Model को तैयार कर रहा Microsoft, लॉन्च को लेकर है डर
माइक्रोसॉफ्ट ने VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।
टेक्नोलॉजी डेस्क, नई दिल्ली। माइक्रोसॉफ्ट ने एक रिसर्च प्रोजेक्ट को दिखाया है, जिसमें VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी गई है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है, जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।
VALL-E 2 न्यूरल कोडेक लैंग्वेज मॉडल में लेटेस्ट एडवांस्मेंट है। यह जीरो शॉट टेक्स्ट-टू स्पीच सिंथेसिस में एक मील का पत्थर है, जो पहली बार मानव समानता प्राप्त करता है।
माइक्रोसॉफ्ट
VALL-E 2 को लेकर जानकारी देते हुए कंपनी का कहना है कि नया मॉडल पुराने मॉडल VALL-E पर आधारित है। इस नए मॉडल में रिपीटिशन अवेयर सैम्पलिंग और ग्रुप्ड कोड मॉडलिंग की सुविधा है।
- रिपीटिशन अवेयर सैम्पलिंग
- ग्रुप्ड कोड मॉडलिंग
रिपीटिशन अवेयर सैम्पलिंग
रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।ग्रुप्ड कोड मॉडलिंग
ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।
ये भी पढ़ेंः इस कंपनी ने लगाया एंड्रॉइड स्मार्टफोन पर बैन, कर्मचारियों को फ्री में देगी iPhone
पब्लिकली लॉन्च नहीं होगा VALL-E 2
माइक्रोसॉफ्ट के रिसर्चर्स का साफ कहना है कि VALL-E 2 मात्र एक रिसर्च प्रोजेक्ट है। इस मॉडल का इस्तेमाल एजुकेशनल लर्निंग, एंटरटेनमेंट, जर्नलिस्टिक, सेल्फ-ऑथर्ड कंटेंट, एक्सेसिबिलिटी फीचर्स, इंटरेक्विव वॉइस रिस्पॉन्स सिस्टम, ट्रांसलेशन चैटबॉट के लिए किया जा सकता है। हालांकि, क्योंकि इस मॉडल के गलत इस्तेमाल होने को लेकर भी संभावनाएं बनती हैं, इसलिए कंपनी इसे पब्लिकली लॉन्च नहीं करेगी।VALL-E 2 वॉइस टैलेंट जैसी आवाज में बोल सकता है। वॉइस का सिमिलर होना और नेचुरल होना स्पीच प्रॉम्प्ट की क्वालिटी और लेंथ पर निर्भर करता है। यह बैकग्राउंड में हो रहे शोर और दूसरे फैक्टर पर भी निर्भर करता है। हालांकि, इस मॉडल का गलत इस्तेमाल हो सकता है।
माइक्रोसॉफ्ट