तीन सेकंड के सैंपल से आवाज को कॉपी कर सकता है Microsoft का नया AI
Microsoft के नए Ai मॉडल को पेश किया है जो 3 सेकेंड के सैंपल से किसी भी वॉइस को रेप्लीकेट कर सकता है। इस मॉडल को VALL-E नाम दिया गया है। ये मॉडल टेक्स्ट-टू-स्पीच Ai पर हो रहे शोध पर आधारित है।
By Ankita PandeyEdited By: Ankita PandeyUpdated: Wed, 11 Jan 2023 09:27 PM (IST)
नई दिल्ली, टेक डेस्क। Microsoft ने Ai जगत में अपना कदम बढ़ाते हुए VALL-E नामक एक आर्टिफिशियल इंटेलीजेंस डिवाइस पेश किया है। नया AI मॉडल माइक्रोसॉफ्ट के टेक्स्ट-टू-स्पीच AI में लेटेस्ट रिसर्च का एक हिस्सा है। ये मॉडल केवल 3 सेकेंड के सैंपल से भी किसी वॉयस की कॉपी बना सकता है।
3 सेकेंड के सैंपल से वॉयस को कर सकता है कॉपी
हालांकि पहले से ही कई ऐसी सेवाएं हैं जो आपकी आवाज की प्रतियां बना सकती हैं, लेकिन वे आमतौर पर पर्याप्त इनपुट की मांग करती हैं। माइक्रोसॉफ्ट का दावा है कि उसका मॉडल महज तीन सेकंड के ऑडियो सैंपल से किसी की आवाज की नकल कर सकता है।
यह भी पढ़ें- खरीदना चाहते हैं नया फोन और बजट है कम तो ये स्मार्टफोन लिस्ट आपके लिए होगी मददगार
रिपोर्ट में मिली जानकारी
विंडोज सेंट्रल की एक रिपोर्ट में पता चला है कि इस AI टूल को 60,000 घंटे के अंग्रेजी स्पीच डाटा और विशिष्ट आवाजों की छोटी क्लिप पर प्रशिक्षित किया गया था, ताकि कंटेंट बेहतर हो सके। रिपोर्ट में यह भी कहा गया है कि जहां कुछ रिकॉर्डिंग स्वाभाविक लगती हैं, वहीं अन्य ऐसी लगती हैं जैसे वे किसी रोबोट या मशीन द्वारा बनाई गई हो। वहीं अगर AI मॉडल को बड़े नमूना सेट की सप्लाई की जाए, तो VALL-E अधिक यथार्थवादी नमूने बनाने में सक्षम हो सकता है।