مائیکروسافٹ کی مصنوعی ذہانت میں حیرت انگیز ایجاد، ساکت تصویر کو بھی حرکت دیدی

ہفتہ 20 اپریل 2024
icon-facebook icon-twitter icon-whatsapp

ٹیکنالوجی کمپنی مائیکروسافٹ ریسرچ ایشیا میں مصنوعی ذہانت کے محققین کی ایک ٹیم نے ایک ایسی مصنوعی ذہانت کی ایپلی کیشن تیار کی ہے جو کسی بھی انسان اور آڈیو ٹریکس کی ساکت تصاویر کو حرکت پذیری میں تبدیل کرسکتی ہے۔

مصنوعی ذہانت (اے آئی) کی اس ایپلی کیشن کا استعمال کرتے ہوئے محققین نے باقاعدہ تصاویر کو لوگوں کے چہرے کے اصل تاثرات کے ساتھ آڈیو ٹریکس کے ساتھ بولتے یا گاتے ہوئے دکھایا ہے۔ یہ اپیلی کیشن کسی بھی ساکت تصویر کو ایسی مہارت سے حرکت دیتی ہے کہ سب اصل لگنے لگتا ہے، اسے بصری دُنیا میں انقلابی ایپلی کیشن بھی کہا جا رہا ہے۔

یہ مائیکروسافٹ ایپلی کیشن جسے واسا -1 کا نام دیا گیا ہے، کے ذریعے ایک ساکت تصویر اور آڈیو تقریر کے کلپ سے پرکشش بصری اور جذباتی مہارتوں (وی اے ایس) کے ساتھ ورچوئل معیار کی تصویر کو حرکت کرتے ہوئے، بولتے ہوئے اور گاتے ہوئے دکھایا گیا ہے۔

محققین نے فریم ورک کی وضاحت کرتے ہوئے ایک مقالے میں لکھا ہے کہ ’ ہمارا پریمیئر ماڈل، واسا -1 ، نہ صرف آڈیو ٹریک کے مطابق ہونٹوں کو حرکت دینے کی صلاحیت رکھتا ہے بلکہ چہرے کی باریکیوں اور قدرتی سُر یعنی آواز کو ٹریک کر کے ایک بڑے اسپیکٹرم کو بھی پکڑتا ہے، یہ بالکل حقیقت کے احساس میں کردار ادا کرتا ہے۔

مائیکروسافٹ کا واسا -1 کیسے کام کرتا ہے؟

ٹیم کے مطابق بنیادی ڈیزائن میں چہرے کی مجموعی حرکات اور سر کی جنبش کا ماڈل شامل ہے جو چہرے ویڈیوز کا استعمال کرتے ہوئے ایک واضح چہرے کے طور پر کام کرتا ہے۔

محققین نے کہا ہے کہ ’ہمارا طریقہ نہ صرف حقیقت پسندانہ چہرے اور سر کی حرکات کے ساتھ اعلیٰ ویڈیو معیار فراہم کرتا ہے بلکہ 40 ایف پی ایس تک 512×512 ویڈیوز کی آن لائن جنریشن کی بھی مہارت رکھتا ہے۔

آپ اور آپ کے پیاروں کی روزمرہ زندگی کو متاثر کرسکنے والے واقعات کی اپ ڈیٹس کے لیے واٹس ایپ پر وی نیوز کا ’آفیشل گروپ‘ یا ’آفیشل چینل‘ جوائن کریں

icon-facebook icon-twitter icon-whatsapp