چیٹ جی پی ٹی نے ایڈوانسڈ وائس موڈ کے ساتھ ہائپر ریئلسٹک اے آئی اسپیچ متعارف کرایا ہے۔
چیٹ جی پی ٹی کے لیے ایڈوانسڈ وائس موڈ، جسے اوپن اے آئی نے رول آؤٹ کرنا شروع کر دیا ہے، صارفین کو GPT-4o کے ناقابل یقین حد تک جاندار آواز کے جوابات کی پہلی جھلک دیتا ہے۔ یہ الفا ورژن آج چیٹ جی پی ٹی پلس صارفین کے منتخب گروپ کے لیے دستیاب ہے، جس کی وسیع تر ریلیز موسم خزاں 2024 تک متوقع ہے۔
GPT-4o کی متاثر کن آواز
جب اوپن اے آئی نے پہلی بار مئی میں GPT-4o کی آواز کی نقاب کشائی کی، تو اس نے اپنے تیز ردعمل اور حقیقی انسانی آواز سے مماثلت کی وجہ سے خاصی توجہ حاصل کی۔ اسکائی کے نام سے، آواز اسکارلیٹ جوہانسن سے مشابہت رکھتی ہے، جو فلم “ہر” میں ایک مصنوعی اسسٹنٹ کو آواز دینے کے لیے جانا جاتا ہے۔
ڈیمو کے بعد، جوہانسن نے سی ای او سیم آلٹ مین کی جانب سے اپنی آواز کو استعمال کرنے کی پیشکش کو مسترد کر دیا اور اپنی مشابہت کے تحفظ کے لیے قانونی نمائندگی کی خدمات حاصل کیں۔ اگرچہ اوپن اے آئی نے جوہانسن کی آواز استعمال کرنے سے انکار کیا، اس کے بعد اسکائی آواز کو ڈیمو سے ہٹا دیا گیا۔ جون میں، اوپن اے آئی نے حفاظتی خصوصیات کو بڑھانے کے لیے ایڈوانسڈ وائس موڈ کی ریلیز میں تاخیر کا اعلان کیا۔
الفا ریلیز میں محدود خصوصیات
آنے والے الفا ریلیز میں اسپرنگ اپ ڈیٹ میں دکھائے گئے ویڈیو اور اسکرین شیئرنگ کی خصوصیات شامل نہیں ہوں گی، جو بعد کی تاریخ میں دستیاب ہوں گی۔ ابھی کے لیے، GPT-4o کی آواز ایک ڈیمو فیچر بنی ہوئی ہے، لیکن کچھ پریمیم صارفین جلد رسائی حاصل کر لیں گے۔
بات چیت کی صلاحیتوں میں اضافہ
چیٹ جی پی ٹی اب سننے اور بولنے کی اعلیٰ صلاحیتوں کا حامل ہے۔ پچھلے صوتی حل کے برعکس، جس نے وائس ٹو ٹیکسٹ، ٹیکسٹ پروسیسنگ، اور ٹیکسٹ ٹو وائس کے لیے تین الگ الگ ماڈلز کا استعمال کیا، GPT-4o ان کاموں کو ایک ہموار عمل میں یکجا کرتا ہے۔ اس کے نتیجے میں تیز اور زیادہ سیال گفتگو ہوتی ہے۔ مزید برآں، GPT-4o صارفین کی آوازوں میں جذباتی باریکیوں کا پتہ لگا سکتا ہے، جیسے اداسی یا جوش۔
چیٹ جی پی ٹی پلس صارفین کے لیے پائلٹ فیز
اس پائلٹ مرحلے کے دوران، چیٹ جی پی ٹی پلس صارفین سب سے پہلے ایڈوانس وائس موڈ کا تجربہ کرنے والوں میں شامل ہوں گے۔ TechCrunch نے ابھی تک اس خصوصیت کا تجربہ نہیں کیا ہے لیکن دستیابی پر اس کا جائزہ لینے کا ارادہ رکھتا ہے۔
بتدریج رول آؤٹ اور مانیٹرنگ
اوپن اے آئی آواز کی نئی خصوصیت کو آہستہ آہستہ جاری کر رہا ہے تاکہ اس کے استعمال کو قریب سے مانیٹر کیا جا سکے۔ الفا گروپ کے صارفین کو نئی فعالیت کے لیے استعمال کی ہدایات کے ساتھ ایک ای میل اور چیٹ جی پی ٹی ایپ میں نوٹس ملے گا۔
جانچ اور حفاظتی اقدامات
ڈیمو کے بعد سے، GPT-4o کی آواز کو 45 زبانوں میں 100 سے زیادہ بیرونی ٹیسٹرز کے ساتھ ٹیسٹ کیا جا چکا ہے۔ اگست کے اوائل میں ان ٹیسٹوں کی حفاظتی رپورٹ متوقع ہے۔ ایڈوانسڈ وائس موڈ صرف چار پیش سیٹ آوازیں پیش کرے گا — جونیپر، بریز، کوو، اور ایمبر — جو پیشہ ور آواز کے اداکاروں کے ساتھ بنائی گئی ہیں۔ مئی کے ڈیمو سے اسکائی آواز اب دستیاب نہیں ہے۔اوپن اے آئی کے ترجمان، Lindsay McCallum نے تصدیق کی کہ چیٹ جی پی ٹی دوسرے لوگوں کی آوازوں کی نقل نہیں کر سکتا اور ان آؤٹ پٹ کو بلاک کر دے گا جو ان پہلے سے سیٹ آوازوں سے میل نہیں کھاتے۔
ڈیپ فیکس کے خلاف احتیاطی تدابیر
گہرے جعلی خدشات کو دور کرنے کے لیے، اوپن اے آئی سخت احتیاطی تدابیر پر عمل پیرا ہے۔ اس میں موسیقی یا دیگر کاپی رائٹ آڈیو کی تخلیق کو روکنے کے لیے نئے فلٹرز شامل کرنا شامل ہے۔ یہ اقدامات اے آئی کمپنیوں کو درپیش قانونی خطرات کا جواب دیتے ہیں، جیسے کہ ElevenLabs کی صوتی کلوننگ ٹیکنالوجی کے ذریعے اٹھائے گئے، جو اس سال کے شروع میں صدر بائیڈن کی نقالی کرنے کے لیے استعمال کیے گئے تھے۔
مزید پڑھنے کے لیے یہاں کلک کریں