اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔
اوپن اے آئی نے منگل کو اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ کے ایڈوانسڈ وائس موڈ کو رول آؤٹ کرنا شروع کیا، جس سے صارفین کو GPT-4o کے ہائپر ریئلسٹک آڈیو جوابات تک پہلی رسائی ملی۔ الفا ورژن آج چیٹ جی پی ٹی پلس صارفین کے ایک چھوٹے سے گروپ کے لیے دستیاب ہوگا، اور اوپن اے آئی کا کہنا ہے کہ یہ فیچر 2024 کے موسم خزاں میں بتدریج تمام پلس صارفین کے لیے متعارف کرایا جائے گا۔
مئی میں جب اوپن اے آئی نے پہلی بار GPT-4o کی آواز کی نمائش کی، تو اس خصوصیت نے فوری ردعمل اور حقیقی انسان کی آواز سے غیر معمولی مشابہت کے ساتھ سامعین کو چونکا دیا۔ آواز، اسکائی، اسکارلیٹ جوہانسن سے مشابہت رکھتی تھی، جو فلم “ہر” میں مصنوعی معاون کے پیچھے کام کرنے والی اداکارہ تھی۔ اوپن اے آئی کے ڈیمو کے فوراً بعد، جوہانسن نے کہا کہ اس نے اپنی آواز استعمال کرنے کے لیے CEO سیم آلٹ مین سے متعدد استفسارات سے انکار کر دیا، اور GPT-4o کا ڈیمو دیکھنے کے بعد، اپنی مشابہت کا دفاع کرنے کے لیے قانونی مشیر کی خدمات حاصل کیں۔ اوپن اے آئی نے Johansson کی آواز استعمال کرنے سے انکار کیا، لیکن بعد میں اس کے ڈیمو میں دکھائی گئی آواز کو ہٹا دیا۔ جون میں، اوپن اے آئی نے کہا کہ وہ اپنے حفاظتی اقدامات کو بہتر بنانے کے لیے ایڈوانسڈ وائس موڈ کے اجراء میں تاخیر کرے گا۔
ایک ماہ بعد، اور انتظار ختم ہو گیا (طرح کا) اوپن اے آئی کا کہنا ہے کہ اس کے اسپرنگ اپ ڈیٹ کے دوران دکھائی جانے والی ویڈیو اور اسکرین شیئرنگ کی صلاحیتیں اس الفا کا حصہ نہیں ہوں گی، جسے “بعد کی تاریخ” میں لانچ کیا جائے گا۔ ابھی کے لیے، GPT-4o ڈیمو جس نے سب کو اڑا دیا تھا اب بھی صرف ایک ڈیمو ہے، لیکن کچھ پریمیم صارفین کو اب وہاں دکھائے گئےاوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ کی آواز کی خصوصیت تک رسائی حاصل ہوگی۔
اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ اب بات اور سن سکتا ہے۔
ہو سکتا ہے آپ نے پہلے ہی اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ میں دستیاب وائس موڈ کو آزما لیا ہو، لیکن اوپن اے آئی کا کہنا ہے کہ ایڈوانسڈ وائس موڈ مختلف ہے۔ آڈیو کے لیے اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ کے پرانے حل میں تین الگ الگ ماڈل استعمال کیے گئے: ایک آپ کی آواز کو ٹیکسٹ میں تبدیل کرنے کے لیے، آپ کے پرامپٹ پر کارروائی کرنے کے لیے GPT-4، اور پھر اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ کے متن کو آواز میں تبدیل کرنے کے لیے تیسرا۔ لیکن GPT-4o ملٹی موڈل ہے، معاون ماڈلز کی مدد کے بغیر ان کاموں کو پروسیس کرنے کی صلاحیت رکھتا ہے، جس سے نمایاں طور پر کم لیٹنسی گفتگو پیدا ہوتی ہے۔ اوپن اے آئی کا یہ بھی دعویٰ ہے کہ GPT-4o آپ کی آواز میں جذباتی لہجے کو محسوس کر سکتا ہے، بشمول اداسی، جوش یا گانا۔
اس پائلٹ میں، چیٹ جی پی ٹی پلس کے صارفین پہلی بار یہ دیکھ سکیں گے کہ اوپن اے آئی کا ایڈوانسڈ وائس موڈ واقعی کتنا زیادہ حقیقت پسندانہ ہے۔ TechCrunch اس مضمون کو شائع کرنے سے پہلے اس خصوصیت کی جانچ کرنے سے قاصر تھا، لیکن جب ہمیں رسائی ملے گی ہم اس کا جائزہ لیں گے۔
اوپن اے آئی کا کہنا ہے کہ وہ اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ کی نئی آواز کو آہستہ آہستہ جاری کر رہا ہے تاکہ اس کے استعمال کو قریب سے مانیٹر کیا جا سکے۔ الفا گروپ میں شامل لوگوں کو اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ ایپ میں ایک الرٹ ملے گا، اس کے بعد اسے استعمال کرنے کے طریقے سے متعلق ہدایات کے ساتھ ایک ای میل آئے گا۔
اوپن اے آئی کے ڈیمو کے بعد کے مہینوں میں، کمپنی کا کہنا ہے کہ اس نے GPT-4o کی آواز کی صلاحیتوں کا تجربہ 100 سے زیادہ بیرونی ریڈ ٹیمرز کے ساتھ کیا جو 45 مختلف زبانیں بولتے ہیں۔ اوپن اے آئی کا کہنا ہے کہ ان حفاظتی کوششوں کے بارے میں ایک رپورٹ اگست کے شروع میں آ رہی ہے۔
کمپنی کا کہنا ہے کہ ایڈوانسڈ وائس موڈ چیٹ جی پی ٹی کی چار پیش سیٹ آوازوں تک محدود رہے گا – جونیپر، بریز، کوو اور ایمبر – جو ادا شدہ آواز کے اداکاروں کے تعاون سے بنائی گئی ہیں۔ اوپن اے آئی کے مئی کے ڈیمو میں دکھائی گئی اسکائی آواز اب اوپن اے آئی کچھ ادائیگی کرنے والے صارفین کے لیے چیٹ جی پی ٹی کی انتہائی حقیقت پسندانہ آواز جاری کرتا ہے۔ میں دستیاب نہیں ہے۔ اوپن اے آئی کے ترجمان لنڈسے میک کیلم کا کہنا ہے کہ “چیٹ جی پی ٹی دوسرے لوگوں کی آوازوں کی نقالی نہیں کر سکتا، دونوں افراد اور عوامی شخصیات، اور ان آؤٹ پٹ کو بلاک کر دے گی جو ان پہلے سے سیٹ آوازوں میں سے کسی ایک سے مختلف ہوں۔”
اوپن اے آئی گہری جعلی تنازعات سے بچنے کی کوشش کر رہا ہے۔ جنوری میں، AI اسٹارٹ اپ ElevenLabs کی صوتی کلوننگ ٹیکنالوجی کا استعمال صدر بائیڈن کی نقالی کرنے کے لیے کیا گیا تھا، جس سے نیو ہیمپشائر میں بنیادی ووٹروں کو دھوکہ دیا گیا تھا۔
اوپن اے آئی کا یہ بھی کہنا ہے کہ اس نے موسیقی یا دیگر کاپی رائٹ آڈیو بنانے کے لیے مخصوص درخواستوں کو روکنے کے لیے نئے فلٹرز متعارف کرائے ہیں۔ پچھلے سال میں، AI کمپنیاں کاپی رائٹ کی خلاف ورزی کی وجہ سے خود کو قانونی پریشانی میں مبتلا کر چکی ہیں، اور GPT-4o جیسے آڈیو ماڈلز نے کمپنیوں کی ایک بالکل نئی قسم کا آغاز کیا ہے جو شکایت درج کروا سکتی ہیں۔ خاص طور پر، ریکارڈ لیبلز، جن کی تاریخ قانونی ہے، اور وہ پہلے ہی AI گانا بنانے والے سنو اور یوڈیو پر مقدمہ کر چکے ہیں۔
مزید پڑھنے کے لیے یہاں کلک کریں