یک‌شنبه 24 خرداد 1405

محبوب ترین های امروز

اپتا مدعیان جام جهانی را رتبه‌بندی کرد؛ اسپانیا بالاتر از فرانسه و آرژانتینکلاهبرداری میلیارددلاری با پیامک‌های جعلی؛ گوگل از یک شبکه سایبری شکایت کردچرا «هوش مصنوعی سازمانی» محور اصلی VivaTech 2026 خواهد بود؟اسپیکر فوق‌باریک «Peace Duo» برای خواب بهتر معرفی شد؛ پخش صدا از زیر بالش بدون هدفون
FOLLOW            
با صدایی طبیعی‌تر، بیان احساسی دقیق‌تر و قابلیت ترجمه

بروزرسانی بزرگ OpenAI برای حالت پیشرفته صوتی ChatGPT

بروزرسانی بزرگ OpenAI برای حالت پیشرفته صوتی ChatGPT

شرکت OpenAI روز جمعه ۷ ژوئن ۲۰۲۵ در به‌روزرسانی تازه‌ای برای حالت پیشرفته صوتی ChatGPT، صدایی طبیعی‌تر، بیان احساسی دقیق‌تر و قابلیت ترجمه هم‌زمان را معرفی کرده است.

به گزارش پیچینو، این ویژگی که نخستین‌بار در سال گذشته هم‌زمان با معرفی مدل GPT-4o عرضه شد، اکنون گامی دیگر به‌سوی گفت‌وگوهای واقعاً شبیه انسان با هوش مصنوعی برداشته است.
این حالت پیشرفته، مبتنی بر مدل‌های چندوجهی بومی مانند GPT-4o عمل می‌کند و توانایی دارد در زمانی کمتر از ۲۳۲ میلی‌ثانیه به ورودی‌های صوتی پاسخ دهد؛ زمانی که از میانگین گفت‌وگوی انسانی نیز فراتر نمی‌رود. از ویژگی‌های برجسته این سیستم، درک نشانه‌های غیرکلامی مانند سرعت صحبت کردن کاربر و واکنش‌ نشان دادن با لحن احساسی است.
شرکت OpenAI اوایل سال جاری یک به‌روزرسانی جزئی برای کاهش قطع شدن‌های ناخواسته و بهبود لهجه‌ها منتشر کرده بود. اما به‌روزرسانی جدید، تغییرات قابل‌توجه‌تری به همراه دارد: لحن‌ها لطیف‌تر، مکث‌ها و تأکیدها طبیعی‌تر، همچنین بیان احساسی در مواردی چون همدلی یا کنایه بسیار دقیق‌تر شده است.
«واو! صدای جدید در اپلیکیشن ChatGPT فقط صحبت نمی‌کند، بلکه اجرا می‌کند. دیگر کمتر شبیه یک هوش مصنوعی است و بیشتر مانند یک دوست انسانی می‌باشد. کار فوق‌العاده‌ای بود تیم OpenAI!»
این واکنش شاون رالستون، کاربر شبکه ایکس (توییتر سابق)، نمونه‌ای از استقبال کاربران از تجربه‌ صوتی جدید ChatGPT است.
از دیگر قابلیت‌های تازه حالت پیشرفته صوتی ChatGPT، امکان ترجمه‌ صوتی درون‌برنامه‌ای است. کاربران اکنون می‌توانند از ChatGPT بخواهند که مکالمه‌ای را ترجمه کند و این ترجمه تا زمانی که کاربر بخواهد، ادامه خواهد یافت؛ ویژگی‌ که عملاً جایگزینی برای اپلیکیشن‌های ترجمه صوتی مجزا به حساب می‌آید.
در حال حاضر، نسخه‌ جدید حالت پیشرفته صوتی فقط در دسترس کاربران پولی ChatGPT قرار دارد. با وجود این، OpenAI به برخی محدودیت‌های باقی‌مانده نیز اشاره کرده است. برای مثال، در برخی موارد کیفیت صدا با افت‌های جزیی همراه است، که از جمله آن می‌توان به تغییرات غیرمنتظره در تُن یا زیروبمی صدا، به‌ویژه در برخی گزینه‌های صوتی خاص اشاره کرد. همچنین پدیده‌ «توهم صوتی» همچنان به‌ندرت رخ می‌دهد و ممکن است صداهای بی‌ربط مانند: تبلیغات، موسیقی یا اصوات نامفهوم شنیده شود.
با وجود این کاستی‌های جزئی، روند بهبود مستمر این فناوری نشان می‌دهد که فاصله‌ میان انسان و هوش مصنوعی در مکالمات، روزبه‌روز کمتر می‌شود.