قابلیت Read-Aloud تجربه شنیداری طبیعی و جذاب به Grok میآورد
«گروک» ماسک، حالا با صدای انسانی میخواند
ایلان ماسک از افزوده شدن قابلیت «خواندن بلند» به هوش مصنوعی Grok خبر داد—فرایندی که متن را به صدایی دلنشین و طبیعی برای کاربران تبدیل میکند.
پیشتر، ماسک از ویژگی «گفتار در ویدئو» در ابزار Grok Imagine پرده برداشته بود—قابلیتی که امکان افزودن دیالوگ و گفتار طبیعی به ویدئوهای تولیدشده با هوش مصنوعی را فراهم میکرد. او گفته بود طی چند هفته آینده ارتقاء بزرگی در تولید تصویر و ویدئو توسط گروک انجام خواهد شد.
قابلیت تازه، علاوه بر کاربرد در دسترسپذیری (Accessibility) برای افراد کمبینا یا دارای اختلالات خواندن، میتواند مسیر تازهای به سمت تعاملات صوتی هوشمندتر در AI باز کند. کارشناسان پیشبینی میکنند که گرایش شرکتها به افزودن کانال صوتی طبیعی به چتباتها و مدلهای زبان، به رقابت تازهای در بازار هوش مصنوعی منجر شود.
تحلیل پیچینو
وقتی متن، صدای خودش را پیدا کند، فاصله بین «دیدن» و «شنیدن» در دنیای دیجیتال حذف میشود—و شاید روزی هر واژهای که بنویسیم، بیدرنگ برایمان زمزمه شود.





