عناوین مهم :
یکشنبه 30 اردیبهشت 1403 04:10

پایگاه تحلیلی الفباخبر

مرجع اخبار اقتصادی-اجتماعی

ALEFBAKHABAR.com

آخرین عناوین
هوش مصنوعی وویس‌باکس متا یک Dall-E برای تبدیل متن به گفتار است م کمبود ویتامین D را با این غذاها جبران کنید قالیباف: وزیر کشور فرصت خواست تا جایگزین معاون سیاسی مشخص شود آگهي جذب بازيكن جديد براي گلگهر لیگ ملت‌ها: قهرمان المپیک از ایران عبور کرد حمله هنرپیشه انگلیسی به لوکاکود کاهش جزئی قیمت دلار در مرکز مبادله‌/ نرخ دلار: ۴۱هزار و ۲۸۸ تومان آغاز دریافت کارمزد از کارتخوان‌ها از امروز فراخوان جدید ایران خودرو برای متقاضیان کدوم باشگاه دنبال کدوم بازیکنه؟ شرکت بیمه نوین به مجمع رفت مهمترین اولویت‌های پژوهشکده بیمه در سال ۱۴۰۲ نخستین جلسه شورای سیاست‌گذاری سی‌امین همایش ملی و یازدهمین همایش بین المللی بیمه و توسعه برگزار شد کتاب توسعه 1401 با حضور اقتصاددانان و دانشگاهیان رونمایی شد تصویب کلیات طرح افزایش بیمه اجتماعی کارگران ساختمانی برآورد قیمت تمام شده واحدهای نهضت ملی مسکن چه زمانی مشخص می شود  با وام مسکن ۹۶۰ میلیون تومانی هیچ کس خانه دار نمی شود ساخت دو واحد مسکونی برای محرومان در قالب اردوی جهادی در استان یزد در روسيه چه مي گذرد؟
پر بازدید ها
روابط عمومی باید از همه ابزارهای ارتباطی برای تحقق ماموریت های سازمان استفاده کند مجید ملازاده؛ سرپرست روابط عمومی بیمه دی منصوب شد از تمامی ظرفیتها و فرصتهای مقدور جهت بهبود شرکت در حوزه های مختلف استفاده خواهیم کرد قیمت جدید گوشی های سامسونگ آخرین گزارش‌ها از امدادرسانی‌ سیل/وزیر کشور وارد مشهد شد مدیرعامل موسسه اعتباری ملل از آسایشگاه خیریه کهریزک بازدید کرد بهره برداری خط تولید ۲ واحد صنعتی مازندران با حضور معاون رئیس‌جمهور بانک‌ها هم شنبه‌ها تعطیل می‌شوند رونمایی از شعبه فیجیتال بانک سپه روابط‌عمومی بانک صادرات ایران روابط‌عمومی برتر دستگاه‌های تابعه وزارت اقتصاد شد مدیرعامل بانک سپه در همایش مدیران ارشد: وارد مرحله جدیدی از زیست بانک سپه شده ایم/ کسب رتبه برتر در رشد منابع میلیاردر آمریکایی کنسرسیومی را برای خرید تیک‌تاک تشکیل می‌دهد این خودروی جدید وارد بورس کالا شد مدیرعامل بیمه کوثر روز ارتباطات و روابط‌عمومی را در قالب یک پیام تبریک گفت پیام تبریک مدیرعامل صندوق کارآفرینی امید به مناسبت روز جهانی روابط عمومی

هوش مصنوعی وویس‌باکس متا یک Dall-E برای تبدیل متن به گفتار است


هوش-مصنوعی-وویس-باکس-متا-یک-Dall-E-برای-تبدیل-متن-به-گفتار-است
الفباخبر - گروه فناوري: اشاره به «خطرات احتمالی سوء استفاده» با وجود «موارد استفاده بسیار هیجان‌انگیزی که برای مدل‌های گفتار مولد» وجود دارد اعلام کرد که نه اپ Voicebox و نه کد منبع آن در حال حاضر برای استفاده عموم منتشر نمی‌شود.

به گزارش الفباخبر ،یک گام دیگر به سمت تحقق دنیای سلبریتی‌های بدون‌مرگ برداشته شد: متا از مدل مولد متن به گفتار خود موسوم به Voicebox، که وعده داده است همان کاری را که ChatGPT و Dall-E برای تولید متن و تصویر انجام دادند برای کلام گفتاری انجام دهد، رونمایی کرد.اساساً این ابزار یک تولیدکننده متن به خروجی است، درست مانند GPT یا Dall-E، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپ‌های صوتی تولید می‌کند. متا این سیستم را به‌عنوان «یک مدل تطبیق جریان غیرخودهمبسته که برای پر کردن گفتار، با توجه به بافت صوتی و متن، آموزش داده شده است» تعریف می‌کند. وویس‌باکس با بهره‌گیری از بیش از 50000 ساعت صدای فیلتر نشده آموزش دیده است. مشخصاٌ، متا از گفتار و رونویسی‌های ضبط شده از مجموعه‌ای از کتاب‌های صوتی با مالکیت عمومی که به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی نوشته شده بودند، استفاده کرد.به گفته این پژوهشگران، این مجموعه متنوع از داده‌ها به این سیستم امکان می‌دهد فارغ از اینکه زبان‌هایی که هر یک از طرف‌ها به چه زبانی صحبت می‌کنند، گفتار محاوره‌ای بیشتری تولید کند. «نتایج ما نشان می‌دهد که مدل‌های تشخیص گفتار آموزش‌دیده بر روی گفتار مصنوعی تولید شده توسط وویس‌باکس تقریباً به همان خوبی مدل‌های آموزش داده شده با استفاده از گفتار واقعی عمل می‌کنند». علاوه بر این، این گفتار تولید شده توسط کامپیوتر تنها 1 درصد نرخ خطا داشت، در حالی که در مدل‌های TTS موجود این افت به 45 تا 70 درصد می‌رسد.سیستم ابتدا برای پیش‌بینی بخش‌های گفتار بر اساس بخش‌های اطراف آن‌ها و همچنین رونوشت متن آموزش داده شد. محققان متا توضیح دادند: «پس از یادگیری پر کردن گفتار از متن، این مدل می‌تواند آن را در سراسر وظایف تولید گفتار، از جمله تولید بخش‌هایی در وسط یک ضبط صوتی بدون نیاز به بازسازی کل ورودی، اعمال کند.
 
گفته می‌شود که وویس‌باکس قادر به «تولید بخش‌هایی در وسط یک ضبط صوتی بدون نیاز به بازسازی کل ورودی» است و همچنین می‌تواند به طور فعال کار ویرایش کلیپ‌های صوتی، حذف نویز از گفتار و حتی جایگزینی کلمات اشتباه را انجام دهد.
 
متا با اشاره به «خطرات احتمالی سوء استفاده» با وجود «موارد استفاده بسیار هیجان‌انگیزی که برای مدل‌های گفتار مولد» وجود دارد اعلام کرد که نه اپ Voicebox و نه کد منبع آن در حال حاضر برای استفاده عموم منتشر نمی‌شود.
این تیم تحقیقاتی امیدوار است که در آینده این فناوری راه خود را به حوزه پروتز بیماران مبتلا به آسیب تارهای صوتی، NPCهای درون‌بازی و دستیارهای دیجیتال باز کند.
 

انتهای پیام


تاریخ انتشار: یکشنبه 04 تیر ماه 1402 - 11:25
نظرات کاربران
بیمه پاسارگاد بیمه کوثر بیمه ملت بانک سپه بانک رفاه بیمه معلم بانک ایران زمین بانک صادرات بنر بیمه دی بانک سینا بانک توسعه تعاون بیمه دانا بانک ملی باجت بانک تجارت