مشخصات پژوهش

صفحه نخست /بهسازی گفتار با استفاده از ...
عنوان بهسازی گفتار با استفاده از یادگیری دیکشنری
نوع پژوهش پایان نامه
کلیدواژه‌ها بهسازی گفتار، یادگیری دیکشنری، بازنمایی تُنُک، تخمین نویزآگاه
چکیده در سالهای اخیر، پردازش و بهبود کیفیت سیگنالهای گفتاری به یک موضوع جذاب و پرطرفدار در پژوهش بهویژه در کاربردهایی مانند ارتباطات صوتی و شناسایی گفتار تبددیل شدده اسدت. بندابراین استفاده از روشهای نوین برای بهسازی این سیگنالها به یک نیاز اساسی تبدیل شده است. این پایاننامه به دو بخش اصلی بازنمایی تُنُک سیگنال گفتدار و بهسدازی سدیگنال گفتدار تقسدیم میشود و در هر بخش یک روش جدید معرفی می شدود. در بخدش اول، تمرکدز بدر بازنمدایی تُنُدک سیگنالهای گفتاری با هدف نهایی بهبود کیفیت سیگنال است. در این بخش، سیگنالهای گفتداری با استفاده از دیکشنریهای آموزش دادهشده با بهرهگیری از روشهای آموزشی مختلف در حوزههای زمان، زمان-فرکانس و تبدیل بسته موجک مورد بررسی قرار گرفتهاند. نتایج حاصدل نشدان میدهدد که استفاده از بازنمایی تُنُک در حوزه STFT بهویژه در ترکیب با الگوریتم K-SVD ، بهترین نتدایج را در بازسازی سیگنال گفتاری طبق روال بازنمایی پیشنهادی، بده دسدت میدهدد. در بخدش دوم، بدا استفاده از بازنمایی تُنُک بهینهشده، یک روش نوآور بهسازی برای سیگنال گفتاری ارائه شدده اسدت. این روش شامل یدک بخدش نویزآگداه ) NMID-SRDL ( اسدت کده تواندایی شناسدایی مددل ندویز و دیکشنری مربوطه را براساس انرژش ضرایب بازنمایی دارد. در این بخش، دیکشنریهای نویز بدهطور مستقل آموزش داده شده و به همدراه دیکشدنریهای سدیگنال گفتداری ترکیدب میشدوند تدا یدک دیکشنری مرکب ایجاد گردد. این دیکشنری ترکیبی از گفتار تمیز و نویز توانایی شناسدایی و حدذف دینامیک نویزهای مختلف را دارد. نتایج نشان میدهند که این روش بهویژه در شرایط نویزی شددید و نویزهای متنوع از جمله نویزهای غیرایستا، دورهای و ایستا عملکرد بسیار خدوبی دارد و نسدبت بده روشهای موجود میانگین بهبود 16.71% در امتیاز PESQ و 3.39% در میزان معیار STOI را نتیجده میدهد. ارتباط این دو بخش در این است که بازنمایی تُنُک نده تنهدا بده عندوان یدک ابدزار مسدتقل بررسی شده، بلکه بهعنوان مقدمهای برای بهبود کیفیت سیگنال گفتاری در روش بهسازی نیز مدورد استفاده قرار گرفته است. نتایج حاصل از این پژوهش نشان میدهد که بازنمدایی تُنُدک بهدسدتآمده بهطور مؤثری به هدف نهایی بهسازی سیگنال کمدک نمدوده و روش پیشدنهادی نیدز در مقایسده بدا روشهای موجود، عملکرد برتری در کاهش نویز و افزایش کیفیت گفتار ارائه میدهد.
پژوهشگران سمیرا مودتی (استاد مشاور)، سلمان کریمی (استاد راهنما)، ناصر شرفی (دانشجو)