عنوان
|
تشخیص نواحی فعال سیگنال گفتار با استفاده از روش استخراج ویژگی مبتنی بر خوشه بندی در فضای طیفی-زمانی
|
نوع پژوهش
|
پایان نامه
|
کلیدواژهها
|
تشخیص نواحی فعال گفتار، ویژگیهای طیفی- زمانی، مدل شنیداری، خوشهبندی مخلوط گوسی
|
چکیده
|
هدف: هدف اصلی در این تحقیق، استفاده از ویژگیهای طیفی- زمانی استخراج شده از مدل شنیداری برای تشخیص نواحی فعال گفتار میباشد. هدف پژوهش این است که پس از بررسی روش های موجود برای تشخیص نواحی فعال گفتار، یک روش جدید بر اساس خوشه بندی مدل مخلوط گوسی در فضای طیفی ـ زمانی پیشنهاد گردد. پس از بررسی دقیق این روش، کارایی آن در تشخیص نواحی فعال گفتار مورد ارزیابی قرار می گیرد. در این زمینه به منظور استخراج ویژگی های طیفی ـ زمانی سیگنال گفتار از مدل شنیداری استفاده میشود. روش شناسی پژوهش: این پژوهش از طریق شبیه سازی و مقایسه نتایج با استفاده از نرم افزار متلب و از بانک اطلاعاتی TIMIT انجام می گیرد. 80 گوینده از بانک اطلاعاتی TIMIT که شامل 40 زن و 40 مرد می باشند جهت بررسی و پیشبرد هدف بکار رفته است. در این پژوهش سعی بر این بوده است تا با بروزرسانی آستانه نتایج بهتری نسبت به پژوهش قبل گرفته شود. در این تحقیق نمایشی چند بعدی از ویژگی های طیفی- زمانی، برای سیگنال گفتار ارائه می شود که دارای چهار بعد زمان، فرکانس، سرعت و مقیاس می باشد. برای کاهش ابعاد فضای ویژگیهای طیفی- زمانی، از روشهای استخراج ویژگی مبتنی بر خوشهبندی مدل مخلوط گوسی و میانگین وزن دار انرژی استفاده میشود و از مؤلفههای بردارهای میانگین و واریانس خوشهها، به عنوان ویژگیهای ثانویه در بردارهای ویژگی استفاده میشود. سپس با استفاده از این بردارهای ویژگی ثانویه و تعیین آستانه بروز رسانی شده در هر قاب نواحی فعال گفتار تشخیص داده می شود. در این تحقیق سعی شده است تا با نظر گرفتن خوشه اول انرژی به عنوان خوشه اصلی گفتار محاسبات انجام گرفته و نتیجه گیری شود.
|
پژوهشگران
|
نفیسه اسفندیان (استاد راهنما)، فاطمه جهانی بهنمیری (دانشجو)، سمیرا مودتی (استاد راهنما)
|