Noisy Speech Frame
Enhanced Speech Frame
شکل ۲-۲- بلوک دیاگرام تفریق طیفی تعمیم یافته (GSS)
۲-۳- مقادیر طیفی منفی:
علاوه بر تفاوت ها در فرایند پردازش طیفی، مساله مهم دیگری در روش تفریق طیفی وجود دارد و آن این است که تضمینی نیست اندازه طیف گفتار تخمین زده شده، مثبت باشد. در سیستم های مختلف این شکل را با با اصلاح نیم موج یا اصلاح تمام موج[۵۹] جبران می کنند.
در روش اصلاح نیم موج داریم:
(۲-۲۰) |
در روش اصلاح تمام موج داریم:
(۲-۲۱) |
همانطور که دیده می شود در روش نیم موج مقادیر منفی با صفر جایگزین می شوند و در روش تمام موج با قدر مطلق آن جایگزین می شوند. به این ترتیب طیف اصلاح شده با یکی از دو روش فوق، با اطلاعات فازی از سیگنال آغشته به نویز ترکیب شده تا سیگنال را پس از عکس تبدیل فوریه، بازسازی کند.
واضح است که کارایی حذف نویز به تخمین درست طیف نویز بستگی دارد و هر چه تخمین نویز بهتر باشد، در طیف اصلاح شده نویز کمتری خوااهیم داشت. عمل اصلاح طیف نویز (نیم موج یا تمام موج) در گفتار بازسازی شده، یک نویز جدید به نام نویز موزیکال[۶۰] ایجاد می کند که بزرگترین مشکل روش تفریق طیفی می باشد. در ادامه روش هایی که در حذف این نویز کمک می کنند را بررسی می کنیم.
۲-۴- اصلاحات روی تفریق طیفی[۶۱] :
تغییرات مختلفی روی روش تفریق طیفی توسط Boll ]8[ توسعه یافته تا مشکلات تکنیک پایه ای (به خصوص نویز موزیکال) را کاهش دهد. روش های دیگر نیز بر مبنای این روش توسعه یافته که تفریق نویز را در حوزه های خود همبستگی، کپسترال[۶۲] ، لگاریتمی[۶۳] و زیر فضا[۶۴] انجام می دهد. روش های مختلفی نیز به شکل پیش یا پس پردازش[۶۵] پیشنهاد شده اند تا نویز موزیکال را کاهش دهند. در این بخش روش هایی که برای این امر پیشنهاد شده اند را بررسی می کنیم .
۲-۴-۱- متوسط گیری اندازه[۶۶] :
متوسط گیری اندازه روی طیف ورودی، خطای طیفی را با متوسط گیری روی فریم های مجاور کم می کند. این عمل باعث کاهش واریانس نویز می شود. روش متوسط گیری اندازه فقط برای شکل موج های ایستا در حوزه زمان[۶۷] برقرار است. با توجه به ایستایی زمان–کوتاه گفتار[۶۸] ، تعداد فریم های مجاور که روی آنها عملیات متوسط گیری انجام می شود، محدود است. اگر این محدودیت چشم پوشی شود، آنگاه با مخلوط کردن فریم های مختلف با هم، گفتار حاصل لوث خواهد شد. شکل کلی عملیات متوسط گیری را می توان به شکل زیر بیان کرد:
(۲-۲۲) |
که j اندیس فریم است و M نیز تعداد فریم های همسایه جهت انجام عملیات فوق است که معمولا برابر با ۲ انتخاب می شود.
۲-۴-۲- تعمیم تفریق طیفی[۶۹] :
یک تعمیم از تفریق طیفی توسط Berouti ]12[ به شکل زیر ارائه شده است:
(۲-۲۳) |