مشخصات پژوهش

صفحه نخست /کاهش نویز و بهسازی گفتار با ...
عنوان کاهش نویز و بهسازی گفتار با استفاده از اطلاعات زبانی و مشخصات گوینده
نوع پژوهش پایان نامه
کلیدواژه‌ها اطلاعات زبانی، بهسازی گفتار، کاهش نویز، مشخصات گوینده
چکیده گفتار ابزار اولیه ارتباط بین انسان هاست. انسان ها به کمک گفتار، مفاهیم متفاوتی را به مخاطبان خود انتقال می دهند. همچنین گفتار ابزاری مناسب برای انتقال دانسته ها، انتقال مفاهیم ذهنی و احساسات درونی نیز به حساب می آید. برتری بارز گفتار بر نوشتار متناظر با آن این است که گفتار اطلاعات جانبی بیشتری را به شنونده انتقال می دهد که بعضا هدف اصلی بیان جملات نیز انتقال همین اطلاعات است. یکی دیگر از ویژگی های بارز گفتار، سهولت انتقال آن به مخاطب است. سیگنال گفتار، سیگنال زمانی یا نگاشتی است از فشار هوایی که با میکروفون احساس می شود. برای اینکه سیگنال ضبط شده کیفیت مناسب داشته باشد طبق قضیه نایکوئیست باید حداقل دو برابر ماکزیمم فرکانس موجود در سیگنال، نمونه-برداری شود. سیگنال گفتار، سیگنال نا ایستان بوده و خواص آماری آن در طول زمان تغییر می کند. به همین دلیل تحلیل سیگنال در بازه های کوتاه انجام می شود. بهسازی گفتار بسته به مساله، هدف آن، ویژگی های نویز و امکانات موجود قابل بررسی است. از این رو روش های متفاوتی جهت بهسازی سیگنال گفتار ارائه شده است، که مواردی نظیر فیلتر وینر، فیلتر وفقی، تفریق طیفی، روش های مبتنی بر تبدیل موجک و روش های آماری را می توان نام برد. هیچ کدام از روش های بهسازی گفتار ارائه شده تا کنون قادر به کاهش یا حذف نویز به صورت موثر و در همه شرایط نویزی نیستند و همه روش ها فقط از خود سیگنال برای حذف نویز استفاده می-کنند و برای بهبود گفتار اطلاعات زبانی و مشخصات گوینده را در نظر نمی گیرند. اطلاعات زبانی و مشخصات گوینده، دو ویژگی مهم از گفتار هستند که گفتار را از نویز متمایز می کنند. در این پایان نامه، روشی پیشنهاد شده است که بدون نیاز به اطلاعات پیشین درباره ماهیت نویز، این دو ویژگی را از سیگنال گفتار استخراج نموده و بر اساس آن ها به بهسازی گفتار می پردازیم. با توجه به گفتار نویزی، رویکرد جدید گفتار تمیز را از طریق شناسایی بخش های طولانی مجموعه کلی تخمین می زند. در بازشناسی از جملات گفتار تمیز پیکره که شناسایی شده به عنوان نمونه استفاده می شود؛ تطابق بین بخش های جمله نویزی و جملات پیکره شناسایی می شود. تخمین نیز با بخش های مطابقت یافته طولانی شکل می گیرد. تطابق بخش های طولانی تر، اطلاعات زبانی و مشخصات گوینده قوی تری نسبت به بخش های گفتار کوتاه تر دارد. بنابراین، ت
پژوهشگران محرم منصوری زاده (استاد راهنما)، فریدون علینقی ها (دانشجو)