ای بر کدینگ سیگنال گفتار و انواع آن
1-1- مشخصه های اصلی سیگنال گفتار:
در مقایسه با سیگنال های قطعی، سیگنال های تصادفی مانند سیگنال گفتار، موسیقی، ویدئو و سایر سیگنال های حاوی اطلاعات، به کمک فرمول های ریاضی قابل توصیف نیستند. این سیگنال ها معمولا توسط توابع آماری مشخص می شوند. چگالی طیفی توان (PSD)، تابع خود
همبستگی (ACF)، تابع توزیع تجمعی (CDF) و تابع چگالی احتمال (PDF)، متداول ترین توابع بکار رفته می باشد. ارسال اطلاعات گفتار یکی از اساسی ترین اهداف ارتباطات مخابراتی است.
اصوات تولید شده توسط لوله صوتی انسان را به دو دسته واکدار و بی واک می توان تقسیم کرد. هنگام تولید اصوات واکدار تارهای صوتی به ارتعاش در می آیند و یک شکل موج شبه تناوبی با انرژی زیاد تولید می شود، در حالی که در مورد اصوات بی واک کم انرژی، تولید صوت با ارتعاش تارهای صوتی همراه نمی باشد و منبع تولید صوت مشابه مولد نویز عمل می کند. سیگنال تحریک که با E(z نشان داده می شود بعدا در هنگام عبور از لوله صوتی، فیلتر می شود که شبیه به یک فیلتر شکل طیف با تابع انتقال H(z)=1/A(z. شکل طیفی با توجه به مشخصه های لوله صوتی، تشعشع از لب ها و غیره تعیین می شود. مدل ساده شده تولید گفتار را در شکل 1-1 می بینید.
شکل موج قطعات واکدار و بی واک گفتار علاوه بر چگالی توان مربوطه در شکل های 1-2 و 1-3 مشاهده می شود. به وضوح قطعات بی واک دامنه کوچکتری دارند که این در چگالی طیفی توان نیز خود را نشان می دهد. همچنین از روی شکل 1-3 مشاهده می شود که اصوات کم انرژی بی واک مانند نویز سفید، منحنی چگالی طیفی توان مسطح تری دارند. طیف سیگنال مسطح تر به معنی غیرقابل پیش بینی تر بودن رفتار آن بوده و برای فشرده سازی قابل اطمینان نمی باشد.
فرم در حال بارگذاری ...