دانشکده تحصیلات تکمیلی
پایان نامه برای دریافت درجه کارشناسی ارشد
مهندسی برق – الکترونیک
عنوان:
بررسی و شبیه سازی کد کننده LD-CELP
برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی شود
تکه هایی از متن به عنوان نمونه :
چکیده
هدف از اجرای این پروژه، تحلیل و شبیه سازی انکدر و دیکدر صحبت مبتنی بر استاندارد LD-CELP، که جزء کدکننده های آنالیز همراه با سنتز (AbS) است، می باشد. در این کدکننده با بهره گرفتن از تطبیق پسرو و پیشگویی بهره نیازی به ارسال اطلاعات مربوط به ضرایب فیلترها و همچنین بهره نمی باشد. در ورودی انکدر تنها به بافر نمودن 5 نمونه متوالی صحبت نیاز می باشد. بنابراین تاخیر به وجود آمده 0/625 میلی ثانیه می باشد. به روزرسانی ضرایب فیلتر ترکیب (سنتز) از طریق آنالیز LPC و به روزرسانی بهره از طریق اطلاعات نهفته در تحریک کوانیزه شده قبل انجام می شود. هدف اصلی این پروژه کاهش بار محاسباتی کدکننده LD-CELP و بهبود در SNR خروجی دیکدر می باشد. ایده های ارائه شده در این پروژه شامل، پیشنهاد روش هایی در راستای کاهش پیچیدگی و بار محاسباتی در بلوک پیشگویی بهره، جستجوی کتاب و همچنین ارائه روش هایی، به منظور افزایش SNR خروجی دیکدر می باشد. از این کدکننده در شبکه هایی که به تاخیر زیاد، حساس هستند مانند: شبکه های ماهواره ای، موبایل و… می توان استفاده نمود. در واقع، تاخیر کم و کیفیت بالا در مقابل خطای کانال از ویژگی های بارز این کدکننده می باشد. عمده کارهایی که تاکنون در زمینه کدکننده LD-CELP انجام گرفته، در راستای افزایش کیفیت صحبت خروجی و بهبود SNR خروجی دیکدر بوده است. به عنوان مواردی از کارهای صورت گرفته در مقالات، می توان به طراحی کتاب کد شکل جدید با بهره گرفتن از شبکه های عصبی، پیشگوی بهره با بهره گرفتن از منطق فازی، کوانتیزاسیون بهره به صورت وفقی، کاهش بار محاسباتی ماژول جستجوی کتاب کد با بهره گرفتن از کوانتیزاسیون مستقیم و… اشاره نمود.
کارهای انجام گرفته در این پروژه نیز شامل: 1- استفاده از روش جدیدی برای یافتن ضرایب فیلتر ترکیب (مختص کدکننده های CELP) که منجر به 2/5 دسیبل بهبود در SNR خروجی دیکدر می شود. 2- طراحی پنجره های هیبرید جدید که باعث 3 دسیبل بهبود در SNR خروجی دیکدر می گردد. 3- پیشگویی بهره با بهره گرفتن از سه شبکه عصبی Elman, MLP, Fuzzy ARTMAP انجام گرفته است. مقایسه نتایج حاصل از سه شبکه مذکور شبکه نشان می دهد پیشگویی بهره با بهره گرفتن از شبکه Elman دقیق تر از دو شبکه دیگر می باشد، اما کاهش زمان اجرا با بهره گرفتن از شبکه عصبی Fuzzy ARTMAP از دو شبکه دیگر بیشتر است. به عنوان مثال، زمان اجراء به ازاء 400 فریم صحبت در روش Fuzzy ARTMAP در مقایسه با الگوریتم G.728 حدود 0/25 میلی ثانیه کاهش یافته است. 4- با بهره گرفتن از روشی جدید برای ایجاد کتاب کد اولیه و
همچنین با اعمال تغییراتی در الگوریتم LBG، کتاب های کد شکل جدیدی طراحی گردید که به ترتیب 0/11 و 0/02 دسیبل بهبود در SNR خروجی دیکدر ایجاد نمود. 5- استفاده از ساختار جدیدی متشکل از 48 شبکه عصبی SOM، برای پیاده سازی ماژول جستجوی کتاب کد که حدود 27% بار محاسباتی حاصل از این ماژول را کاهش می دهد.
مقدمه:
امروزه در عصر ارتباطات و استفاده روزافزون از شبکه های تلفنی، موبایل، اینترنت و… با توجه به محدودیت پهنای باند در شبکه های مخابراتی، کدینگ (کد کردن) و فشرده سازی، برای نمایش سیگنال صحبت دیجیتال به استفاده از حداقل بیت ممکن و حفظ کیفیت در سطوح قابل قبول، امری اجتناب ناپذیر و موثر می باشد. نیاز به برقراری ارتباط از طریق صحبت موجب شده است تکنولوژی کد کردن و فشرده سازی صحبت ارتقا یابد و استانداردهای متفاوتی در این زمینه عرضه گردد.
در این پروژه به تحلیل و شبیه سازی کدکننده LD-CELP پرداخته می شود. این کدکننده، صحبت را با کیفیت بسیار خوب در نرخ بیت 16kb/s ارائه می دهد. از این کدکننده می توان در شبکه هایی که به تاخیر زیاد، حساس هستند، مانند شبکه های ماهواره ای، موبایل و… استفاده نمود. همچنین از جمله استانداردهایی است که برای انتقال صحبت در سیستم های کنفرانس تصویری به کار می رود. لازم به ذکر است در شبکه هایی که انتقال اطلاعات به صورت بسته ای انجام می شود استفاده از این کدکننده مرسوم می باشد. تاخیر یک کدکننده
این مطلب را هم بخوانید :
پیشرفت تحصیلی
صحبت، زمان بین ورودی یک نمونه به انکدر و خروجی نمونه متناظر از دیکدر تعریف می گردد. این تاخیر برای یک کدکننده های هیبرید بین 50 میلی ثانیه تا 100 میلی ثانیه است. در دهه های اخیر روش های متفاوتی در زمینه فشرده سازی صوت مطرح شده است که مناسب ترین و پرکاربردترین آنها کدکننده های آنالیز همراه با سنتز می باشد که توسط Atal&Re در سال 1982 معرفی شد. در سال 1985 توسط Schroeder&Atal کدکننده صحبت با نرخ بیت زیر 16kb/s با روش CELP معرفی شد و چندین استاندارد مهم براساس این روش تعریف شد. در سال 1988، CCITT برنامه ای برای استانداردسازی کدکننده با تاخیر کم و کیفیت بالا در مقابل خطای کانال مطرح کرد و در سال 1992 توسط Chen etal تحت عنوان LD-CELP معرفی شد و به صورت استاندارد G.728 درآمد و در سال 1994 نسخه ممیز ثابت آن نیز ارائه گردید.
از سال 1992 تاکنون تحقیقات متعددی بر روی ساختار الگوریتم مذکور صورت گرفته است. اقدامات صورت گرفته، شامل دو بخش مهم می باشد. بخش اول، روش هایی هستند که بهبود در SNR و افزایش کیفیت شنیداری صحبت خروجی دیکدر را در پی دارند. بخش دوم، روش هایی هستند که باعث کاهش بار محاسباتی و پیچیدگی الگوریتم G.728 و در نتیجه کاهش زمان اجرا می گردند. در این پروژه، مجموعه کارهای صورت گرفته برطبق همین دو بخش می باشد. در واقع هدف اصلی، هم کاهش بار محاسباتی و هم افزایش کیفیت صحبت می باشد.
یکی از اقدامات صورت گرفته در این پروژه، استفاده از روش جدیدی برای یافتن ضرایب فیلتر ترکیب (سنتز) است. این روش مختص کدکننده های CELP است که در این پروژه به کدکننده LD-CELP اعمال گردیده است و منجر به 2/5 دسیبل بهبود در SNR خروجی دیکدر شده است. از اقدامات دیگر انجام شده در این پروژه، طراحی پنجره های هیبرید جدید با اقتباس از پیشنهاد موجود در یکی از مقالات است که منجر به 3 دسیبل بهبود در SNR خروجی دیکدر می گردد. لازم به ذکر است، این روش در مقاله مذکور در حد پیشنهادی گذرا مطرح شده است و بررسی های بیشتر و تکمیلی تر در این پروژه انجام گرفته است. اقدام دیگر که در این پروژه انجام شده، پیشگویی بهره با بهره گرفتن از سه شبکه عصبی Elman , MLP و Fuzzy ARTMAP است. همچنین مقایسه سه روش مذکور، به همراه میزان کاهش پیچیدگی منجر شده نیز مورد بررسی قرار گرفته است. نتایج حاکی از آن است که با بهره گرفتن از شبکه عصبی Fuzzy ARTMAP زمان اجرا حدود 0/25 میلی ثانیه برای 400 فریم کاهش می یابد. در اقدامی دیگر، با بهره گرفتن از روشی