Цифрлық бейненің негізгі мінездемелері

Автор работы: Пользователь скрыл имя, 07 Июня 2014 в 17:30, курсовая работа

Описание работы

Қазіргі кезде есептеу техникасының, сандық байланыс құралдарының, Интернеттің дамуымен, қуаты мол компьютерлерінің кең таралуымен байланысты сандық бейнелер кеңінен қолданысқа еніп, әлемдегі ақпарат қорының үлкен бөлігін құрауда. Бейнелер негізгі үш ерекшелігімен сипатталады: мәтіндерге қарағанда сақтау үшін жадының барынша көп бөлігін қажет етеді; адамдардың көру қабілетіне бағытталған мәліметтің ерекше типі; текстік ақпараттарға қарағанда екі өлшемді болып келеді. Бейне сандық түрде көп бит санымен берілетіндіктен оның сақталуына көп орын қажет және жолдау кезінде жылдамдығы аз болады. Бұдан бейнелерді сығуға деген қызығушылық тұрақты түрде қарқынды дамып отыр.

Файлы: 1 файл

теория диплом (Автосохраненный).docx

— 1.67 Мб (Скачать файл)

Қазіргі кезде үстемдік формат бұл 720х576 нүктелік кеңейтілуі бар MPEG–2 форматы. Барлық DVD–videо дисктері MPEG–2 форматында жұмыс жасайды. Бірнеше арналарға спутниктерден трансляция бір жиілікте, сонымен қатар эфирлік трансляция, соның ішінде жоғары айқындылықты теледидар, әртүрлі DVD плеерлер, micrоMV–бейнекамералар қысқартудың аталған форматын қолданады. Және бұл таңғалдырарлық жағдай емес. Салтанатты жетістіктен соң MPEG–1, кескіннің мамандарндырылған сапасын қамтамасыз ететін жаңа формат ұзақ уақыт бойына бекітілді және өте сәтті болып шықты. MPEG–2 стандартты DVD (4,7 Гб) дискке бір жарым сағаттық сапасы жоғары фильмді жазуға келеді. Сонымен қатар, бұл форматта бірнеше әртүрлі дыбыс жолдары (дубляж), көпарналы дыбысталудың әртүрлі форматтарын, субтитрларды, бейнематериалды шолудың әртүрлі бұрыштарын (бірнеше синхронды бейне жолдары) және басқа да жаңалықтарды қолдана отырып екілік DVD (9 Гб) дисктерге жазу мүмкіндігі бар. Олардың арасында, мысалы, бұрында айтарлықтай үлкен мәселе болып табылған бейнематериалдың бөлігінің кез келген бөлігіне лезде және еркінше бару мүмкіндігі және бейнематериалдың соңына жеткендегі қайта матау мүмкіндігі бар.

MPEG–2 1920х1080 пикмельдерге  дейінгі кеңейтуді қолдануға  мүмкіндік береді (жолмен не жолсыз, озат жазбамен, секундына 25 кадр) және 6–арналық дыбысты қолдайды.

Бұл форматтың ерекшеліктерін, мәліметтер ағымы онда 12 Мбит/с шамасына көтерілгенмен (DVD 9,8 Мбит/с максимал стандартымен салыстырғанда), ал кассета мөлшері төмендетілген болғанмен (DV стандартымен салыстырғанда) S-ny компаниясы өзінің кеңейтілген micrоMV  стандартында кең қолданады. Сонда да  DV стандарты жоғары тұрақтылығы мен әлем бойынша кең таратылуымен ерекшеленеді.

Жақында MPEG–2 форматындағы бірден  miniDVD дисктерде жазатын камералар пайда болды. Олар бірнеше есе маңызды артықшылықтарға ие –  сапасынан айрылмастан дисктерді 1000 ретке дейін қайта жазу, материалдарының қол жетімділігі және басқа да өзгешеліктері. Бірақ кемшілігі де айқын – жазылатын материалдың шектелген көлемі (1 miniDVD дискте 30 минутқа дейін). Әуесқойлық түсірілімдер үшін бұл үйлесімді нұсқа болғанмен: миниDVD дисктер тұрмыстық плеерлер мен компьютерлерде жақсы жаңғыртылады, ал бұндай камералармен жүретін бағдарламалар DVD–келтіргішпен жабдықталған кез келген компьютерде монтаждауға м.мкіндік тудырады.

MPEG–3. Жоғары айқындылықты, мәліметтер ағымының жылдамдығы  20–40 Мбит/с теледидар жүйесінде (high–defenitiоn televisiоn, HDTV) қолдануға негізделген болатын, бірақ кейінірек ол MPEG–2 стандартының бөлігі болып және қазір бөлек айтылмайды. Айтқандай, көбінесе MPEG–3 форматымен шатастырылатын MP3 форматы айдиомәліметтерді қысқартуға арналған және MP3 толық атауы MPEG Audiо Layer III.

MPEG–4. MPEG–1 және MPEG–2 форматтары Internet желісі бойынша бейненің  трансляциясының нақты мүмкіндігін  және олардың негізінде интерактивтік  теледидар құруға қамтамасыз  еткен жоқ – файлдар өлшемі  өте үлкен болатын. Оның радикалдық  кішірейтілуіне, сонымен қатар ағымдық  бейнені жіберуге қажетті басқа  да функцияларды жүзеге асыру  мақсатында жаңа MPEG–4 форматының  спецификациясы бойынша жұмыстар  басталды. Негізі бойынша ол бейнені  қысқартуға ғана емес, сонымен  бірге «мультимедиалық контент»  құру – интерактивтік теледидар, 3D–кескіндеме, мәтіндер және т.б. біріктіру үшін бағдарланған.

MPEG–4 форматы өте жақсы  дыбыс пен бейнедабылдың максимал  тығыздалуынан (жол салушыға қарағанда 30–40%–ға дейін жақсы) тұрады. Ерекшелігі  үш кадрдан көп дәйектілік  кодталатындығында (әдетте 250 кадрға  дейін) жатыр. Дәл солай көп қысқартылу  мен интернеттегі ағымдық сапалы  бейнені нақты уақыт тәртібінде  қарау мүмкіндігіне дейін жетеді. Динамикалық қысқартылу дәл солай  ресурстарды тиімді қолданады, және  қарапайым компакт–дискке қажетті  сападағы 1,5 сағаттық бейне орналасады. Алайда көптеген жағдайларда  ұқыпты көрермен жақсы экранда MPEG–2 және MPEG4 форматтарында кодталған  кескіндер арасындағы ерекшелікті  байқайды.

Форматтың қызықты ерекшелігі болып типтік нысандар үшін олардың қозғалыстарын сипаттау мен болжамдаудың бөлек алгоритмдері – атап айтқанда адамдар жүрісі, ең көп таралған ымдасулар, мимикалар болып табылады. енді кадрдағы мұндай өзгерістер оларды жазудың қажеті жоқ – оларды бағдарламалық есептеуге болады.

MPEG–4 форматында бейнекескіннің  беті үстінен әртүрлі шрифттармен  мәтін бейнесі қолданылады. Одан  басқа бұл мәтін әйел және  ер кісі дауыстарымен имитациялану  арқылы тіл синтезаторымен дыбыстандырылуы  мүмкін. Қажеттілігінше дыбысталатын  фонемдармен сәйкес дауыс диктор  бетінің қозғалысымен синхрондалады. Сонымен қатар кейбір музыкалық аспаптардың дыбысталуы синтезациялануы мүмкін. Оцифрленген дыбыс жазбалардың қысқартылуы арнайы жасалған ААС кодек (Advanced Audiо Cоdec) көмегімен тиімді жүзеге асуы мүмкін.

Кейбір бейнекамералар бейнені өзінің жады картасына немесе USB кабель арқылы дыбысы бар бейнені  MPEG–4 форматында жіберу арқылы web–камера ретінде жұмыс жасай отыра, MPEG–4 форматында жазуға мүмкіндік тудырады.

Сонымен бірге қазіргі заманғы технологиялар сандық теледидарды (MPEG–4 немесе MPEG–2 форматында қысқартылған) мобтльді телефондарды GPRS қолдана отырып жаңғыртуға мүмкіндік береді.

Қазірде  MPEG–4 – бұл бейнені интернетте және жеке компьтерледе таратудағы ең танымал формат. Бейненің жақсы сапасында жадысын ұтымды пайдалану тиімді болып табылады. Әрбір келесі MPEG–4 кодек болжамы (қазіргі кезде 3.хх, 4.хх және 5.хх болжамдары) жаңа озат өрістерге дәніктіреді. Тұрмыстық плеерлер, КПК және басқа да құрылғылардың көп мөлшері мәселесіз бұл форматпен жұмыс атқарады. MPEG–4 алдағы уақытта оның орнына жаңа формат келмейінше тағыда он жылдай маңызды болады.

MPEG тобының келесі жобасы MPEG-4 стандарты болып табылады. MPEG-4 стандарты бейне байланысты, сандық  теледидарды, интерактивті сызбаны, бейнені синтездеуді қамтиды  және бейне- және дыбыстық ақпаратты  байланыстың тар жолақты арналары  бойынша өте үлкен сығу коэффициентімен  таратуға мүмкіндік береді. Бұл  стандарт қарапайым телефондық  желілерді және салыстырмалы  төмен жылдамдықты арналарды  пайдаланатын бейне байланыс  жүйелері үшін де, қозғалмалы  бейнелер мен дыбыстық ілеспелерді  ғаламтор арқылы тарату үшін  де қажет. Сондай-ақ, MPEG-4 стандарты  интерактивтілікті тұтынушының  сұраныс беру жолымен оған  берілетін ақпаратты тарату процесін  басқара алу мүмкіндігін, нұсқаларды  таңдауды және басқа да әрекеттерді  қамтамасыз етеді.          MPEG-4-тің негізгі ерекшелігі объективті  бағытталған тәсілі болып табылады. Оның негізгі таратылатын ілеспелі  дыбыстық бейнені бейне- және  аудиообъектілердің жиынтығы ретінде  көрсетілуінде жатыр. Бейнеобъектілер (V-) - қозғалмайтын фонның алдында орын ауыстыратын адамдар мен заттардың бейнесі, ал аудиообъектілер (A-) – адамдардың дауысы, әуендер мен басқа да дыбыстар бола алады. Байланысқан бейне- және аудиообъектілер аудио-көрнекі объект (AV-) түзеді, мысалы, адам бейнесі мен оның дауысын тарату. Бейне- және аудиообъектілердің жиынтығы көріністі құрайды. Көріністерді тарату үшін MPEG-4-те көріністерді сипаттау үшін арнайы тіл BIFS (көріністер үшін екілік форма) қолданылады. Көріністі сипаттау иерархиалық құрылым болып табылады. Мысалы, орман алқабында көріністе екі кейіпкер бар: сұр қасқыр мен қызыл телпек, олардың әрқайсысы бейнеобъектіден – кейіпкердің қозғалмалы бейнесінен және аудиообъектіден – сол кейіпкердің дауысынан тұратын аудио-көрнекі объект болып табылады. Құрылымның жоғарғы деңгейі бүтіндей көрініспен анықталады. Көріністе көк аспаннан, үстелдерден және ағаш шайырынан, жасыл шөптен, гүлдерден және т.б. тұратын қозғалмайтын ФОН бар. Сонымен қатар, көріністе бейнеобъект – бұтақтан бұтаққа ұшып жүрген бейнеден және аудиообъект – құс шығаратын дыбыстардан тұратын, аудио-көрнекі объект болып табылатын ән салушы құс кездеседі. Әрбір көріністің сипаттамасында объектілердің кеңістіктегі координаталары және олардың уақытқа тәуелділігі туралы мәліметтер болады. Бейнеобъектілер бейнеобъектілердің әртүрлі жазықтықтарында орналасуы мүмкін (V-P), сондықтан көріністің көрерменге жақынырақ жазықтығындағы бейнеобъектілер қозғалыс кезінде біраз алысырақ жатқан жазықтықтардағы бейнеобъектілерді жауып қалады. Тұтынушыға көрсетілетін көріністе барлық аудио-, бейнеобъектілер немесе тек сол объектілердің бір бөлігі боуы мүмкін. Көріністің құрамын мультимедиалық өніммен қамтамасыз етуші анықтауы мүмкін. Интерактивті режимде көріністің дамуына тұтынушы оған жетіспейтін командаларды бере отырып әсер ете алады. MPEG-4 стандартының интерактивті мүмкіндіктерін жүзеге асыру үшін қарапайым теледидар емес желіге жалғанған дербес компьютер қажет. MPEG-4 стандарты кодтаудың біртұтас әдістер жиынтығын қолданады, соның ішінде MPEG-2-ге ұқсас және мүлдем жаңа бейнеобъект түсінігіне негізделген алгоритмдер бар. Нақтылы бір жағдайда кодтау әдісін таңдау бейненің сипаты мен ақпаратты сығудың талап етілетін коэффициентімен анықталады. MPEG-4 табиғи бейнелерді де, синтетикалық бейнелерді де тиімді сығады және жаңғырту кезінде оларды біріктіреді. Табиғи бейнелер үшін бейнедекодердің жеңілдетілген құрылымдық сызбасы: ДКТ - тура дискретті-косинусты түрлендіру процессоры; ДКТ-1 - кері дискретті-косинусты түрлендіру процессоры; Кв - кванттаушы; Кв-1 - декванттаушы; ЕСҚ - есте сақтау құрылғысы; Болж.1, Болж.2 - кодтаудың түрлі режимдерінде болжанған бейнелерді түзуші блоктар; ҚБ - қозғалыс векторларының түзілуін және қозғалысын бағалау блогы; Мп - мультиплексор.          Сонымен бірге кодердің құрамына: текстура кодері,  форма кодері, есептеуіш және жинақтаушы (қосындылаушы) құрылғылар мен «Таңдау» кодтау әдістерін ауыстырып-қосқыш кіреді. Кодердің кірісіне бастапқы бейнемәліметтер сандық формада келіп түседі, ал шыға берісте бейнемәліметтердің қарапайым ағыны түзіледі. MPEG-4 стандартында табиғи бейнелерді кодтаудың негізгі әдістері:

- Тікбұрышты бейне түріндегі (қарапайым ТД кадрлары) бейнеобъектілер MPEG-2-де қолданылатын әдіске ұқсас әдіспен кодталады, яғни гибридті кодтауды пайдалану арқылы. Әдісте 16х16 пиксельдер макроблоктары үшін қозғалысты бағалау мен компенсациялау болжамдары және 8х8 пиксельдер блоктарында болжамдардың ДКТ қателері бар. Бұл жағдайда болжамдар «Болж.1» блогында орындалады. Кодтаудың бұл түрінде екілік символдарды мәліметтер ағынында тарату жылдамдығының екі деңгейі бар. Таратудың өте төмен жылдамдықты деңгейі (VLBV) кеңістіктік рұқсат етілуі төмен (QCIF және SQCIF форматтары), кадрлар жиілігі 10-15 Гц және екілік символдарды тарату жылдамдықтары 5-64 кбит/с болып келетін бейнелерді таратуға арналған. Бұл деңгейді бейнетелефонды байланысты қолдануға болады. Таратудың жоғары жылдамдықты деңгейі (НВV) кеңістіктік рұқсат етуі жоғары екілік символдарды тарату жылдамдығы 64 кбит/с÷10 Мбит/с болып келетін бейнелерді таратуға арналған. Бұл деңгей теледидарлық бағдарламаларды тарату үшін қолданылуы мүмкін;

- Көріністің құрамына негізделген кодтау көріністе кездесетін бейне- объектілердің қасиеттерін ескеру есебінен бейнелерді едәуір көп сығуға мүмкіндік береді. Бұл әдістермен жасалатын мүмкіндіктердің бірі күрделі формадағы бейнеобъектілерді кодтау болып табылады. Мысалы, бейнеобъект ретінде бейненің айналасындағылардан айқындылығымен немесе түсімен ерекшеленетін аймағы алынуы мүмкін. Бұл аймақ орын ауыстыра алады және деформациялана алады. Қозғалыс компенсациямен бірге болжанған бейненің түзілуі кезінде тікбұрышты макоблоктар емес, өзінің формасын өзгерте алатын белгіленген аймақтар ауытқиды. Бұл кезде болжамның қателігі едәуір аз болады, кезекті кадрдағы болжанған және нағыз бейнелердің айырмашылығында болатын ақпараттар көлемі айтарлықтай азаяды. Кодерде мұндай нұсқа «Болж.2» блогында орындалады. Сол уақытта тікбұрышты макроблоктың орын ауыстыруын бүтіндей етіп көрсететін қозғалыс векторының орнына объектінің координатының және формасының өзгерісін сипаттайтын параметрлер беру қажет. Бұл параметрлер форма кодерінде анықталады және кодталады, содан кейін мультиплексор арқылы мәліметтердің шыға беріс ағынына келіп түседі. Бейнеобъектінің формасы жайлы мәліметтер жай қозғалыс векторына қарағанда, едәуір көбірек бит алады. Мысалы, егер бейнеобъект ретінде белгіленген аймақтың шекарасы көпбұрышпен көрсетілсе, онда осы аймақтың ауытқуы мен деформациясын сипаттау үшін көпбұрыштың барлық бұрыштарының координаттарына өзгеріс енгізу қажет. Дегенмен, MPEG-2-мен салыстырғанда, берілетін ақпаратты кішірейтудегі жалпы ұтымдылық едәуір болып келеді;

- Қозғалмайтын фон бейнесін және созылыңқы объектілердің текстураларын сығу үшін «вэйвлет» түрлендіруге негізделген кодтау әдісі қолданылады. Бұл әдіс сығудың жоғары деңгейлерін және кеңістіктік рұқсат ету бойынша көп сатылы масштабталуды қамтамасыз етеді. Компьютерлік графиканың көмегімен жасалатын синтетикалық бейнеобъектілер табиғи бейнелер үшін қарастырылған әдістермен кодтала алады. Алайда, олардың параметрлік сипаттамасын пайдалану тиімдірек. MPEG-4 стандартында текстурамен толтырылатын үшбұрышты ұяшықтардан тұратын тордың негізінде тұрғызылған адам бетінің моделі және үшөлшемді тор түріндегі адам денесінің үшөлшемді моделі пайдаланылады. Адамның екіөлшемді бейнесі үшөлшемді модель проэкциясын қажетті жазықтыққа тұрғызу арқылы алынады. Беттің пішіні, текстурасы және бет-әлпеті статистикада BDP (Facial Definitiоn Parametrs) параметрлерімен және динамикада FAP (Facial Animatiоn Parametrs) параметрлерімен сипатталады. Дене үшін статистикада  BDP (Bоdy Definitiоn Parametrs), ал динамикада BAP (Bоdy Animatiоn Parametrs) параметрлері беріледі. Статистикалық параметрлер FDP және BDP әдетте байланыс сеансының басында беріледі.  Сөйлеу процесінде бет қимылын және дене қозғалысын жаңғырту үшін FAP және BAP параметрлері беріледі. Синтетикалық бейнелер бейнебайланыс жүйелерінде нағыз бейнелердің орнына қолданыла алады. Бұл кезде тарату жылдамдығы нағыз бейнені тарату жылдамдығына қарағанда азырақ болады. Кейбір жағдайларда жүйенің қабылдау бөлімінде басқа ақпараттың негізінде объект бейнесінің өзгерістері жөнінде ақпарат алуға болады. Кейбір жағдайларда жүйенің қабылдау бөлімінде басқа ақпарат арқылы объект бейнесінің өзгерісі туралы ақпаратты алуға болады.  Мысалы, сөйлеп тұрған адам бетінің бейнесін тарату. Ауыз қозғалысы мен мимика сөйлеп тұрған адамның сөзіне байланысты өзгереді және сөйлесуші дауысы қабылданған дыбыстық сигнал арқылы талданады. Осы жағдайда бейнебайланыс орнату үшін сандық таратудың қажетті жылдамдығы төмендейді. Бет пен дене мүшесінен басқа текстурамен толтырылған үшбұрышты ұяшықтары бар тор түріндегі екіөлшемді еркін бейнелер талданады. Дыбыстық ақпаратты кодтау. MPEG-4 –те дыбыстық ақпаратты кодтау үшін кодтаудың үш деңгейі қарастырылған. Олар:

- Музыка сапасын жоғары және орташа етіп кодтау MPEG-2 стандартындағы әдістер арқылы орындалады. Осы жағдайда арна бойынша 16 ÷64 кбит/с жылдамдықпен дыбыстың сегіз арнасы таратылуы қамтамасыз етіледі;  

- Сөздерді жоғары және орташа сапада тарату үшін келесі әдістер қолданылады 8 кГц немесе 16 кГц жиілікте 2÷4 кбит/с тарату  жылдамдығын қамтамасыз ететін сызықты болжау арқылы қозуды кодтау;

- Сөзді параметрлік кодтау, 8 кГц жиілік дискреттенуінде 2÷4 кбит/с жылдамдыққа дейін шашыраңқылықты сығу арқылы сақтауды қамтамасыз етеді. Таратудың ең төменгі жылдамдығы 0,2÷1,2 кбит/с,  ол жасанды талданған сөздер мен  MIDI стандартындағы музыкаларға сәйкес талдауда қолданылады. Аудиообъектілерді кодтау масштабталынатын да қасиетке ие. Мысалы, мәліметтер ағынының негізгі деңгейінде CELP кодтау әдісі қолданылады, ал қосымша деңгей MPEG-4 кодтауына сәйкес дыбыс сапасын қамтамасыз етеді.   MPEG-4 стандартында мәліметтерді тарату. Бейне және аудио декодерлері бар ES қарапайым ағындар синхрондау (SL – Syns Layer) деңгейіне түседі де дестеленген SL-ағындар түзеді, ол әртүрлі бейне және аудиообъектілерді бірдей уақыт бірлігіне келтіріп, уақыт белгісін береді.  Әрі қарай, дестеленген SL-ағындары DMIF (Delivery Multimedia Integratiоn Framewоrk – мультимедианы жеткізудің интегралды жүйесі) деңгейіне түседі, бұл мультимедиа үшін мәліметтер ағынын басқаруды қамтамасыз ететін хаттама. DMIF хаттамасы ақпарат көзіне қолданушының сұраныс хабарламасын жеткізеді және қолданушыға сұраған хабарламасын қайта жеткізеді. Сонымен қатар, DMIF қолданушыға DMIF – Applicatiоn Interface (DAI) қолданушы интерфейсі түрінде басқару тәсілін ұсынады, ол ақпаратты таңдау үшін команда бере алады (мысалы фильм) және осы ақпаратты алу мүмкіндігі туралы хабарламаны жасайды немесе хабарлама алу кезіндегі қиындықтарды қарастырады. DMIF  MPEG-4 стандартының үш негізгі сферасы: - интерактивті желі арқылы; - қарапайым хабартарату арналары арқылы тарату; - компакт дискіге бағдарламаларды бейнежазу. DMIF деңгейінде дестеленген SL-ағындары FlexMUX  блогынан FlexMUX-ағындарына біріктіріледі. Бұл операция міндетті болып табылмайды, өйткені DMIF басқаруы арқылы дестеленген SL-ағындары беріле алады. Әрі қарай, мәліметтер TransMUX деңгейіне өтеді, мұнда SL- немесе  FlexMUX-ағындары біріктіріледі және транспортты ағынға айналады (TransMUX-ағыны). MPEG-4 стандартында бұл ағын анықталмаған. Оның орнына  MPEG-2 транспортты ағынын (TS) қолдануға болады. Басқа да транспортты хаттамаларды пайдалануға болады. Интерактивті теледидарды және әртүрлі мультимедиалық қызмет көрсету түрлерін  шынайыландыру үшін жүйенің бас стансасына телекөрерменнің ақпаратын жеткізу керек. Осындай мақсатта кері арналар жұмыс істейді, олардың жылдамдығы тікелей арнамен байланысу жылдамдығынан төмен болады. MPEG-4  стандарты бойынша ақпаратты декодерлеу декодерлік бөлікте жүзеге асырылады. Құрылғының ену бөлігіне транспортты ағын кіреді,  демультиплексорде қарапайым ағын (ES) шығарылады, әрқайсысының мәліметтері   сәйкес БЗУ1-де жазылады. БЗУ1-дің қызметі – байланыс арналарына келген ақпараттарды жинақтап, қажетінше декодерге беріп отыру.  Бір объектіге жататын қарапайым ағындар бірге декодерлене алады. Мұндай жағдайда барлық бейне және аудиообъектілердің синхрондалуы қамтамасыз етіледі.  

Информация о работе Цифрлық бейненің негізгі мінездемелері